!!!Møte 7.10 2011. Sjur, Trond !!!Korpus !!På plass: * orig-til-xml for .html og .doc * teiknsettkonvertering * ccat (for parallellføring, m.m.) !!Krev testing: * språkattkjenning !!Ope: * orig-til-xml for .pdf * automatisk test for parallellføringa !!Deadline: * Vi må ha eit korpus klart til parallellisering __i løpet av oktober__. * Det skal vere så stort som mogleg -- dvs. omfatte alle paralleliserbare tekstane vi har.