!!!FAD- og korpusmøte 14.1.2013 Til stades: Berit Merete, Marja, Ciprian, Trond !!! Saker: * Status * Arbeid framover med FAD * nobsme * Neste møte !!! Status Trond har vore i Helsingfors. * Attende til gt: ** Filtrere bort frå gt-output alt som er parallellisert med apertium, slik at det manuelle gt-arbeidet blir berre på nye ord ** Resultat: {{l_gt}} i {{src/fad_nobsme.20121130_nob-c_sme-c.xml}} !! gt Todo-lista frå sist er ikkje gjort. Sjå nedanfor, under __gt__: Denne kommandoen fjernar semantiske taggar (per 7.1.2013) frå output av lookup2cg. {{cat fiilla | perl -pe 's/(Ani|Body|Build|Clth|Edu|Event|Fem|Food|Group|Hum|Mal|Measr|Obj|Org|Plant|Plc|Route|Sur|Time|Txt|Veh|Wpn|Wthr|Allegro|v1|v2|v3|v4) //g' > | uniq > fiilla_semhaga}} Den reelle lista av semantiske taggar står her: {{main/gt/sme/src/sme-lex.txt}} !!! Arbeid framover med FAD Resultat av reversed engineering av ap-output (filer lagra i words/dicts/nobsme/:) {{{ Entries: src>grep 'grep 'grep 'grep 'grep 'grep 'grep 'grep 'grep '' \| cut -d">" -f3 \|unob|grep '?'|cut -f1|rev|sort|uniq|rev|see }}} __Arbeid framover__ # ap: ## __Prosessere pluss-parallellar__ for å minimere lingvistisk reparasjon (__Cip__) ### Løyse opp c=1, c=2 (__Cip__, til onsdag) ### Sjekke mot ''unob'' og ''eit retteprogram'' (som vist ovafor) (__Trond__, til torsdag) ## gå gjennom alle ap-sammensatte ord som IKKE fikk noe tilsvarende gt-lemma, feks betaling+sikkerhet # gt: ## Filtrere bort modalverb frå gt-output (__Cip__) ## Filtrere bort parallellar som allereie er på plass via ap-output fra gt-output. (__Cip__) # Neste steg: ## Manuell gjennomgang av output for reinsa gt-pipeline. (__BM, M__) !!! nobsme ## integrering av simplex ap-parallellisering i nobsme (med FAD-flagg) (12075) (__BM, M__) {{{ }}} !!! Neste møte * Eigen nobsme-leksikografisk diskusjon tysdag 15.1. __12.00__ (Trond, BM, Márjá). * Neste møte: __Måndag 21.1.2013 før lunsj__ * Deretter møte ca. onsdag, også med Børre og Sjur.