!!!"Måndagsmøte" Saksliste: * endringane i transducer-kompileringa * Hunspell + tex-hyph til 1. april * korpus, tmx og FAD * hfst, cg og talesyntese ** diskusjonen med Tino ** hfst-proc - GSoC med Apertium? ** lookup2cg * NB/Mo * Bugzilla * Samisk på smarttelefonar og interaktive lesebrett * Hash i lemma * prioriteringar framover !!!Endringane i transducer-kompileringa Jf. svn-log r54783, r54785. Viktig: M4 er ute, og vi bruker fst-manipulering i staden. Save-fila byggjer på save-hyph. Grenser er synlege i twoltrans. Stavekontrollen (hunspell, plx) bruker også same transducer. Som ein del av desse endringane har {{>7}} vorte endra til [[>] for å unngå at {{>70}} blir analysert som {{>0}}. I tillegg er desse symbola no koda systematisk for både venstre og høgre side (slik at vi har morfologiske skiljeteikn for både prefigerande og suffigerande morfologi). {{{ %<+PUNCT+LEFT:%[%<%] # ; %>+PUNCT+RIGHT:%[%>%] # ; }}} !!! Hunspell + tex-hyph til 1. april M4-arbeidet vart gjort pga. fristen for å få hunspell ferdig til april. Sjur og Børre arbeider med hunspell. plx: Kva med å halvere den plx-fila som blir generert med 1 verb, 1 substantiv, 1 adjektiv, 1 propernoun? !!! korpus, tmx og FAD * TMX (beta) er på nett ** Børre og Berit Merete ser på typos * Ordparallellisering: Ciprian * Autshomato: Børre (og Sjur) __TILTAK__ * Skriv intern dokumentasjon for Autsh/OmegaT-testing (__Børre, Sjur__) * Framgang med typos og ordparallellisering til neste møte * Neste __FAD-møte 12.3. kl. 14.30__ !!! hfst, cg og talesyntese !!diskusjonen med Tino !!lookup2cg Sjur: Er avhengig av ein perl-fri pipeline for talesyntese (ferdig i 2012), og vil ikkje gå inn på eit prosjekt med å flikke på lookup2cg. Trond: Viss vi kan få ein fst-basert postprosessor på beina ''snart'' kan dette vere ein veg å gå. __TILTAK__ * lage pre- og postprosessing som fst, for hfst (=hfst-proc + transducer-manip.) ** xerox vil framleis trenga preprocess.pl ** xerox-varianten vil innehalde ein nedstrippa perl-basert lookup2cg, men elles bruke fst for postprosessering frå LANG.fst. * Deadline: tidleg mai. !!hfst-proc - GSoC med Apertium? Francis vil ha hfst-proc som GSoC-prosjekt. Det er overlapp med prosjektet vårt, men det er viktige skilnader. Input, default (vi går ut i frå at PrfPrc er korrekt lesing): {{{ "" "doapmat" V PrfPrc "doapmat" Der/l "doapmat" V IV "doapmat" V Actio Nom "doapmat" Der/l "doapmat" V IV }}} Forslag til nytt input-format (til CG) ("//" er ikkje endeleg symbol, berre eit eksempel): {{{ "" "doapmat" V IV // Der/l // V PrfPrc "doapmat" V IV // Der/l // V Actio Nom }}} Output (i begge tilfelle): {{{ "" "doapmat" V PrfPrc "doapmat" Der/l "doapmat" V IV }}} __TILTAK__ * diskuter med Lene (__Trond__) !!!NB/Mo Børre skal ha møte med Johanne på fredag. Trond prata med Freddy, dei pratar på nytt når han har lese e-posten frå Trond. !!!Bugzilla Trond og Sjur tar opp dei ulike bugane med respektive ansvarlege. !!!Samisk på smarttelefonar og interaktive lesebrett Få samisk til å fungera på iPhone og andre smarttelefonar. Dette er viktig for FAD. Dette er ei politisk sak (få Apple, og evt. Google, til å inkludere samisk). Men først må dei samiske løysingane bli utarbeidde. !!!Hash i lemma I dag er dei for human eyes only. Vi diskuterer om vi vil ha det eller ikkje, i neste veke. !!!Prioriteringar framover # Hunspell/orddelling (Avvir) 1.4. # Bugzilla (jf. tidsfristene) # Pre- og postprosessering # FAD/korpus: 12.3. og 31.3.