!!!Meeting setup * Date: 14.03.2011 * Time: 09.30 Norw. time * Place: Internet * Tools: SubEthaEdit, iChat !!!Agenda !!!Opening, agenda review, participants * Opened at 09:45 * Present: __Berit Merete, Biret-Anne, Børre, Ciprian, Lene, Sjur, Thomas, Tomi__ * Absent: __Maja, Trond__ !!!Project review * __kort__ oppsummering frå kvart prosjekt, der ein legg fram: ** status (kva er ferdig, kva ligg etter skjema, kva kjem no) ** særlege punkt som treng meir merksemd -> separat møte (men punkta bør nemnast for alle, slik at vi kan sjå avhengigheiter som elles blir oversedde) Det blir altså ein litt annan struktur enn tidlegare - meir prosjektorientert. Vi prøver det ut, og ser korleis det funkar. Prosjekta er (rapportør i parentes): *Divvun 2.1: ** installerarane (Børre) ** buggar (Tomi) * smekorpus (Børre) * smakorpus (Børre) * VD-ÅD-lansering Mac/Win/iPxd (Ciprian) * Forvaltningsordbok (Berit Merete) * nu-oahpa (Biret Ánne) * dis-abstract til Riga (Lene) * Infrastruktur (Sjur) * sma-oahpa (Lene) Andre prosjekt, ikkje med på møtet: * Divvun-omorganisering (Sjur) * Kunnskapsforlaget -- sme-ordbok (Trond) * MT-170 (Trond) * TTS (Biret Ánne) * smenob (Berit Merete) * smefin (Gt+Kotus) * smanob * Testbenkprosjektet (Sjur) * Barentsprosjektet (Trond) * korpusgrensesnitt !!!Dis-abstract til Riga (Lene) Ferdig, vart sendt inn på fredag. Vi laga få cg-reglar, men dei får likevel til mykje. Berre 106 reglar, men bra lemmatisering, sjølv med nesten 9 % missing. Sma-korpus dårleg: * dårleg språkgjenkjenning * bibelen låg to gonger der (no fjerna) * bibelen dårleg formattert * berre 10 korrekte dokumentpar for parallellkorpuset !!! smekorpus (Børre) Eng. bibel kræsjar konverteringa fordi dei er så store (kræsjar XML::Twig). Fann nokre andre filer som skapar problem, laga testar og fiksa konverteringa for desse. !!! smakorpus (Børre) Språkgjenkjenning: truleg er språkmodellen for sma for dårleg, vart laga lenge før vi byrja arbeidet med sma. __TODO:__ * laga betre LM for sma (__Børre__) !!! Forvaltningsordbok (Berit Merete) * begynte i forrige uke * stor feil i materialet med stor forbokstav for samansette ord som førte til at same ordet gjekk igjen på ulike plassar -> omarbeid * har gått gjennom ca 4000 liner * kunnskapsoverføring til resten av gruppa -> vi må læra av dette nye prosjektet * bør ha møte om omsetjinga av ord som har MWE på samisk * se på mulighet for terskel for automatisk fjerning av irrelevante linjer __TODO:__ * møte for å gå gjennom omsetjingsproblem - avtale tidspunkt etter Komi-møtet - kl 11 (Lene har undervisning fra kl 12.) (__Berit Merete, Ciprian, Lene, Trond__) ** (NB! vi har Komi-møte 9.30 (og Trond er i anna møte 8.45-9.30) !!! nu-oahpa (Biret Ánne) * legger til lærestoff på Fronter og lenking til lesestoff på nettet * grammatikken på nettet er kanskje for liten -> legge til fra Fronter? Vi må bestemme oss for hvor omfattende grammatikkene skal være -> diskusjon om helskapen * Aajege har fått tilgang til Fronter -> sørsamisk versjon etterhvert?? !!!Infrastruktur (Sjur) Kurs i Ungarn, begynt å teste hfst hfst3 snart klar til å bli "released", med støtte for xfst og twolc * hfst3 * testing (HfstTester.py) - [http://www.bbqsrc.net/#hfsttester] !!! sma-oahpa (Lene) Denne veka skal adjektiva på plass. Dette krev at alle sma-oahpa-adjektiva ligg i fst-en og har fungerande paradigme, f.eks. ikke overgenering av Comp/Superl. Trond har generert tabellar over adjektiva og leksikona deira, og dei formene som blir generert. Ta ein titt! "rev" er med endringer i fst, fst-endringene er foreløpig ikke sjekka inn: * [http://giellatekno.uit.no/ped/smadoc/adjtabellrev.html|http://giellatekno.uit.no/ped/smadoc/adjtabellrev.html] * [http://giellatekno.uit.no/ped/smadoc/adjtabell.html|http://giellatekno.uit.no/ped/smadoc/adjtabell.html] Kan de sjå på det, og kommentere, evt. samanlikne med status quo: * [http://giellatekno.uit.no/ped/smadoc/alleadjektivtabell.html|http://giellatekno.uit.no/ped/smadoc/alleadjektivtabell.html] !!!Divvun 2.1: !!installerarane (Børre) Kort møte på fredag, 3 av 4 tilbakemeldingar var positive, den fjerde skal vi sjekka. Lene har testa på Mac med gamal Office (Office 2008). Alt ok. !!buggar (Tomi) Dei fleste buggane fjerna i fredagsversjonen. Ny versjon til i morgon med dei siste halvstore feila retta. !!! VD-ÅD-lansering Mac/Win/iPxd (Ciprian) Sma er generert på nytt, og vil bli generert ein gong til. Meir testing. Cip ønsker forklaringer til grammatikkord => neste versjon Merknader frå Lene: * vi treng fleire testarar * skrivefeil-liste i Bugzilla * 2-3 tvetydige eksempler * endringar i miniparadigma (jf e-post) * måedtie i fst: {{{ måedtie måedtie+Pron+Indef+Pl+Nom <===== bort?? moadda moadda moadda+Num+Sg+Nom moadda moadda+Num+Sg+Acc Pl kan gott tas bort moadda tt (ackusativ = nominativ) många, åtskilliga; flera, några, ett par; moatte bále många gånger; moadda jage åtskilliga år, i åratal; måttijt jagijt under åtskilliga, många år; moattet guovlos från flera hål greitt - jeg fikser det :-) måedtie måedtie+Pron+Indef+Sg+Nom }}} !!!Lanseringskoordingering Lanseringa blir onsdag ca kl. 12. * laga e-postliste (__Sjur__) * skriva Divvun-tekst (__Sjur__) * skriva ordbokstekst (__Lene__) * samla Divvun og ordbokstekstane (__Sjur__) * oppdatera heimesidene & lenkene (__Børre__) * omsetjingar til andre språk (__Biret Á, Thomas, Maja, Tomi, Ciprian__) ** språk: sme, smj, sma, sv, fi, en, ty * oppdater bileta (__Sjur__) ** send passande oppslagsord til Sjur + lenke til biletsida (__Lene__)