!!!Møte 24.10 2011. Sjur, Trond !!!Saksliste * Orienteringssaker ** sma-oahpa ** sma-ordbok ** Internskolering, sma * Komi * Korpus * Tastatur * sma-terminologi (Elgå) * eXist-kurs * stavekontroll !!! Orienteringssaker Røros. !!sma-oahpa Røros-lanseringa. Kjempebra konferanse, 70 deltakarar, dei fleste presentasjonane på sma, heldt tida, mange gode presentasjonar. Sissel presenterte sma-Oahpa, deretter Lene og Trond om dei andre verktya våre: paradigmegenerator, stavekontroll, ordbok (både på nett og avnettes). !!sma-ordbok Mac-versjonen ferdig, men ikkje Stardict-versjonen - det som står att er formattering av visse delara av miniparadigma (som er StarDict-spesifikk). !!Internskolering, sma Hovudsaker: * kommandolina: cd, pwd, cat, cut, sort, uniq, rev * litt regex * bruk av analysator (usma, dsma) for tekstanalyse * make GTLANG=sma, smanob$ make -f make-dict ==> bin/smadict.fst !!!Komi !!fst Prosedyre for leksikonarbeid # We copy the kt/kom/src/working-files to words/dicts/komfin and komeng, evt. komfineng # We strip the translations (perhaps save one word) from the working-files, and get a lexc-encoded-as-xml. # We add words from kvru/ to the stripped files # We remove contlex-information from the komfineng dict files # We keep the lexc.xml and dict.xml in synch in the same way as we do for our Sami dictionaries. The computer prints a daily/weakly/svnversion-ly report on discrepancies between the two. Ting å vere merksam på: * Den lingvistiske analysen attom * testbenken [Arbeidet blir dokumentert her|http://gtweb.uit.no/cgi-bin/wiki/index.php/Komi_morphological_analyser] !!Jaska * Prioritet no: analysator: morfologi og leksikon. * November: Konen säätiö !!EAMT: MT-prosjekt Uklår situasjon. !!Syktyvkar: Språkteknologisk senter Oppstart november. !!Tastaturprosjektet * Budsjett framleis ope. * ME har levert ein del tastatur. (sjd_ru, sjd_sa, kom_kv, yrk, ural_fyvaproldzhe) * MR: 1 lingvist + 1 samisktalande Framskritt på kildinsamisk wikipedia. Kjøpe Mac-ar til testing? Windows-versjon? !!Barentsprosjektet Neste steg er møte med STR. Trond: 8, 14, 15, 23, 24, 25, 30 er ute. !!!Korpus Mykje er sjekka inn i prestable. Ca 1 mill ord på kvart av NOB og SME. firpmá: digraphar blir ikkje løyste opp. {{{ ccat -r sme/ | grep fi | wc -l }}} Neste: # fiks fi # framleis manuell inspeksjon - fi og struktur i lovtekstar # NB! Sametingsprotokollane # test parallellføringa !!!sma-terminologi (Elgå) Elgå vil ha terminologien sin synleg <=> i nobsma-webdict. + Divvun, andre ordbøker. Jf. Bugzilla. !!!eXist-kurs Xquery vs. xslt Konvertering frå xml til lexc vil ha enklare kode med Xquery. Tyskland, 1. & 2. desember (ev. 30 nov for grunnintro) !!!Stavekontroll # Nederland ## __64-bits__ ## uovervaka installering (allereie fiksa, kjem med neste versjon) ## Orddeling # plx-konvertering ## plx-konverteringstesting ## plx-buggar # hfst ## Voikko: hfst ikkje bra nok enno (for treg, mykje RAM) ## bruk + bugzilla ## Lage installeringspakke -- etter at problemet med fart er ordna i Hfrs !!Grafisk statistikk Dei viktigaste tala frå stavekontrolltestinga opp som grafar. !!!Sametingsnytt (budsjett 2012) # risten 2 er i budsjettet. Der bør vi bruke eXist. # Talesyntese. jf. phon-sma.xfst !!!Sjur - neste reise til Tromsø 7-11 eller 14-18 november.