!!! Møte 10.11.12 Til stades: Heli, Ryan, Lene, Trond !! Saksliste * Omorganisering av projektsida * PX i Morfa * Oahpa2 * Multiartikkelen * Dict javascript-plugin * View (teaksta) * Bugs * Neste møte !! Omorganisering av projektsida Lene har prøvd å gjøre [projektsida|http://giellatekno.uit.no/ped/univ-oahpa.html]  mer oversiktlig !! PX i Morfa [Px i MorfaS|http://testing.oahpa.no/davvi/morfas/s/px/] __TILTAK__ * betydningar mangler, oversetting må skrives inn i n_px-fila. Fila flyttes over i src-katalogen (__Lene__) * lokalisering, kjøre skript, oversette (__Trond, Lene__) * Lage Morfa-C oppgaver (__Lene__) !! Oahpa2 Det er søkt om 50.000 fra utdanningsfondet til programmerer for russisk oahpa. !! Multiartikkelen Ryan har fått kontakt med en som har brukt Rosetta Stone for Navajo: dårlig på grammatikk og kostbart [Betalingskurs i ojibwe, med demo|http://www.grassrootsindigenousmultimedia.org/index.php?option=com_content&view=article&id=49&Itemid=57] Sitat fra dokumentasjon om kurset: Grammar Information at Your Fingertips Quickly and easily access grammar information on any word you come across. Expand your knowledge of how a word is used in context. Find out the part of speech, how a word is inflected, or read a grammar tutorial. The declarative memory system learns and remembers vocabulary words, phrases and even short sentences. The procedural memory system learns the skills of applying grammar and producing language. http://mokennon2.albion.edu/ohelp.htm http://ojibwe.lib.umn.edu/ http://ojibwe.lib.umn.edu/main-entry/nisidotaadiwag-vai !! Dict javascript-plugin smenob med gt-fst, nobsme med OBT. Det fungerer, men treng arbeid med stylesheets. http://i.imgur.com/5sRFr.jpg Muligheter: # implementere i kursa # url-basert – man trenger ikke å installere (testa i x, x og x) # plugin for forskjellige nettlesere, må installeres ## [wordlink|http://www2.smo.uhi.ac.uk/wordlink/] - krever at vår dict gjøres om til en url-basert: http://url/til/ordform -> http://testing.oahpa.no/kursadict/detail/sme/nob/orrut.html # hva skal være med i API, hva kan vi bidra? Språkpar: * sme<->nob * sme<->fin * sma<->nob (NB: eigen FST til sma-ordboka) * sme<->eng (må lages først i apertiumformat) * kom<->eng/fin/rus (words/dicts/kom2X/src + analysator: langs/kpv/ * myv<->fin http://testing.oahpa.no/plugin/kursadict.plugin.html# __TILTAK__ * Legge ut kotus sme-eng på dict (__Trond__) * Ta kontakt med amerikanske samer om forbedring av ordboka (__Lene__) * Finne oversetter for sme-eng Oahpa (__Lene__) * Inkludere testing.oahpa.no/kursadict i wordlink (__Trond__ kontaktar Skottland) * URL nederst på detaljert sida tilbake til GT/divvun (__Ryan__) * Bestemme på kva slags output det vert på detaljert sida når det gjeld ordform som er generert av sme-norm (__Trond__) !! View (teaksta) Heli har begynt å utforske koden. Det finnes flere utviklingsgrener * core er best dokumentert * cg3 passer kanskje best for oss {{{ Hernandez lrec2012 UIMA EnhanceXMLAnnotator GenericRelevanceAnnotator OpenNlpTokenizer OpenNlpSentenceDetector }}} Disse filene skal brukes i pipeline: * /opt/smi/sme/bin/abbr.txt * /opt/smi/sme/bin/sme.fst * /opt/smi/sme/bin/sme-dis.rle eller * /opt/smi/sme/bin/sme-dis.bin Lingivister: Hugs å logge endringar i fst i {{priv/admin/README-admin-smi.txt}}. {{{ cat text | preprocess --abbr=abbr.txt | \ lookup -flags mbTT -utf8 /opt/smi/sme/bin/sme.fst | \ lookup2cg | vislcg3 -g sme-dis.rle }}} For testing * http://avvir.no * http://www.lapinkansa.fi/Sagat [Vår dokumentasjonsside om Teaksta|http://giellatekno.uit.no/ped/nudoc/teaksta.html] !! Bugs Vi har ingen åpne bugger for smeOahpa og vi kan lukke de alle (?) smaOahpa-bugger (__Lene__) !! Neste møte __28.12.12 kl 8.30__