!!!MT-beaivvit cuoŋománus !!Praktihkalaččat bistá 5 beaivvi, mii álgit mánnodaga dii. 9 !!!Prográmmaevttohus: Trond, ML ja Lene leat hupman MT-vahku sisdoalu birra. Dát lea evttohus: !!!MÁNNODAGA !!0 Bures boahtin * Doaibmágo? {{echo ja | apertium -d. sme-smX}} * Leago HFST ok? Kevina gohččumat ođasmahttit HFST: ** {{wget http://apertium.projectjj.com/osx/install-nightly.sh}} ** {{sudo bash install-nightly.sh}} * Mii kompileregoahtit sme + smX + sme-smX ** [kompileren ja configure|../infra/Compilation.html] * Vahku prográmma * Jorgalanprográmmaid stáhtus ** [Buohtastahttin|sjangertest.html] !!1 Evalueret sme-teavstta MT-jorgalusa !Jorgalit guokte oanehis teavstta: čáppagirjjálašvuođa teavstta ja čoahkkingirjji: # {{python check_mt-otpt.py -f pseudo_tmx_data/cahceravgga_sme2smn.tmx}} # {{open otpt_dir/cahceravgga_sme2smn.html}} # {{python check_mt-otpt.py -f pseudo_tmx_data/SP-18-2012_sme2smn.tmx}} # {{open otpt_dir/SP-18-2012_sme2smn.html}} * geahččat násttiid ja hash * árvvoštallat gielalaš meattáhusaid * árvvoštallat syntávssa * buohtastahttit dan golbma giellapára jorgalusaid kvaliteahta (WER) ** Evalueren: [http://xixona.dlsi.ua.es/~fran/eval/] !!2 Buoridit jorgalanfeaillaid !Mo gávdnat jorgalanfeailla siva Bargat ieš, oažžut bagadeami !!Bargat násttiid ja hash !Missing (násti) Ovdalgo sáhttá árvvoštallat cealkaga syntávssa dahje váilevaš genererema, de eai galgga leat missing-sánit cealkagis * Lasit missing sániid bidixii, ja sánit fertejit leat leksikaliserejuvvon sihke sme- ja smX-FST:s * [bidix-bargu|../infra/BidixWork.html] ! Geahččat dan maid analysáhtor ii máhte genereret (hash): * {{echo 'cealkka' | apertium -d. sme-smn-dgen}} , omd.\\ {{#Pariisa}} ** buohtastahte analysáhtoriin ({{usmX}} ja {{dsmXNorm}}) {{{ usmn Pariisa Pariisa Pariisa+N+Prop+Sem/Plc+Sg+Nom dsmnNorm Pariisa+N+Prop+Sem/Plc+Sg+Loc Pariisa+N+Prop+Sem/Plc+Sg+Loc Pariisa+N+Prop+Sem/Plc+Sg+Loc +? }}} Ferte lasihit/divvut FST (omd. addit +Sg+Loc leksikonii masa Pariisa manná) __Nubbi ovdamearka__: * {{#lávluđ}} * buohtastahte analysáhtoriin ({{usmX}} ja {{dsmXNorm}}) {{{ usmn lávluđ lávluđ lávluđ+V+Inf dsmnNorm lávluđ+V+Der/NomAg+N+Sg+Nom lávluđ+V+Der/NomAg+N+Sg+Nom lávluđ+V+Der/NomAg+N+Sg+Nom +? }}} Ferte lasihit/divvut FST (addit +Der/NomAg leksikonii masa lávluđ manná) !!Leago sme-input riekta? !Geahččat input: * {{echo 'cealkka' | apertium -d. sme-smn-biltrans}} ** bidix ráddje biltrans-analysa. Jus omd. dihto sátni lea bidixis dušše adjektiivan, dalle dat ii sáhte oažžut Adv-analysa, vaikko dat livččii rivttes analysa cealkagis. ** {{usme}} čájeha sáni vejolaš analysaid olggobealde bidix ** jus sátni oažžu boasttu kásusa, omd. genitiivva dan sajis go akkusatiivva, de feaila lea sme syntávssalaš analysas ** dieđit sme-feailla Lenii, Trondii dahje Duommái !Geahččat sme syntávssalaš analysa apertiumas: * {{echo 'cealkka' | apertium -d. sme-smn-disam}} !Geahččat sme syntávssalaš analysa olggobeal apertiuma: Jus buot sánit eai leat mielde bidixis, de lea buoret geavahit dán gohččuma: * {{echo 'cealkka' | smedis}} !!Manne transfer-njuolggadus ii doaimma? !Geahččat chunkema: * {{echo 'cealkka' | apertium -d. sme-smn-chunker}} !!!DISTTAGA !!3 Giellatekno ja Apertiuma taggaformáhtat * Makkár formáhtat * Man dihte erohusat * dáinna gohččumiin oainnát tággaid: \\ {{echo 'cealkka' | apertium -d. sme-smn-biltrans}} Dahje don sáhtát iskat eaŋkilsániid: * {{echo "lohkan" | hfst-lookup .deps/sme.automorf.hfst}} * {{echo "luuhâm" | hfst-lookup .deps/smn.automorf.hfst}} !!4 Testenbargu: python skriptat Mis leat dákkár teaksta-máhpat: # __texts__ : fiillat dábálaš txt-formáhtas. _sme.txt ja _smX.txt # __tmx_data__ : sihke sme ja smX seammá fiillas, okta cealkka háválassii. tmx-formáhtain lea vejolaš genereret html-fiilla. # __fi.samediggi__ : sihke sme ja smn seammá fiillas, okta cealkka háválassii. tmx-formáhtain lea vejolaš genereret html-fiilla. # __pseudo_tmx_data__ : dušše sme, okta cealkka háválassii. tmx-formáhtain lea vejolaš genereret html-fiilla. # __otpt_dir/__ : output-directory mas leat fiillat mat leat genererejuvvon python-skriptain. * python-skripta ovttagielat teavsttaide: {{check_mt-otpt.py}} * python-skripta guovttegielat teavsttiade, ja mas lea WER: {{wercheck_mt-otpt.py}} !!Jorgalit teavstta mii lea juo jorgaluvvon, ja buohtastahttit jorgalusaid: Jorgalit dihto fiilla, ja rahpat bohtosa: # {{python wercheck_mt-otpt.py -f tmx_data/100writers_sme2smn.tmx}} # {{open otpt_dir/}} - de rahpasa finder-láse. Vállje fiilla maid háliidat rahpat. Jorgalit olles máhpa, ja rahpat bohtosa: # {{python wercheck_mt-otpt.py -d tmx_data/}} # {{open otpt_dir/}} - de rahpasa finder-láse. Vállje fiilla maid háliidat rahpat. !!Jorgalit teavstta mii ii leat jorgaluvvon ovdal: Jorgalit dihto fiilla, ja rahpat bohtosa: # {{python check_mt-otpt.py -f mappe/file}} # {{open otpt_dir/}} - de rahpasa finder-láse. Vállje fiilla maid háliidat rahpat. Jorgalit olles máhpa, ja rahpat bohtosa: # {{python check_mt-otpt.py -d tmx_data/}} # {{open otpt_dir/}} - de rahpasa finder-láse. Vállje fiilla maid háliidat rahpat. !!5 Buoridit jorgalanfeaillaid * Bargat ieš, oažžut bagadeami * Lasit cealkkapáraid testensiidduide, ja karakterisere daid lingvisttalaččat ** [sme-smn|http://wiki.apertium.org/wiki/North_Saami_and_Inari_Saami/Pending_tests] ** [sme-sma|http://wiki.apertium.org/wiki/North_Saami_and_South_Saami/Pending_tests] ** [sme-smj|http://wiki.apertium.org/wiki/North_Saami_and_Lule_Saami/Pending_tests] !!Lexical selection Jus lea eanet go okta vejolaš jorgalus, de sáhttá ráhkadit njuolggadusaid -lrx-fiillas. \\ omd. sämikielâlâš + human vs sämikiel Lasit bidixii * sámegielat = sämikielâlâš * sámegielat = sämikiel Geavat dán gohččuma vai oainnát taggaid * {{echo 'Doppe lea ollu sámegielat olbmot.' | apertium -d. sme-smn-biltrans}} {{{ ^Doppe<@ADVL→>/Tobbeen<@ADVL→>$ ^leat<@+FMAINV>/leđe<@+FMAINV>$ ^ollu<@←ADVL>/ennuv<@←ADVL>$ ^sámegielat<@→N>/sämikiel<@→N>/sämikielâlâš<@→N>$ ^olmmoš<←ext→><@←SUBJ>/olmooš<←ext→><@←SUBJ>$ ^./.$^./.$ }}} Lasit -lrx-fiilii: {{{ (sámegielat<@→N>)