!!!Møte 16. desember 2016 Hangouts: Kevin, Trond, Lene !!Saker: # Strukturen i sme-nob vs. sme-smX # Debugging av regr test # Modes # hfst vs bin (notater) # Feilmeldingar # Regresjonstestar !!Strukturen i sme-nob vs. sme-smX * apertium-sme-nob.sme-nob.val - ikke i bruk * apertium-sme-nob.sme-nob.lex !hfst vs bin Kommando for å analysere sme: {{{ echo ja|hfst-lookup .deps/sme-nob.automorf-trimmed.hfst echo ja|hfst-lookup .deps/sme.automorf.hfst make nob-sme # lagar nob→sme-filene echo "sátni" | hfst-lookup .deps/sme.autogen.hfst }}} Norsk skal vi analysere slik: {{{ echo "hei" | lt-proc -e ../../languages/apertium-nob/nob.automorf.bin (-e må med for å ha analyse av (dynamisk) samansette ord) $ echo "hei" | apertium -d ../../languages/apertium-nob nob-morph ^hei/heie/hei/hei/hei/hei$^./.$ Slik gjer Kevin (denne klarer også dynamisk samansette ord): $ echo "hei" | apertium -d . unob-sme-morph }}} {{{ echo Regjeringen | apertium -d . unob-sme-morph ^Regjeringen/Regjeringen/regjering/regjering$^./.$ "" "ráđđehus" N Sem/Org Sg Nom

ráđđehusregjering

ráđđehusregjering

RegjeringenRegjeringen

}}} nob-morph skil seg frå lt-proc ved å godta reserverte teikn. (og hugsar alltid å ta med -e) !!Debugging av regr test !Pronomen * prn får un * 1. person får mf {{{ echo jeg|apertium -d nob nob-morph ^jeg/jeg/jeg/jeg$^./.$ $ echo "mun lean dáppe"|apertium -d. sme-nob-postchunk ^jeg$ ^være$ ^her$^.$ echo "mun lean dáppe"|apertium -d. sme-nob #jeg er her $ echo '^jeg$'|lt-proc -g sme-nob.autogen.bin jeg echo '^jeg$'|lt-proc -g sme-nob.autogen.bin #jeg apertium-sme-nob$ echo "mun lean dáppe"|apertium -d. sme-nob-dgen #jeg er her echo "Son oaidná mu."|apertium -d. sme-nob-postchunk ^Han$ ^se$ ^jeg$^..$ }}} cd ../../languages/apertium-nob svn up && make Taggstrengane er identisk (gjeld også 3. person), men vi får likevel #. !Eigennamn * propernouns: fjerne sem_sur og cog og top i bidix {{{

bidjatsette

}}} Mathisen sem_sur - Mathisen cog {{{

MathisenMathisen

$ echo Mathisenin | apertium -d . sme-nob-dgen som #Mathisen ^Mathisen<@HNOUN>$^.$ echo Mathisenin | apertium -d. sme-nob som Mathisen echo don leat Mathisenin | apertium -d. sme-nob #du er Mathisen echo "Son oaidná mu."|apertium -d. sme-nob-dgen Montro ser #jeg. tf4-hsl-m0024:apertium-sme-nob trond$ echo "Mun lean dáppe."|apertium -d. sme-nob-dgen #Jeg er her. tf4-hsl-m0024:apertium-sme-nob trond$ echo "Son oaidná mu."|apertium -d. sme-nob-morph ^Son/son/son$ ^oaidná/oaidnit$ ^mu/mun/mun$^../..$ }}} {{{ Lene: echo "Son oaidná mu."|apertium -d. sme-nob Han ser meg. sme-nob Maŋŋá go Máhttolokten doaibmagođii, de lea dát ruhtadoarjja jávkan. - Etter at Kunnskapsløftet begynte å fungere, så har denne pengestønaden forsvunnet. + Etter at Kunnskapsløftet begynteåfungere, så har denne pengestønaden forsvunnet. }}} (ev. endra sem_sur→cog i bidix; sidan me matchar på taggane etter "cog"-taggen òg) {{{ apertium-sme-nob$ echo Várggát | apertium -d. sme-nob Vardø apertium-sme-nob$ echo Mun lean Várggáin | apertium -d. sme-nob #Jeg er i Vardø apertium-sme-nob$ echo Mun lean Várggáin | apertium -d. sme-nob-syntax "" "mun" prn pers p1 sg nom @SUBJ→ MAP:1673:subj>Pers "" "leat" vblex iv indic pres p1 sg @+FMAINV "" "Várggát" np top pl loc @←ADVL-ine MAP:1865:V" "." sent apertium-transfer: Rule 46 Mun<@SUBJ^Prn<@SUBJ→>{^jeg$}$ ^vcop<@+FMAINV>{^være$}$ ^caseprep{^i$}$ ^nom{^Vardø$}$^default{^.$}$ echo Mun lean Lene Antonsen | apertium -d. sme-nob-chunker apertium-transfer: Rule 46 Mun<@SUBJ^Prn<@SUBJ→>{^jeg$}$ ^vcop<@+FMAINV>{^være$}$ ^pre_nom<@←SPRED>{^Lene$ ^Antonsen$}$^default{^.$}$ apertium-sme-nob$ usme Ammerud Ammerud Ammerud+N+Prop+Sem/Sur+Sg+Nom Ammerud Ammerud+N+Prop+Sem/Sur+Sg+Gen Ammerud Ammerud+N+Prop+Sem/Sur+Sg+Acc Ammerud Ammerud+N+Prop+Sem/Plc+Sg+Nom Ammerud Ammerud+N+Prop+Sem/Plc+Sg+Gen Ammerud Ammerud+N+Prop+Sem/Plc+Sg+Acc 22 jahkásaš Tine Chris Mathisen fárrii áibbas okto máddin Sápmái. #22un år gamle Tine Chris Mathisen flyttet helt alene sørfra til Sameland. $ echo 22 jahkásaš Tine Chris Mathisen fárrii áibbas okto máddin Sápmái.|apertium -d . sme-nob-dgen $ echo '^Tine$'|lt-proc -g ../../languages/apertium-nob/nob.autogen.bin Tine ^22$ ^ihásâš$ ^Tine$ ^Chris$ ^Mathisen$ ^varriđ$ ^aaibâs$ ^ohtuu$ ^mäddi$ ^Säämi$^.$^.$ ^22un$ ^år gammel$ ^Tine$ ^Chris$ ^Mathisen$ ^flytte$ ^helt$ ^alene$ ^sørfra$ ^til$ ^Sameland$^..$

TineTine

#22un år gammel #Tine #Chris #Mathisen #han flyttet helt alene sørfra til Sameland. $ echo Tine|apertium -d . nob-sme-morph ^Tine/Tine$^./.$ }}} ! Personlege pronomen {{{ postchunk: ^jeg$ nob fst: ^jeg/jeg/jeg/jeg$^./.$ echo '^jeg$'|lt-proc -g sme-nob.autogen.bin jeg }}} !!Modes Kevin har eit script for å lage alle stega i debugginga, alt her er ikkje sjekka (inn). __TILTAK__ * [[X] Kevin reinskar opp og sjekkar inn * [[X] sjekk at filene er like som vanlege sme-smi-par * [[X] fiks: apertium-createmodes.awk: modes/sme-nob-disam.mode seen twice !!hfst vs bin {{{ echo "Mii manahit oahpaheaddjiid."|apertium -d. sme-nob-disam|cg-conv -a "" "mii" prn ind sg nom "mii" prn itg sg nom "mii" prn rel sg nom "mun" prn pers p1 pl nom "" "manahit" vblex tv indic pres p1 pl "manahit" vblex tv indic pres p3 pl "manahit" vblex tv indic pret p2 sg "manahit" vblex tv inf "mannat" vblex iv der_h vblex tv indic pres p1 pl "mannat" vblex iv der_h vblex tv indic pres p3 pl "mannat" vblex iv der_h vblex tv indic pret p2 sg "mannat" vblex iv der_h vblex tv inf "" "oahpaheaddji" n nomag sem_hum pl acc "oahpaheaddji" n nomag sem_hum pl gen "<..>" ".." sent Trond: $ echo "Mii manahit oahpaheaddjiid."|apertium -d. sme-nob-pretransfer ^Mii$ ^manahit$ ^oahpaheaddji$^..$ echo "Mii manahit oahpaheaddjiid."|apertium -d. sme-nob Hva mister lærere. Lene: echo "Mii manahit oahpaheaddjiid."|apertium -d. sme-nob-pretransfer ^Mun<@SUBJ→>$ ^manahit<@+FMAINV>$ ^oahpaheaddji<@←OBJ>$^..$ Vi mister lærere. Kevin: $ echo "Mii manahit oahpaheaddjiid."|apertium -d. sme-nob-pretransfer ^Mun<@SUBJ→>$ ^manahit<@+FMAINV>$ ^oahpaheaddji<@←OBJ>$^..$ echo "Mii manahit oahpaheaddjiid."|apertium -d. sme-nob-disam|cg-conv -a "" "mun" prn pers p1 pl nom SELECT:4019:miiPersRight "¬mii" prn ind sg nom SELECT:4019:miiPersRight "¬mii" prn itg sg nom SELECT:4019:miiPersRight "¬mii" prn rel sg nom SELECT:4019:miiPersRight "" "manahit" vblex tv indic pres p1 pl SELECT:4695:VPl1IfMiiLeft MAP:7960:+FMAINV @+FMAINV "¬manahit" vblex tv indic pres p3 pl SELECT:4695:VPl1IfMiiLeft "¬manahit" vblex tv indic pret p2 sg SELECT:4695:VPl1IfMiiLeft "¬manahit" vblex tv inf SELECT:4695:VPl1IfMiiLeft "" "oahpaheaddji" n nomag sem_hum pl acc SELECT:9422:AccTV2 "¬oahpaheaddji" n nomag sem_hum pl gen SELECT:9422:AccTV2 "<..>" ".." sent Kevin får: echo "Mii manahit oahpaheaddjiid."|apertium -d. sme-nob-disam|cg-conv -a "" "mun" prn pers p1 pl nom SELECT:4019:miiPersRight "¬mii" prn ind sg nom SELECT:4019:miiPersRight "¬mii" prn itg sg nom SELECT:4019:miiPersRight "¬mii" prn rel sg nom SELECT:4019:miiPersRight "" "manahit" vblex tv indic pres p1 pl SELECT:4695:VPl1IfMiiLeft MAP:7960:+FMAINV @+FMAINV "¬manahit" vblex tv indic pres p3 pl SELECT:4695:VPl1IfMiiLeft "¬manahit" vblex tv indic pret p2 sg SELECT:4695:VPl1IfMiiLeft "¬manahit" vblex tv inf SELECT:4695:VPl1IfMiiLeft "" "oahpaheaddji" n nomag sem_hum pl acc SELECT:9422:AccTV2 "¬oahpaheaddji" n nomag sem_hum pl gen SELECT:9422:AccTV2 "<..>" ".." sent tf4-hsl-m0024:apertium-sme-nob trond$ echo "Mii manahit oahpaheaddjiid."|apertium -d ../../nursery/apertium-sme-smn sme-smn-disam|cg-conv -a "" "mun" prn pers p1 pl nom SELECT:4004:miiPersRight ; "mii" prn ind sg nom SELECT:4004:miiPersRight ; "mii" prn itg sg nom SELECT:4004:miiPersRight ; "mii" prn rel sg nom SELECT:4004:miiPersRight "" "manahit" vblex tv indic pres p1 pl @+FMAINV SELECT:4680:VPl1IfMiiLeft MAP:7945:+FMAINV ; "mannat" ex_vblex ex_iv der_h vblex tv indic pres p1 pl REMOVE:2268:derV ; "mannat" ex_vblex ex_iv der_h vblex tv indic pres p3 pl REMOVE:2268:derV ; "mannat" ex_vblex ex_iv der_h vblex tv indic pret p2 sg REMOVE:2268:derV ; "mannat" ex_vblex ex_iv der_h vblex tv inf REMOVE:2268:derV ; "manahit" vblex tv indic pres p3 pl SELECT:4680:VPl1IfMiiLeft ; "manahit" vblex tv indic pret p2 sg SELECT:4680:VPl1IfMiiLeft ; "manahit" vblex tv inf SELECT:4680:VPl1IfMiiLeft "" "oahpaheaddji" n nomag pl acc SELECT:9407:AccTV2 "oahpaheaddji" n nomag sem_hum pl acc SELECT:9407:AccTV2 ; "oahpaheaddji" n nomag pl gen SELECT:9407:AccTV2 ; "oahpaheaddji" n nomag sem_hum pl gen SELECT:9407:AccTV2 "<.>" "." sent "<.>" "." sent }}} !!Feilmeldingar Kva input er det som gir dette? make Linjene 2131 og 2308 skriv ut utan pos-attributt. - Tino er på saka Feilmeldinga mi kjem ikkje att etter kompilering, no får eg denne: {{{ tf4-hsl-m0024:apertium-sme-nob trond$ touch apertium-sme-nob.sme-nob.t1x tf4-hsl-m0024:apertium-sme-nob trond$ make apertium-validate-transfer apertium-sme-nob.sme-nob.t1x apertium-preprocess-transfer apertium-sme-nob.sme-nob.t1x sme-nob.t1x.bin Warning (3625): Paths to rule 27 blocked by rule 21. }}} men rule 27 seier: {{{ }}} !!Regresjonstestar Bruk {{{ $ t/update-latest $ svn diff t }}} for å køyra regresjonstestane og lagra resultatet i filer som er lagra i SVN – så får du ein diff med sist gong nokon køyrte testen.