!!!Møte 24.3.2017 Kevin, Trond, Lene på Hangout !!Saker # Adverbialer som innleder bisetninger og spørsmål # Ny url # Debugging med overskriftsmarkering # Akronym # Ubestemt artikkel # genitiv-s !! Adverbialer som innleder bisetninger og spørsmål f.eks. manne mo movt goas gos !Første steg i lexc: +Adv+Qst !Andre steg functions.cg3: * Adv Qst @ADVL> (→alisteinen konjunktio = cs) (innleder bisetning) * Adv Qst @ADVL> (innleder hovedsetning) !Tredje steg i functions.cg3: Substitute regler for apertium, også for ext og hab: * Adv Qst @ADVL> => Adv @ADVLcs→ * Adv Qst @ADVL> => Adv @ADVLqst→ * @ADVL> => @ADVLhab→ * @ @<-SUBJext SUBSTITUTE (a) (b) IF (0 (adv)); # "adv" finst ikkje på gt, berre i apertium, derfor køyrer denne berre for apertium !Diskusjon om andre adverbtyper, men ingen konklusjon foreløpig Nok med semtagging for andre adverbialer? * Adv Sem/Time <== * Adv Sem/Plc <=== * Adv Sem/Manner * (Sem/Degree? "totally" etc.) Nyttig liste [http://grammatikk.com/pdf/Setningsadverb.pdf] {{{ vi går A til byen vi går til byen B A = ofte, ikke, B = i dag, igjen, A+B = snart A = setningsadverbial }}} !! Ny url Vi er enige om: https://jorgal.uit.no TILTAK: * __Trond__ gir beskjed til riktig person !! Debugging med overskriftsmarkering Overskriftsmarkering er ikkje inn i «driver»-skriptet, så du må legga på re-/deformatering sjølv: {{{ $ echo '

Gáhkku

lea buorre'|apertium-deshtml -o .[][

]Gáhkku[]❡.[][<\/h1> ]lea buorre.[][ ] $ echo '

Gáhkku

lea buorre'|apertium-deshtml -o|apertium -f none -d . sme-nob-morph ^./.$[][

]^Gáhkku/gáhkku/gáhkku$[]^❡/❡$^./.$[][<\/h1> ]^lea/leat$ ^buorre/buorre$^./.$[][ ] $ echo '

Gáhkku

lea buorre'|apertium-deshtml -o|apertium -f none -d . sme-nob-syntax ^.$[][

]^Gáhkku<@HNOUN>/¬Gáhkku<@HNOUN>$[]^❡$^.$[][<\/h1> ]^leat<@+FMAINV>$ ^buorre<@←SPRED>$^.$[][ ] # ❡ har tom omsetjing i bidix, blir fjerna i biltrans+t1x $ echo '

Gáhkku

lea buorre'|apertium-deshtml -o|apertium -f none -d . sme-nob | apertium-rehtml-noent

Kake

det er bra }}} !! Akronym Vi skal leksikalisere alle akronym som fungerer som substantiv, fellesnamn. (*En) NTB forteller at En ATV ligger i grøfta Slik vil vi ha det i bidix: *

NTBNTB

*

NVENVE

*

ATV ATV

Dagens output fra FST: {{{ sme$ usmedis ATV ATV ATV+N+Sem/Veh+ACR+Sg+Nom <==== ATV "n" ATV ATV+N+Sem/Veh+ACR+Sg+Gen ATV ATV+N+Sem/Veh+ACR+Sg+Acc ATV ATV+N+Prop+ACR+Sem/Org+Dyn+Sg+Nom ATV ATV+N+Prop+ACR+Sem/Org+Dyn+Sg+Gen ATV ATV+N+Prop+ACR+Sem/Org+Dyn+Sg+Acc NTB NTB NTB+N+Prop+ACR+Sem/Org+Dyn+Sg+Nom <===== NTB "np" NTB NTB+N+Prop+ACR+Sem/Org+Dyn+Sg+Gen NTB NTB+N+Prop+ACR+Sem/Org+Dyn+Sg+Acc NTB NTB+N+ACR+Sg+Nom NTB NTB+N+ACR+Sg+Gen NTB NTB+N+ACR+Sg+Acc }}} !Tiltaksliste: __Trond__ * ☐ fjern frå nob.dix * ☐ fjern +ACR frå langs/sme/... * ☐ fjern frå bidix !!Ubestemt artikkel For mykje ubestemt artikkel er verre enn manglande ubestemt artikkel. Chunk-splitting * finnmarksløpet _et_ hundeløp * Til Øst-Finnmark, Lebesbys og til Tana kommuner, er Grenselandet _et_ AS i ferd med å finne på å bygge to vindmølleparker (ingen chunk som matcha heile substfrasen, kanskje eitt av orda var ukjend) !mogleg workaround: * ☐ nytt krav om at det siste ordet me såg før me skriv ut artikkel ikkje var n/np/ukjend, t4x __Kevin__ !unc-taggen (uncountable) idiomatiske ting * han har _en_ hensikt å starte (eller «hensikt» skal kanskje i neste kategori, default aldri) * utellbare, subst-spesifikke ting Eksempler: * de har _et_ håp om å * de forventer _en_ sosial kompetanse * de har _et_ ordforråd * I vindmølleparken, hvor de er kalt «_En_ nord» og «Borealis» !mogleg løysing: * ☐ finn liste med subst som skal ha vs ikkje skal ha ubestemt artikkel frå korpus, legg inn bidix-tagg __Kevin__ t4x sjekkar {{{ }}} bidix har {{{ }}} !!genitiv-s Vi har slike: boplasss huss (hus's) !TILTAK * Dei skal i rett paradigme __Trond__