!!! sme-nob MT møte 31.5.17 Tilstede: Kevin, Trond, Lene !!Saker: # Kompilering og størrelse av sme-nob.t1x.bin # Sámi dieđalaš áigečála som pdf # caseprep : vi har to systemer # om hvordan vi skal løse riktig valg av pro. # ends-with og starts-with i test i regler t1x-fila # t4x må kunna handtera alle kombinasjonar # fungerer --trace på mac no? Ja. # bidix-sanity for nob # Fleirordsuttrykk, nob i bidix # Kronikk i Nordlys !! Kompilering og størrelse av sme-nob.t1x.bin apertium frå etter 26. mai skal gi mindre binærfiler av transfer. Der me før hadde t1x.bin på 15M, bør me no ha ca. 74K. {{{ apertium-sme-nob$ which apertium-preprocess-transfer /usr/local/bin/apertium-preprocess-transfer apertium-sme-nob$ ls -lah $(which apertium-preprocess-transfer) -rwxr-xr-x 1 root wheel 50K 18 mai 06:26 /usr/local/bin/apertium-preprocess-transfer }}} -rwxr-xr-x 1 root admin 19480 May 26 15:24 /usr/local/bin/apertium-preprocess-transfer ! TILTAK:: * __Kevin__ har spørt Tino om korfor nightly har gammal preprocess-transfer, så oppdaterer me igjen seinare. !!Sámi dieđalaš áigečála som pdf Om det er mulig å tilby oversetting av Sámi dieđalaš áigečála sine artikler som er i pdf-format, se bz 2378. Dvs om det er mulig å legge inn convert2xml i pipelinen når vi på forhånd vet formatet på pdf-en. Jeg regner med at det blir rein tekst, uten tabeller og figurer og formattering ! TILTAK:: * __Kevin__ tar kontakt med Børre om dette. !! caseprep : vi har to systemer t1x: caseprep på substantiv-chunks og på verb-chunks, ingen interaksjon mellom verb/substantiv her t2x interchunk: ein caseprep-variabel frå verbet kan *overstyra* den som er på substantivet (t2x kan sjå på to eller fleire chunks PR SUBST VERB osb.) "caseprep-verb" Viss verbet kjem etterpå treng vi caseprep i t2x, vi kan vise til chunking som vi har tilgang til i t2x. I andre tilfelle løyser vi det i t1x. !! om hvordan vi skal løse riktig valg av pro Eksempel: Alle setningene under her får sin pro i denne regelen i tx3:

šaddatbli

šaddatbli

}}} og så la lex-fila velja rett tagg: {{{ SELECT:fallback ("bli"i) + (impers) (0 ("<šaddat>"i)) ; }}} !! ends-with og starts-with i test i regler t1x-fila {{{ <== ikkje slik Men slik: $ grep -e -with /usr/local/share/apertium/transfer.dtd }}} {{{ Tests if the left part contains the right part at the beginning. Both parts of the test may both be a clip (see below), a literal string ('lit'), a literal tag ('lit-tag') or the value of a variable ('var') defined in the def-vars section. When the attribute 'caseless' is set to 'yes', the comparison is made without attending to the case. --> }}} !! t4x må kunna handtera alle kombinasjonar Denne {{{ }}} finst ikkje for koordinasjonar – kan me få så lange chunks i koordinasjonar no? Viss t1x kan laga pre_pre_pre_pre_nom, så kan t2x laga {{{ * pre_pre_pre_pre_nom_conj_pre_pre_pre_pre_nom * pre_pre_pre_pre_nom_conj_pre_pre_pre_nom * pre_pre_pre_pre_nom_conj_pre_pre_nom * pre_pre_pre_pre_nom_conj_pre_nom * pre_pre_pre_pre_nom_conj_nom * pre_pre_pre_nom_conj_pre_pre_pre_pre_nom * pre_pre_nom_conj_pre_pre_pre_pre_nom * pre_nom_conj_pre_pre_pre_pre_nom * nom_conj_pre_pre_pre_pre_nom }}} Kor lange rekkjer kan t1x lage? Opprinneleg: 3 x pre + nom. No er det meir. ! TILTAK: * __Lene__ ser på det. !! fungerer --trace på mac no? Ja. [https://sourceforge.net/p/apertium/tickets/97/] er lukka Det fungerer: {{{ tf4-hsl-m0024:apertium-sme-nob trond$ e Mun boakkun|apertium -d. sme-nob-interchunk1 apertium-interchunk: Rule 39 Prn{^jeg$} apertium-interchunk: Rule 35 verb{^gå$} apertium-interchunk: Rule 43 sent{^.$} ^Prn{^jeg$}$ ^verb{^gå$}$^lemq{^# hjulbeint$}$^sent{^.$}$ }}} !! bidix-sanity for nob [https://svn.code.sf.net/p/apertium/svn/nursery/apertium-sme-smn/dev/bidix-sanity.sh] {{{ % Bissogealdinoaivi:Soabbegealdinoaivi:^Soabbegealdinoaivi/*Soabbegealdinoaivi$ % Buolláneatnanlássáš:Puállâmeennâmláássáš:^Puállâmeennâmláássáš/*Puállâmeennâmláássáš$ % reaisu:reeisu:^reeisu/reissu/reissu$ (==> vi hadde forventa ) % oasálaš:kuáskulâš:^kuáskulâš/kuáskulâš/kuáskulâš$ }}} {{{ viss L1 har blabla så skal L2 ha det same viss L1 så skal L2 ha hva }}} ! TILTAK: * __Kevin__ lagar sanity basert på sme-smn i sme-nob !!Fleirordsuttrykk, nob i bidix frå -r78846 [http://sprunge.us/HXPM] Strategiar: * sju år gammel hannrein → legg inn som «sjuårsrein» * liten gubbe → legg inn som «gubbe» * ved bålet → legg inn som «ved bålet», heilt grei * daglig leder → dette er innarbeida på norsk, så legg inn på same måte som {{{ pardef "bærbar/_datamaskin__n" }}} {{{

nulpureinutenhorn

boagguthjulbeint

}}} Strategiar: * første del bøyast -- fungerer med og (alt i må vera ubøyeleg, sjekk at transfer alltid bruker lemh/lemq rett, ikkje berre lem) * andre del bøyast -- >mannmedhund< * begge delar bøyast {{{ echo Mus lea nulpu. | apertium -d. sme-nob Jeg har #rein. jj e Mun boakkun|apertium -d. sme-nob #Jeg går## hjulbeint e Mun boakkun|apertium -d. -u sme-nob Jeg går# hjulbeint = jorgal.uit.no echo nulpu lea doppe. | apertium -d. sme-nob #rein er der borte. }}} ! TILTAK: * __Trond__ ser på dem !!Kronikk i Nordlys Andre moglege fora: forsking.no, Norsk Tidend. ! TILTAK: __Lene__ lager mappe i art/2017 og tar kontakt med Nordlys. Og sender epost om resultatet.