!!!MT-Apertium
Lene, Fran, Trond
!!Saker
* Lage motsatt versjoner av språkparene
* Bug 2201
* Harmonisering av kategoriar i t1x-filene
!!Motsatt versjoner
* sma->sme, smj->sme, smn->sme fungerer
{{{
$ echo "Månnoeh aehtjieh gåetide båetiejimen." | apertium -d . sma-sme
Moai áhčit dáluide bođiime.
$ echo "Sámij årromguovllo gåhtjuduvvá Sábmen." | apertium -d . smj-sme
Sámiiguin ássanguovlu #gohčodit Sápmin.
}}}
!!Bug 2201
Vi diskuterte løsninger:
Francis legger inn i dix-filene definisjon av numeral som adjektiv som dekker tallene 1-39
{{{
([0-9]|[0-3][0-9]+)
}}}
Vi ser på muligheta av å disambiguere sentence delimiter i before-section, evt. ta opp med Tino hvis behov.
!!Harmonisering av kategoriar .t1x-filene
Oversyn over arbeid:
# Harmonisere navn på dem som har likt innhold - OK (i -sma, -smj, -smn)
# Legge til språkpar 3 de som er i språkpar 1 og 2 - OK
# De som er i bare ett språkpar, legges i en egen blokk
# Fjern dei som ikkje er i bruk
# Harmonisere: bruk av understrek istedenfor bindestrek i navn
# Endre navnene slik at de dekker innholdet
# Vi vil ha nordsamisk som metaspråk
# Navn for kategorier for funskjoner med pil, H = head og D = dependent: obj_H, H_obj, D_po
__Tiltak__
* Lene ser på namna i gruppene og sender forslag via epost
!Desse er i alle tre filer, med same innhald:
{{{
x 3 váikkuhit_vblex
x 3
x 3
x 3
x 3
x 3
x 3
x 3
x 3
x 3
x 3
x 3
x 3 miehtá_adp
x 3 liikot_v
x 3 jahki_loc
x 3 jahki_gen
x 3 geahččat_vblex
x 3
x 3
x 3 dihte_post
x 3
x 3
x 3
x 3
x 3 buorre_adj
x 3 boaris_adj
x 3
x 3
x 3 váste_post
x 3
x 3
x 3 birra_post
x 3 birra_Adv
x 3 months
x 3
x 3
x 3
x 3 guhkki_Adj
x 3
x 3
x 3
x 3
x 3 geatnegahtton_adj
x 3
x 3
x 3 vuollai_post
x 3
x 3
x 3
x 3
x 3
x 3
x 3
x 3
x 3
x 3 boahtit_vblex
x 3
x 3
x 3
x 3 fápmu_n_ill
x 3 fárrui_post
x 3
x 3
x 3
x 3 beassat_vblex
x 3 geahčen_post
x 3 sisa_post
x 3
x 3 bokte_post
x 3 beallai_post
x 3 hupmat_verbs
}}}
!Desse er i alle tre filene, men med ulikt innhald
{{{
3 | different tags - harmoniser
3 | different lemmas - max
3 | extra tag - max
3 | different tags - max
3 | different tags-
endre navnet for settet i sma til: "numeral_not_year" ,
legg til "numeral" som samme cat i sma som i de andre to
sma:
smn:
smj:
3 | different tags
=> "verb-fin-not-imp" alle tre språk, for smj: "verb-cond"
inkluderes inn i verb-fin-regelen, med egen chunking
3 | wildly different tags
sma = smn mønsteret kopieres til smj, men med nytt navn: negverb
}}}
!Vi arbeider videre med disse over mail
{{{
3 | different tags
3 | different tags
3 | different tags
3 | different tags
3 | different tags
3 | different tags
3 | different tags
3 | different tags
3 | different tags
}}}
!Desse er i berre ei fil:
Leksikaliserte - Lene foreslår andre navn - epost
{{{
1 pron_D_com
1 ahkku_addja
1 áhčči_eadni
1 ahte_cnjsub
1 ala_post
1 almmá_adv
1 atnit_vblex
1 atnu_n_ill
1 beaivi_n
1 buot_prn
1 coggat_vblex
1 dat_prn
1 dattetge_maiddai_adv
1 diehtu_n_acc
1 dihto_adj
1 duohken_post
1 dálá_adj
1 dárbu_n
1 adj-adj_comp
1 eará_seammá_prn
1 eatnat_adv
1 eret_adv
1 giittos_n
1 thirst_hunger_n
1
1 guokte_num
1 haga_post
1 neg_indic
1 neg_imp
1 understanding_n
1 jahki_n
1 juohke_prn
1 lassi_n_ess
1 ladje_post
1 láhki_n
1 uncle_aunt_n
1 maiddái_adv
1 mearkkašit_vblex
1 ind_prn_neg
1 prn_pers_du
1 nu_adv
1 nubbi_prn
1 oaivvildit_vblex
1 oassálastit_vblex
1 oažžut_vbelx
1 oktavuohta_n
1 olu_adv
1 ovdamearka_n
1 ovttasráđiid_adv
1 ovttasbargat_vblex
1 ođđasisorganiseret_vblex
1 vejolaš_adj
1 vuhtii_adv
1 vuostáiváldit_vblex
1 váldit_vblex
1 árvu_n_loc
1 álkidahttit_vblex
1 čájehit_vblex
1 shoe_n
}}}
!Grammatiske
{{{
1
1
1
1
1
1
1
1
1
1 => "l_advl"
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
}}}