Møte om omsetjing 28.4.2017
Til stades: Børre, Sjur, Tomi, Trond, Lene (på bidix-saka)
!!!Sakser:
* termwiki som input til Apertium-bidix
* status
* neste steg
!!!TermWiki som input til Apertium-bidix
Utgangspunkt: arbeidet som Tomi har gjort i det siste.
Nye bidix-filer:
* kor mykje overlapp med eksisterande bidix?
{{{
oahppostoffaopetusaineisto
oahppostoffaopetusaineisto
oahppostoffaopetusaineisto
}}}
apertium-sme-fin.sme-fin.dix
{{{
oahpahusopetus
oahpponeavvuopetusmateriaali
goappašagatmolemmat
goappašagatmolemmat
goappašatmolemmat
goappašatmolemmat
ánsiktakasvot
ámadadjuansikt
}}}
!!TODO
termwiki lemma + POS:
* sjekke om lemma + pos finst i bidix frå før
* deretter lage kandidatpar for dei som ikkje finst
* evaluere, teste, nytt møte, legge til
... for kvart språkpar: sme-nob, sme-fin, sme-smn, sme-smj, sme-sma
!!!OmegaT
[https://github.com/divvun/OmegaT-hfst-tokenizer]
[https://giellalt.uit.no/mt/omegat/OmegaT.html#HFST+Tokenizer]
Dokumentasjonen på wiki er oppdatert.
Fst-fila i speller/-katalogen skal slutte på *-.hfstol (analyser-gt-norm-se.hfstol).
Alle oppslag i glossary-lista skal ha standardisert lemmaform, ingen variantar. Variantane blir fanga opp av fst-en.
!!TODO
* fjerna variantar av lemma frå glossary
* fjerna kategoriinfo heilt
{{{
apertium/trunk/
cat se-nb.dix |grep ''|cut -d">" -f4|cut -d"<" -f1|sort|uniq|hfst-proc ~/apertium/trunk/apertium-sme-nob/sme-nob.automorf.hfst |grep '\*'|wc -l
}}}
Originalreferat her:
[http://pad.spline.de/dkPs1svMtO]