!!!Ord: !!ordkandidatar: finne norske ord i vår nob-sme som har høgare frekvens i fad-korp enn i nowac * GTHOME/words/dicts/nobsme/src, fad-ord merka med src="fad" * [http://sanit.oahpa.no] * [http://baakoeh.oahpa.no] * ingen smj !! for smj: * sjekke sme->smj i vår (genererte) sme-smj-ordbok * frekvens-sanitycheck * nob-sme frå pkt 1 * sme-smj frå sme2smj-ordboka (generert) * sjekke smj i korpus? * sjekke om ordet er belagt * foreslå det for manuelle annotørar !! for sma * det same men utan generert [https://gtsvn.uit.no/langtech/trunk/words/dicts/smenob/] 13000 fad-par, desse vil dept ha for smj og sma også; men vi har ikkje parallelltekst Tekst: [/ling/common.html] finne fleire ressursar: * bibel (lite terminologi) * Offentleg ** Fylkeskommunar: Hed, S-T, N-T, Nordland ** Kommunar: Tysfjord, Røyrvik, Snåsa, Røros ** Sentraladministrasjonen, fylkesmannen, ... (B) * Aviser ** Snåsningen (sma) ** Nord-Salten avis (smj, kva er status i korpuset?) * Andre, mindre tilgjengelege ** Publisert litteratur? ** Nasjonalbiblioteket? * Telefon til språkkonsulentar * Sverige ** Sametinget: http://www.sametinget.se/smatra ? ** svenskakyrkan.se (sma) ** samer.se ? * sjå etter peikarar frå freecorpus !!!notat og idear * mogleg å laga ein «sub-ord-omsetjar» a la nno-nob s/leg$/lig/ for å laga kandidatlister? * finst for sme→smj * mogleg å normalisera litt? [/dicts/10000.html] har t.d. «register» og «registtar» som to ulike ord på sme-sida * finst andre smj/sma-bidix som me kan samordna med? a la [http://wiki.apertium.org/wiki/Bilingual_dictionary_discovery] * Sjå etter lakuner i omsetjingar ** smenob har duogi→bak, smanob har duekie→bak/rommet bak – er «rommet bak» då kandidat for ekstra til duogi? (no blei det smenob, men går nok oftare andre vegen)