Program som gjer det enklare både for dei som kan og dei som ikkje kan samisk Giellatekno ved UiT Noregs arktiske universitet lanserer i dag eit program for maskinomsetjing frå nordsamisk til norsk bokmål. «Vi håpar programmet kan vere til hjelp for dei som vil forstå nordsamisk tekst, men ikkje kan nordsamisk sjølv. Og vi håpar òg at programmet dermed gjer det lettare for samisktalande å velje å skrive på samisk,» seier Lene Antonsen, forskar og lingvist ved Giellatekno. «Programmet er tilgjengeleg via internett og gratis å bruke. Det støttar maskinomsetjing av nettsider (lim inn url), av dokument (last opp dokument) og av tekst (skriv inn tekst og få det omsett umiddelbart).» Arbeidet med programmet vart først gjort av programmerar Kevin Unhammer (sjå biletet) i 2010, i samarbeid med Giellatekno. Den første prøveversjonen har vore i bruk i nokre år, men dei siste par månadene har Trond Trosterud og Lene Antonsen ved Giellatekno arbeidd i lag med Kevin for å forbetre programmet og grensesnittet, og det er no så pass bra at det verkeleg kan vere nyttig. Arbeidet med å forbetre kvaliteten held likevel fram, ikkje minst med ordrekkjefølgja på norsk. Systemet kjenner att ca. 97 % av orda i nordsamisk tekst, men vil gje dårlegare resultat viss input inneheld mange skrivefeil, eller er skrive utan nordsamisk tastatur. Den norskspråklige teksten er av variabel kvalitet, og ikkje eigna til publisering utan retting, men han er fullt forståeleg, og programmet eignar seg dermed godt for dei som vil forstå innhaldet i den nordsamiske teksta. Programmet er regel- og ordbokbasert, i motsetnad til dei fleste andre omsetjingsprogrammer som er statistisk basert. Trond Trosterud, professor ved Giellatekno, dreg fram nokre døme på kva ein skal vere merksam på i den norske omsetjinga: «Samisk skil ikkje mellom «han» og «ho». For å unngå forvirring på grunn av feil omsetjing, brukar vi «h_n» i dei tilfella programmet ikkje er i stand til å avgjere rett kjønn. Samisk skil heller ikkje mellom bestemt og ubestemt form, t.d. 'skule' vs. 'skulen', så programmet gjev ikkje alltid riktig bestemtheit på norsk. Når ein omset samansette ord som ikkje finst i ordboka til programmet, vert delane omsett kvar for seg, og ein kan få omsetjinger som 'fjellordførar' i staden for 'varaordfører' ('várri' tyder både vara og fjell). I alle språk er det mange ord som har fleire enn ei tyding. Programmet klarer ikkje alltid å finne korrekt tyding ut i frå samanhengen. Brukaren kan, når ho er i tvil om betydninga, slå opp slike ord i ei ordbok, t.d. i Neahttadigisánit.» Nettadressa til programmet er: https://gtweb.uit.no/jorgal Foto: Bjørn Hatteng Bilettekst: No kan fleire følgje med i debattane i samiske medium. På veggen attom Kevin Unhammer ser vi ein maskinomsett versjon av ein artikkel i den samiske avisa Ávvir. Nordlys, Ságat, Finnmarka, Finnmark Dagblad, Klassekampen, Samefolket, Altaposten, Dag og Tid