Program som gjør det enklere både for den som kan og for den som ikke kan samisk Giellatekno ved UiT Norges arktiske universitet lanserer et program for maskinoversetting fra nordsamisk til norsk. "Vi håper programmet kan være til hjelp for dem som vil forstå nordsamisk tekst, men ikke kan nordsamisk selv. Og vi håper også at programmet dermed gjør det lettere for samisktalende å velge å skrive på samisk," sier Lene Antonsen, forsker og lingvist ved Giellatekno. "Programmet er tilgjengelig via internett og gratis å bruke. Det støtter maskinoversetting av nettsider ved å bruke nettadressen, man kan laste opp dokumenter for oversetting og man kan skrive eller kopiere inn tekst og få det oversatt umiddelbart." Arbeidet med programmet ble først gjort av programmerer Kevin Unhammer (se bildet) i 2010, i samarbeid med Giellatekno. Den første prøveversjon har vært i bruk i noen år, men de siste par månedene har Lene Antonsen og Giellateknos professor Trond Trosterud arbeidet sammen med Kevin for å forbedre programmet og grensesnittet, og de mener at det nå er så pass bra at det virkelig kan være nyttig. Arbeidet med å forbedre kvaliteten fortsetter likevel, ikke minst med ordrekkefølgen på norsk. Systemet kjenner igjen ca. 97 % av ordene i nordsamisk tekst, men vil gi dårligere resultat hvis input inneholder mange skrivefeil, eller er skrevet uten nordsamisk tastatur. Den norskspråklige teksten er av variabel kvalitet, og ikke egnet til publisering uten retting, men den er fullt forståelig, og programmet egner seg dermed godt for den som vil forstå innholdet i den nordsamiske teksten. Programmet regel- og ordlistebasert, i motsetning til de fleste andre oversettingsprogrammer som er statistisk basert. Trond Trosterud drar fram noen eksempler på hva man skal være oppmerksomme på i den norske oversettinga: "Samisk skiller ikke mellom «han» og «hun». For å unngå forvirring på grunn av feil oversetting, bruker vi «h_n» i de tilfellene programmet ikke er i stand til å bestemme rett kjønn. Samisk skiller heller ikke mellom bestemt og ubestemt form, f.eks. 'skole' vs. 'skolen', så programmet gir ikke alltid riktig bestemthet på norsk. Når man oversetter sammensatte ord som ikke finnes i programmets ordbok, oversettes delene hver for seg, og man kan få oversettinger som 'fjellordfører' istedenfor 'varaordfører' ('várri' betyr både vara og fjell). I alle språk er det mange ord som har flere enn en betydning. Programmet klarer ikke alltid å finne korrekt betydning ut i fra sammenhengen. Brukeren kan, når hun er i tvil om betydninga, slå opp slike ord i ei ordbok, f.eks. i Neahttadigisánit." Programmets nettadresse er: https://gtweb.uit.no/jorgal Foto: Bjørn Hatteng Bildetekst: Nå kan flere følge med i debattene i samiske medier. På veggen bak Kevin Unhammer, ser vi en maskinoversatt versjon av en artikkel i den samiske avisa Ávvir. ===== Trond Trosterud, tlf 95070140 trond.trosterud@uit.no Lene Antonsen, tlf 41021011 lene.antonsen@uit.no Nordlys, Ságat, Finnmarken, Finnmark Dagblad, Klassekampen, Samefolket, Altaposten, Dag og Tid