INARINSAAME KIELENÄ TÄNÄÄN

  • n. 450 puhujaa; äidinkieliset ja vieraskieliset puhujat
  • Puhuma-alue: Inarijärven ympäristö
  • Kielenelvytys ja opetus:
    • Kolme kielipesää (kaksi Inarissa, yksi Ivalossa) – ylläpitäjänä Anarâškielâ servi ry
    • Täydennyskoulutus 2009–2010 (CASLE-menetelmä): menetetyn työikäisen sukupolven paikkaaminen, 17 uutta asiantuntijaa kieliyhteisöön
    • Aikuisten 1 v:n kielikoulutus Saamelaisalueen koulutuskeskuksessa 2010 alkaen
    • Peruskoulun opetuskieli syksystä 2000 alkaen
    • Oulun yliopiston Giellagas-instituutin pääaine syksystä 2010 alkaen

Olthuis et al. 2013; www.casle.fi; www.sogsakk.fi; www.oulu.fi/giellagas

Johdanto

Yksi merkittävimpiä vähemmistökieltä säilyttäviä tekijöitä on kielen kirjallistuminen eli se, että suullisen kielenkäytön pohjalta kielelle syntyy kirjallinen muoto ja etenkin se, että kieltä aletaan kirjoittaa enenevässä määrin1. Ennen kuin kielellä on minkäänlaista standardia, sillä on suullisen variaation pohjalle kehittyneitä kirjallisia kielimuotoja2. Kirjallistuminen vaatii kielen lingvististä suunnittelua eli kielensuunnittelua (engl. corpus planning), joka inarinsaamen osalta on kesken. Kielensuunnittelu ei nykypäivänä onnistu ilman kieliteknologiaa3. Tässä artikkelissa tarkastelemme inarinsaamen lingvististä suunnittelua kahdesta näkökulmasta – ensiksikin siitä, millä kielenkäyttöaloilla ja miten inarinsaame näkyy kirjoitettuna kielenä ja toisaalta siitä, miten kieliteknologian avulla pystytään vaikuttamaan kirjoitetun inarinsaamen kehittämiseen.

Einar Haugen4 jakaa kielen lingvistisen suunnittelun kahteen toiminnalliseen osaan: kielen kuvaamiseen (engl. codification) ja kielen kehittämiseen (engl. elaboration). Kielen kuvaamisessa kielelle laaditaan ortografia eli kirjoitustapa, kielioppi ja asianmukaiset sanakirjat, ja toisaalta kieltä standardisoidaan5. Kun kieli käy läpi merkittävän statusmuutoksen, sitä on kehitettävä. Siinä olennaista on sanaston modernisointi, tyylin kehittäminen ja kielen levittäminen uusiin käyttöyhteyksiin ja uusille maantieteellisille alueille6.

Spolskya mukaellen (2009) jaottelemme kielenkäyttöalat kahteen pääryhmään – ensinnäkin tarkastelemme kieltä perinteisissä käyttöyhteyksissä ja toisaalta modernien käyttöalojen näkökulmasta. Tarkastelemme inarinsaamen tilaa ajanjakson kynnyksellä, jolloin kieliteknologia tekee tuloaan kieleen. Tavoitteenamme on saada kieliteknologisia näkymiä tulevaisuutta ajatellen. Keskeisiä tarkastelun kohteita on kolme:

Mikä on inarinsaamen kielen lingvistisen suunnittelun nykytila kieliteknologian käyttöönoton hetkellä?

Miten tulevien vuosien kieliteknologiasovellusten käyttöönotto vaikuttaa inarinsaamen lingvistisen suunnittelun kehitykseen? Etenkin tämän osuuden kehittymistä täytyy tarkkaan seurata.

Millä tavalla nyt kehittyvä inarinsaamen kieliteknologia on priorisoitava eri sovellusten ja kohderyhmien näkökulmasta?

Inarinsaame kirjoitettuna kielenä

Historiasta nykyhetkeen

Inarinsaamea käytettiin kirjoitettuna kielenä ensimmäisen kerran Elias Lönnrotin kirjassa Ueber den Enare-Lappischen Dialekt (1854). Lönnrotin mukaan7 inarinsaamea oli tuolloin kirjoitettu vain parin irrallisen lauseen ja Isä meidän -rukouksen verran, joten hän itse kirjoitti kieltä parhaan taitonsa mukaan. Juuri näitä hänen kirjansa lauseita voikin pitää inarinsaamen kirjallistumisen ensiaskeleina8. Lönnrot kirjoittaa muun muassa seuraavasti9:

Paahas li iho. Pakka tupe. Uuks aavvas! Toapo uuvs! Paahas s’odij.

Nykyortografia (murteellisuudet säilytetty): Paahâs lii iho ‘Kuuma on yöllä.’; Pakkâ tupe. ‘Kuuma tupa.’; Uks áávus! ‘ Ovi auki!’; Toopâ uuvs! ‘Sulje ovi!’; Paahâs šoodâi. ‘ Kuuma tuli.’

Kirjoitettua inarinsaamea on ensin käytetty apukielenä kirkon järjestämän kansanopetuksen parissa10. Tästä perspektiivistä on nähtävä se, että vanhimmat julkaisut ovat nimenomaan kirkollisia julkaisuja. Ensimmäinen inarinsaamenkielinen kirja oli pappi E. W. Borgin Anar Sami kiela aapis kirje ja Doktor Martti Lutherus Ucca katkismus (1859)11. Inarinsaamen kirjoitustaito on siis periaatteessa noin 150 vuotta vanha, mutta kielen kirjallinen käyttö on ollut vähäistä aina 1990-luvun alkuun saakka. Koska inarinsaamen kielitilanne on kohentunut vasta viimeisten 15 vuoden aikana, kirjakielen todellisen synnyn voisi yhtä hyvin ajoittaa vasta tähän ajanjaksoon12.

Toisin sanoen inarinsaamen kielen muu kuin kirkollinen käyttö kirjoitettuna kielenä on paljon myöhempää perua. Nykypäivänä inarinsaamen kirjallistumisessa näkyy kaksi päälinjaa. Ensiksikin kielessä on perinteinen kielenkäytön osa-alue, joka kasvattaa helposti tekstikorpusta mutta jolla uudissanoja ei odoteta syntyvän. Tämä kirjallistumisen linja edustaa perinteistä elämäntapaa ja arkielämää median ja kirjallisuuden avulla. Toisaalta kieleen on tullut 2000-luvulla uusia kielenkäytön alueita. Merkittävimpiä näistä ovat peruskoulu, kielilakiin perustuva kääntäminen ja aikuisopetus. Näille uusille kielenkäytön aloille tunnusomaista on sanaston räjähdysmäinen kasvu. Tämä kehityslinja on siis kielen statusmuutoksen tulosta. Juuri nämä alat tarvitsevat runsaasti kieliteknologisia sovelluksia. Pohdimme katsauksessamme näiden kahden päälinjan kieliteknologisia tarpeita sekä yhdessä että erikseen.

Perinteiset kielenkäytön alat kirjallistumisen näkökulmasta

Kirjoitettu media, oma lehti, on aina voimallinen kielen kirjallisen muodon kehittäjä.13 Siispä odotetusti runsaiten sähköistä tekstikorpusta onkin kartuttanut Anarâš-lehti, jota on julkaistu vuodesta 1987 lähtien, mutta vasta 1990-luvun numerot ovat sähköisessä muodossa. Lehdessä on pääasiassa päätoimittaja Ilmari Mattuksen kirjoituksia, mutta luonnollisesti muidenkin inarinsaamen puhujien ääni kuuluu. Anarâš-lehteä on julkaistu 4–6 numeroa vuodessa. Anarâš-lehti otti vuonna 1992 käyttöön uuden inarinsaamen kirjoitusnormin, joka hyväksyttiin muodollisesti vasta vuonna 199614. Myöhemmin tätä normia alettiin käyttää myös koulukirjoissa ja muissa kirjoituksissa.

Anarâš-lehdessä julkaistaan pitkälti kieliyhteisön jäsenten kertomuksia ja kirjoituksia omista elämänkokemuksista15. Nämä ovat siis aihepiiriltään tuttuja. Petter Morottaja kirjoittaa16 “– inarinsaamelainen media on enimmäkseen tiedottanut asioista, jotka ihmiset jo tietävät. — Anarâš-lehti ei ole yrittänytkään toimia uutislehtenä: se yrittää koota inarinsaamelaiset yhteen. Se edistää inarinsaamelaista kirjoittamisen kulttuuria. Se tarjoaa luettavaa inarinsaameksi.” Toisaalla hän kirjoittaa “Uutisia on lähes turha välittää inarinsaameksi, koska muunkielisillä medioilla on paljon enemmän resursseja. Uutisten toimittaminen inarinsaameksi on järkevää silloin, kun uutiset käsittelevät inarinsaamelaisia ja ovat luonteeltaan sellaisia, etteivät ne ylittäisi esimerkiksi suomalaisen median uutiskynnystä.”17

Toinen tekstikorpuksen kartuttaja on ollut inarinsaamenkielinen kirjallisuus, jota on julkaistu vuodesta 1986 lähtien satunnaisesti – oikeastaan vain silloin, kun julkaistavaa on ollut. Koska inarinsaamelaisen kirjallisuuden tuottaminen on ollut harrastelijapohjaista ja koska puhujayhteisö on pieni18, ei kirjallisuuttakaan ole ilmestynyt kovin paljoa: Norjan bibsys-tietokannan mukaan inarinsaameksi on ilmestynyt 120 julkaisua19. Inarinsaamenkielisen julkaisutoiminnan tuotteliain vuosi on ollut vuosi 2014, jolloin on julkaistu peräti kahdeksan kaunokirjallista teosta ja kaksi oppikirjaa.

Myös kielipesätoiminta on viimeisten kahden vuoden aikana osoittautunut hyväksi tekstikorpuksen kartuttajaksi, vaikka kielipesissä inarinsaamea käytetäänkin pääasiassa puhuttuna kielenä. Koska lasten kielitaidossa on havaittu tiettyjä puutteita kielipesätoiminnan ja koulun nivelvaiheessa, on kielipesiin alettu laatia asianmukaista kielenopetusmateriaalia. Lastentarhanopettaja Riitta Vesala on tuottanut kielenopetusmateriaalia siitä näkökulmasta, että tarinat ovat opettaneet vaikeiksi havaittuja kielioppiasioita lapsille20. Kielioppi on systemaattisesti upotettu tarinoihin – etenkin sanataivutukset, adjektiivien vertailuasteet, duaali, preteriti, konditionaali ja potentiaali. Tarinoiden päähenkilöt seikkailevat saamelaisessa ympäristössä, saamelaisen elämäntavan mukaisesti. Kieliopillisten rakenteiden kertaaminen kirjallisista materiaaleista on hyödyllistä myös kielipesien työntekijöille ja koulun opettajille: inarinsaame on entistä enemmän tilanteessa, jossa ensisijaisilla kielensiirtäjillä on inarinsaame toisena kielenä.

Muita inarinsaamen kirjallisia kielenkäyttöaloja ovat media ja kirkko. YLE Säämi Radio julkaisee lähes päivittäin nettiuutisia inarinsaameksi. Tätä kautta myös mahdolliset uudet käsitteet leviävät kieliyhteisöön, ja tälläkin tavalla kieleen saadaan satunnaisesti uudissanastoa.

Kirkollisen toiminnan käyttökieleksi inarinsaame on palannut vuonna 2010 noin 25 vuoden tauon jälkeen: nyttemmin Inarin seurakunnan saamelaispappi ja kanttori osaavat inarinsaamea. Systemaattisempi raamatunkäännöstyö on käynnistynyt Suomen Pipliaseurassa vuonna 2013. Uusimpien julkaisujen Kirkkokietâkirje ‘Kirkkokäsikirja’ (2002) ja Salmâkirje ‘Virsikirja’ (1993) lisäksi on olemassa muutamien kokonaisten Raamatun kirjojen käännöksiä (Matteuksen ja Johanneksen evankeliumit, 1. Pietarin kirje) sekä jumalanpalvelustarkoituksiin käännettyjä kirkkovuoden tekstejä. Muina julkaisuina voi mainita teokset Katekismus (2011), Párnái Ráámmát ‘Lasten raamattu’ (2010) sekä vanhemmat jo 1900-luvun alussa kirkkoherra Lauri Itkosen kääntämät teokset Ráámmáthistorjá ‘Raamatun historia’ (1906) ja Katkismus ‘Katekismus’ (1902).

Edellä lueteltuja kielenkäyttöaloja voidaan pitää vakiintuneina kielenkäyttöaloina, kun inarinsaamen kirjakielen historiaa tarkastelee pidemmällä ajanjaksolla. Sanasto on vakiintunutta “perussanastoa”, eli nämä alat eivät tuota paljoakaan uudissanoja niin kuin seuraavassa luvussa käsiteltävät uudet kielenkäyttöyhteydet. Koska aihepiirit ja sanasto ovat tuttuja, näillä aloilla syntyy tekstejä ilman suurempia sanasto-ongelmia. Näiltä kielenkäyttöaloilta voi siis helposti jatkossakin kartuttaa sähköistä tekstikorpusta. Korpusta ja sanakirjoja ajatellen saneiden määrä lisääntyy mutta hakusanojen (lemmojen) määrä tuskin kovin paljoa.

Standardisoinnin ja normituksen osalta tuntumamme on, ettei perinteisiä aloja ole lähestulkoonkaan yhtä tiukasti normitettu/ohjattu kuin uusia kielenkäyttöaloja. Syitä on useampia. Näillä aloilla kirjoittajat ovat olleet äidinkielisiä, ja toisaalta tarve on ollut enemmänkin vähemmistökielen esilletuominen. Normituskysymykset ovat olleet selkeästi vähäisempiä, joskin huomiota on kiinnitetty lähinnä ortografian oikeellisuuteen.

Uudet kielenkäyttöalat kielen kirjallistumisen näkökulmasta

Merkittävin kielen kirjallisen muodon tarvitsija on ollut inarinsaamenkielinen kouluopetus: inarinsaamesta tuli opetuskieli syksyllä 2000, mikä on tiennyt vilkastunutta oppimateriaalituotantoa. Tällä hetkellä inarinsaamea käytetään äidinkielen, matematiikan, luonnontieteen, biologian, maantieteen, terveystiedon, yhteiskuntaopin, uskonnon, historian, musiikin, kuvataiteen, käsityön, liikunnan ja suomen kielen opetuskielenä21. Toisin sanoen perussanasto näiltä aloilta on nyt olemassa. Tämä ala onkin ollut merkittävin sanaston kasvattaja viimeisten 15 vuoden aikana, ja se on teettänyt töitä myös kielen normituksen suhteen: uudet sanat on täytynyt vakiinnuttaa osaksi kieltä ja normittaa niiden kirjoitusasu22. Toisaalta sanaston kasvu on aiheuttanut uuden sanakirjan tarpeen. Sanaston modernisaatiota on ohjattu: uudissanat on ensin sepitetty ja hyväksytetty Saamen kielineuvoston inarinsaamen kielineuvontaryhmässä, minkä jälkeen ne on annettu valmiina käyttöön oppikirjojen kääntäjille ja opetuskäyttöön. Esimerkiksi oppikirjasarjoja samanaikaisesti työstettäessä on huolehdittava yhdenmukaistetusta ja standardisoiduista käsitteistöstä23.

Toinen merkittävä tekstikorpuksen ja uudissanaston kartuttaja on ollut Saamen kielilaki24, joka edellyttää virallisten tekstien kääntämistä saamelaisalueen kunnissa. Käännöstyön tuloksena on yleensä saamelaiseen yhteiskuntaan ja virkamiestyöhön liittyviä tekstejä25. Tämä kielenkäytön ala on tuonut kieleen kompleksisia yhdyssanoja, jotka ovat pitkälti käännöslainoja (esimerkiksi maaoikeus > eennâmvuoigâdvuotâ, tuomioistuin > tuámustovli), eli siksi on jouduttu miettimään niiden suhdetta lainanantajakieleensä sekä sitä, miten kieliyhteisö ottaa tällaiset sanat vastaan. Sanaston normituksessa tällä kielenkäyttöalalla ei ole otettu yhtä tiukkaa standardisoinnin linjaa kuin sivistykseen liittyvässä kielenhuollossa, koska sanat tulevat yleensä käyttöön yksittäin, eivätkä ne näyttäisi jäävän samassa määrin kiertoon kuin sivistyksen parissa.

Kolmanneksi inarinsaamea käytetään opetuskielenä Oulun yliopiston Giellagas-instituutissa ja Saamelaisalueen koulutuskeskuksessa. Oulun yliopistossa on voinut opiskella inarinsaamea pääaineena syksystä 2010 lähtien. Saamelaisalueen koulutuskeskus on opettanut kieltä intensiivisellä vuoden opetusohjelmalla niin ikään syksystä 2010. Tämä kielenkäyttöala on tuonut kieleen kielitieteellistä sanastoa. Ensimmäiset kielitieteelliset artikkelit ja opinnäytteet on julkaistu inarinsaameksi26, eikä enää ole harvinaisuus kuulla tieteellisiä esitelmiäkään inarinsaameksi. Näilläkin opetusaloilla oppimateriaalitilanne paranee vähitellen. Näitä aloja ajatellen inarinsaameen on luotu kielitieteellistä ja opetusalan yleissanastoa. Virallisemmassa käytössä joudutaan myös miettimään tyylikysymyksiä: millainen sanasto esimerkiksi kuuluu tieteelliseen asiatyyliin ja minkälainen ei.

Etenkin uusissa kielenkäyttöyhteyksissä on ollut tarpeen standardisoida kieltä. Esimerkiksi tietyistä murteellisuuksista on täytynyt valita oppikirjoihin ja kielenopetukseen tietyt variantit. Esimerkiksi monikon komitatiivin pääse -guin on priorisoitu, joskin muut variantit -gijn, -guim ja -gyeim ovat edelleen hyväksyttäviä. Kieltä ei ole haluttu normittaa tiukoin kriteerein. Sanastoa ajatellen etenkin vanhoja lajinnimiä (eritoten linnunnimet) on jouduttu valikoimaan27. Sen sijaan esimerkiksi infinitiivimuotojen lopussa oleva đ:n sijassa esiintyvä -i / -j (moonnâđ / moonnâi; puáttiđ / puáttij) on normitettu kirjakielessä virheeksi, samoin jälkitavun -â, joka esiintyy -i:n sijasta (kačâttiđ / kačâttâđ). Inarinsaamessa kielineuvontaryhmä tekee normitussuositukset. Käytännössä kuitenkin enemmän inarinsaameksi kirjoittavien kirjoittajien kieli ohjaa kielen kehitystä.

Kieliteknologia lähtee virheiden korjauksesta ja kielenkäytön helpottumisesta. Millaisia sitten ovat kieliteknologian haasteet ja sen ensimmäiset sovellukset uusia ja vanhoja kielenkäyttöaloja ajatellen? Tätä pohdimme seuraavassa pääluvussa.

Inarinsaamen kieliteknologiset haasteet ja sovellukset

Kieliteknologialla tarkoitamme teknologiaa, jonka avulla kieltä voi käyttää eri yhteyksissä. Historian kuluessa merkittävin kieliteknologinen askel on ehkä ollut Gutenbergin kirjapainokoneen kehittäminen. Nykyaikana kieliteknologiaa tarvitaan kielen digitaaliseen käsittelyyn. Kieliteknologisia sovelluksia voivat olla esimerkiksi näppäimistöt, korjausohjelmat, automaattinen yhteenvetofunktio ja synteettinen puhe. Inarinsaamen kieliteknologian perustana toimii kielen taivutusopin mallintaminen eli ohjelma, joka pystyy antamaan jokaiselle sanalle kieliopillisen analyysin ja tuottamaan sanan kaikki taivutusmuodot.

Tekstiprosessoinnin perusta: taivutusopin analysaattori

Inarinsaamen kieliteknologiasovellukset ovat tätä kirjoitettaessa alkutekijöissään. Toisessa luvussa esitimme kaksi kieliteknologian kohderyhmää: perinteiset sekä uudet kielenkäyttöalat. Kieliteknologiaa ajatellen on tiedettävä, millaisia tarpeita näillä aloilla on. Kielen kieliteknologinen perusta on kumminkin suunnilleen sama käyttötarkoituksesta riippumatta.

Taivutusopiltaan monimutkaiset kielet, kuten suomalais-ugrilaiset kielet, tarvitsevat ennen kaikkea analyysi- ja generoimisohjelmaa, joiden perusteella on mahdollista tunnistaa ja tuottaa mikä tahansa muoto. Jos kielessä tämän lisäksi on rikas johto-oppi ja paljon yhdyssanoja, näiden ohjelmien tarve on välttämätön. Inarinsaamessa esiintyy tunnetusti paljon äännevaihteluita. Astevaihtelun lisäksi kielessä on sekä vokaali- että konsonanttipidennyksiä. Taivutusopin monimutkaisuuden takia inarinsaamelle ei ole tähän asti tehty samantasoisia analyysi- ja generoimisohjelmia kuin pohjoissaamelle28.

Toinen tärkeä ohjelma on inarinsaamen rajoitekielioppi (engl. Constraint Grammar29 ), eli ohjelma, jonka perusteella voidaan kontekstin pohjalta valita oikea analyysi. Tietokone ymmärtää silloin, että esimimerkiksi suomenkielisessä lauseessa Minä tulen pian sane “tulen” on verbin preesensmuoto eikä substantiivin genetiivi; “Minä” puolestaan on nominatiivi eikä essiivi (jne).

Edellä mainittuja ohjelmia tarvitaan inarinsaamelle (ja sen kaltaisille kielille) monestakin syystä. Niiden avulla on mahdollista todeta esimerkiksi tietyn vuoden kirjatuotantoanalyysista, montako uudissanaa on otettu käyttöön ja mitkä uudissanat ovat ilmestyneet kieleen kyseisenä vuonna. On mahdollista rakentaa taajuussanakirja, kartoittaa sanastoa ja tarkistaa, löytyvätkö myös tavallisimmat uudissanat inarinsaamen (tai muun kielen) sanakirjoista.

Taivutusopin ohjelmasta voi tehdä erilaisia versioita, joiden avulla on mahdollista säätää kirjakielen vaihtelua. Inarinsaamessa esiintyy jonkin verran murrevariaatiota, jota on normitettu hellällä kädellä. Esimerkiksi monikon komitatiivin päätteestä aktiivisimmassa käytössä ovat variantit -guin (valittu oppikirjoihin) ja -gijn. Muita harvinaisempia variantteja ovat -guim ja -gyeim. Analyysiohjelma voidaan säätää siten, että se hyväksyy tavalliset variantit ja suosittelee harvinaisempien varianttien vaihtamista oppikirjojen muotoon. Normatiivisessa versiossa analyysiohjelmaa voidaan siis käyttää korjausohjelmana. Tästä lisää seuraavassa kappaleessa.

Korjausohjelma ortografian tukena

Eri kirjoittajaryhmät kieliteknologian käyttäjinä

Kirjoittaminen mahdollistuu, kun sille on hyvät ulkoiset puitteet. Inarinsaamen osalta kirjoittamiselle on suotuisa ilmapiiri sekä kielellä on noin 20 vuotta vanha standardisoitu ortografia, joka on suhteellisen vakaa monimutkaisesta morfofonologiasta huolimatta. Lisäksi inarinsaamen puhujilla on henkilökohtainen halu ja kyky kirjoittaa kieltä. Mielestämme myös lukeminen helpottuu, kun standardi on olemassa, ja sanat löytyvät helposti sanakirjasta, kun niiden kirjoitusasu on standardisoitu.

Kuten todettu, inarinsaamen ortografian hyvin hallitsevia aktiivikirjoittajia on vähän; arviolta ainoastaan kymmenkunta kirjoittajaa kirjoittaa inarinsaameksi vähintään viikoittain tai useammin. Silloin tällöin inarinsaamea kirjoittavia henkilöitä on useampia. Kirjoittajien määrän kehitystä on mielenkiintoista seurata nimenomaan siitä näkökulmasta, lisääkö nyt kehitteillä oleva korjausohjelma lähitulevaisuudessa aktiivikirjoittajien määrää, kun se saadaan toimimaan. Tällä hetkellä tähän olisi tarvetta kahdestakin syystä:

Ensiksikin vieraan kielen puhujat kantavat ja siirtävät kieltä. Nämä puhujat työskentelevät aloilla, joilla tuotetaan paljon tekstiä ja uudissanoja. Inarinsaamen kielenelvytysohjelman30 suurin heikkous on nimenomaan aktiivisessa kirjoittamisessa; opetus keskittyy puhuttuun kieleen, jolloin kirjoittaminen jää vähemmälle, koska opetuksen kesto on rajallinen. Ortografisia virheitä jää teksteihin, ja ne on mahdollista kitkeä pois korjausohjelmalla.

Toisaalta vanhemmat äidinkieliset puhujat eivät ole oppineet kirjoittamaan kieltään. He näyttävät tuottavan kieliopillisesti ja syntaktisesti hyvää kieltä, mutta ortografian hallinnassa esiintyy horjuvuutta. Heidän käyttämänsä ortografia on yleensä hyvin persoonallista. Nykyään monet onneksi kirjoittavat rohkeasti kieltä vaikka tietävätkin, etteivät he hallitse ortografiaa täydellisesti. Kielen elvytyksen kannalta tämä on hyvä merkki: olisi pahempi ajatella tyyliin “parempi kirjoittaa suomeksi, kun kerran en hallitse standardia”.

Ihmisiä täytyy rohkaista kirjoittamaan saameksi, ja tätä ajatellen toivomme, että korjausohjelma toimisi lähitulevaisuudessa kirjoittajien tukena edellä mainituissa tapauksissa. Kielellä enemmälti julkaiseminen ja laajempi kirjallinen käyttö taas ovat kiinteästi sidoksissa kielen vahvempaan standardiin ja samalla kielenelvytyksen tehostumiseen. Pohjoissaamen kokemusten perusteella oletetaan, että korjausohjelman avulla pystytään sekä aktivoimaan nykyisiä inarinsaamen kirjoittajia että saamaan uusia. Tällöin julkaisujen määräkin merkittävästi lisääntyisi.

Vieraskielisten kirjoittajien kannalta olisi myös hyvä saada kielioppitarkistin. Tällaisen ohjelman avulla saadaan ainakin jotkin kieliopilliset virheet, kuten kongruenssivirheet, korjatuksi tekstistä. Äidinkielen puhujille olennaisinta lienee editointivirheiden31 korjaaminen sekä virheiden löytäminen todellisista sanoista. Vieraan kielen puhujille taas kielioppivirheiden vähentäminen lienee keskeisin asia kielenkäytössä.

Mikäli kieliyhteisö haluaa yhtenäisen ortografian, korjausohjelma on erittäin tehokas väline sen saavuttamiseksi. Inarinsaamen kannalta ortografisten virheiden seulonta vaatii hyvää taivutusopillista analyysiohjelmaa: tällöin tietokone tunnistaa sanat ja niiden taivutuksen ja osaa ehdottaa korjausvaihtoehtoja. Korjausohjelma syntyy siis vasta sitten, kun taivutusopillinen analyysi on valmis.

Kaksi ortografiaa kielen opiskelussa ja kieliteknologiassa

Kielenopetusta ajatellen on lähdettävä liikkeelle useammalla ortografialla, mikä vaikuttaa kieliteknologisiinkin työtapoihin. Inarinsaamen opiskelijat totutetaan heti opintojen alussa standardiortografian lisäksi niin sanottuun sanakirjaortografiaan, koska konsonanttien ja vokaalien kesto ei aina näy standardiortografiassa. Puhekielessä nuorimmilta puhujilta ja vieraan kielen puhujilta puolipituudet ja venytetyt vokaalit tuntuvat häviävän – osin siksi, että kieli opitaan nykyään paljolti kirjallisista lähteistä vieraana kielenä.

Sanakirjaortografiassa edellä mainittujen ortografisten poikkeamien merkintään käytetään kahta pituusmerkkiä seuraavissa yhteyksissä:

Yksinäiskonsonantin puolipituutta merkitään kahdella tavalla: joko pisteellä kyseessä olevan yksinäiskonsonantin alla (esimerkiksi ṇ; sanakirjan merkintätapa) tai lihavoidulla yksinäiskonsonantilla (n; oppimateriaalit): y.nom. maṇe ’muna’ : y.gen.+akk. mane ja y.nom. sääṇi ’sana’ : y.gen.+akk. sääni.

Ensimmäisen ja toisen tavun venytettyjä vokaaleja merkitään pituusmerkillä ‘: y. nom. puško ’hauki’: y. gen.+akk. puško; y. nom. alge ’poika’: y. gen.+akk. alge. Vieraan kielen opetuksessa on suositeltu näiden kestojen opettamista murteenomaisesti täyspitkinä: /puuškoo/ ja /aalgee/. Useimmilla puhujilla genetiivi- ja akkusatiivimuodon ensimmäisen ja toisen tavun vokaalit ääntyvät kuitenkin puolipitkinä.

Lyhyttä diftongia on merkitty pituusmerkillä ‘ : kuá´lástiđ ’kalastaa’; kuá´timuorâ ‘kotapuu’; Edellä mainituissa tapauksissa pituusmerkki tulee heti diftongin jälkeen, kun diftongin jäljessä on yksinäiskonsonantti. Mikäli lyhyttä diftongia seuraa vahva-asteinen kaksoiskonsonantti tai konsonanttiyhtymä, pituusmerkki tulee ensimmäisen konsonantin jälkeen konsonanttikeskukseen: kyes’si ‘vieras (subst.), viel’tti ‘mäki (loiva)’.

Edellä kuvatun hallitsemiseksi tarvitaan kahta analyysiohjelmaa ja kahta korjausohjelmaa. Toinen analyysiohjelma ja korjausohjelma perustuvat standardiortografiaan ja toinen sanakirjaortografiaan.

Korjausohjelma ortografiavirheiden korjaamiseksi

Yksinkertaisimmat korjausohjelmat koostuvat sanalistasta. Jos tarkistettava sana löytyy listalta, ohjelma pitää sitä oikeana, ja jos ei, ohjelma alleviivaa sanan punaisella värillä. Tämä toimii suhteellisen hyvin, jos kielen sanat ovat helposti listattavia, mutta inarinsaamessa sekä dynaamiset yhdyssanat että rikas taivutus- ja johto-oppi aiheuttavat tällaiselle ohjelmalle ongelmia. Näitä ongelmia voidaan ratkaista esimerkiksi rakentamalla analyysiohjelma, äärellinen automaatti (engl. finite state automaton), joka pystyy tuottamaan kielen kaikki mahdolliset sanamuodot32. Kirjoitusvirhe on sitten sane, joka puuttuu automaatista. Virheille annetaan korjausehdotuksia niin sanotun Levenshtein-algoritmin mukaan33. Algoritimilla on kolme, joskus neljäkin operaatiota: merkin lisääminen, poistaminen, korvaaminen muulla merkillä, joskus myös kahden vierekkäisen merkin vaihtaminen. Jos korjausohjelma löytää tuntemattoman sanan, se suorittaa sanan kaikille kirjaimille yhden Levenshtein-operation. Tuloksia verrataan taas kielimalliin, ja esimerkiksi viittä parasta osumaa tarjotaan käyttäjälle vaihtoehdoiksi väärin kirjoitetulle sanalle.

Kattava korjausohjelma on riippuvainen kattavista tekstikokoelmista. Jotta kieltä voisi korjata, on tiedettävä, mitä ja miten ihmiset kirjoittavat. Tekstikokoelmista lisää seuraavassa kappaleessa.

Elektroniset sanakirjat ja tekstikorpukset

Kieli koostuu sanoista, ja sanakirjan luominen on keskeinen osa kielityötä. Kielen kartoittamista varten on laadittava kaksikielinen sanakirja, jossa kielen sanat käännetään toiselle kielelle. Tällaisia sanakirjoja löytyy inarinsaamestakin: tieteellinen Inarilappisches Wörterbuch (1986–1991) kartoittaa perinteisen sanaston suomalais-ugrilaista tarkekirjoitusta käyttäen, ja uudempi Sammallahti & Morottaja (1993) puolestaan kääntää hakusanat suomeksi nykyortografiaa käyttäen. Molempien sanakirjojen hakusanat on koottu itse ja omista lähteistä34. Kielen revitalisaatiotarkoituksiin sen sijaan tarvitaan sanakirjaa, jossa elvytettävä kieli on kohdekielenä. Inarinsaamesta tällainen sanakirja35 löytyy toistaiseksi vain koeversiona.

Kieliteknologialla on paljon tarjottavaa leksikografialle eli sanakirjojen kirjoittamisen menetelmälle. Moderni leksikografia perustuu tekstikokoelmiin eli korpuksiin. Niiden avulla pystytään kartoittamaan sanasto ja sanojen taajuudet ja samalla saadaan myös autenttisia esimerkkejä kielen käytöstä. Sekä leksikografian että ylipäänsä kielentutkimuksen kannalta korpuksen täytyy olla mahdollisimman suuri. Ruotsin kielipankissa on 8,43 miljardia sanetta, ja pohjoissaamen elektronisesta korpuksesta löytyy 22 miljonaa sanetta36. Tällä hetkellä inarinsaamen sähköinen tekstikorpus sisältää noin 1,3 miljoonaa sanetta. Arviolta saman verran tekstiä on olemassa sähköisessä muodossa mutta ei käytettävissä37. Kielen puhujamäärän kannalta tämä on iso korpus.

Uudet kielenkäyttöalat – koulu, kielilakiin perustuva kääntäminen ja kielenopetus – ovat tekstikorpuksen lisäksi myös merkittäviä sanaston näkökulmasta. Tällä hetkellä inarinsaameen on luotu juuri näille uusille kielenkäytön osa-alueille arviolta 15 000 sanaa. Arvio uusimpien koulu- ja muiden sanalistojen perusteella: biologia, maantiede, yhteiskunta, terveydenhoito, historia, lakisanasto. Koska uusilla kielenkäyttöalueilla on edelleen erikoisaloja, joille kieli voi levittäytyä, uudissanojen määrän odotetaan edelleen kasvavan.

Sanaston aukkoisuuden voi havaita kuka tahansa kielenkäyttäjä erinäisissä arkipäivän kielenkäyttötilanteissa, eikä uudissanoja löydy puuttuvan sanakirjan takia. Mikäli kyse on kokonaan uudesta kielenkäyttöalasta, on melko todennäköistä olettaa, että kyseiselle käsitteelle ei ole ehkä ollutkaan aiempaa käyttötarvetta inarinsaameksi38. Uudissanojen näkyminen sanakirjassa auttaa niiden läpimenoa kieliyhteisössä: uudissanat täytyy keksiä, saada ne käyttöön ja laajemminkin esille. Tämän lisäksi myös käyttäjän täytyy hyväksyä ne ja käyttää niitä itse. Silloin uudet sanat vakiintuvat käyttöön. Tässä vakiinnuttamisprosessissa e-sanakirjalla on käyttöystävällisyytensä vuoksi keskeinen rooli. Inarinsaamen uusin sanakirja39 on ollut koekäytössä jo pitkään. Sen käyttäjät ovat kaivanneet esimerkkejä sanojen käytöstä sekä analyysia sanan merkitysten tavanomaisuuksista ja vastaavasti harvinaisemmasta käytöstä. Tämä on tehtävä yhdistämällä sanakirjaan sähköinen tekstikorpus, josta mahdollisimman monelle sanakirjassa esiintyvälle hakusanalle eli lekseemille löytyy käyttöesimerkkejä.

Korpusanalyysin lisäksi kieliteknologian avulla voi myös etsiä sanakirjasta hakusanoja taivutettujen muotojen kautta. Saamen kielten juoksevassa tekstissä alle 10 prosenttia saneista on perusmuodossa. Kun lisätään sanakirjaan morfologinen analyysiohjelma, sanat löytyvät myös suoraan tekstistä niitä klikkaamalla. Giellateknokeskuksen Neahttadigisánit-sanakirjaohjelma tarjoaa tämän toiminnon sekä pohjoissaame-suomi- että suomi-pohjoissaame-sanakirjasta40. Sanakirjan käyttöä ajatellen analyysiohjelman kattavuuden ei tarvitse olla hyvä. Haavisto et al. (2013) osoittaa, miten suppea kveenin kielen analyysiohjelma (sisältäen vain suljetut sanaluokat, 1000 verbiä ja 2800 substantiivia) pystyi parantamaan sanakirjan perinteisten tekstien kattavuutta 25,7 prosentista 64,4 prosenttiin. Inarinsaamen kieliteknologinen työ tehdään nimenomaan tähän infrastruktuuriin niin, että tuleva inarinsaame–suomi–inarinsaame -sanakirja ilmestynee muun muassa vastaavassa muodossa. Silloin on mahdollista esimerkiksi linnuista tai politiikasta kirjoitettaessa ottaa esille vastaavaa aihetta käsittelevä artikkeli suomeksi, klikata suomenkielinen teksti näkyviin ja löytää sieltä inarinsaamenkielisiä sanoja. Pohjoissaamen sanakirja on yhdistetty suoraan korpukseen, ja näin tullaan myös tekemään inarinsaamen kohdalla. Anarâš-korpus on jo valmiina myös leksikografiseen käyttöön.

Korpuksesta voi hakea lauseita kirjainjonojen perusteella myös lingvistisiä analyyseja varten41. Siitä voi esimerkiksi etsiä lauseita, joissa sanan loppu on -âm ja seuraavan sanan loppu on -guin, eli lopputuloksena voi olla esimerkiksi partisiipin perfekti + komitatiivi “Sun ij lam hárjánâm nieidâiguin siärvustâllâđ ige ubâ…”. Ilman analysaattoria käyttäjän on kirjoitettava hakukenttään jokainen sanan taivutusmuoto erikseen. Ilman morfologista jäsennintä lekseemeistä ei myöskään saa frekvenssejä sanojen käyttö- ja merkityssuhteista. Toisin sanoen sanojen taivutus on avattava ensin ennen kuin mitkään muut sovellukset ovat mahdollisia. Kun morfologinen jäsennys on tehty, tällöin saadaan sivutuotteena myös e-taivutusoppi, jota voi hyödyntää monella tavalla; siitä voi esimerkiksi tarkistaa sanojen taivutuksia tai sen avulla voi laatia kieliopillisia harjoituksia sähköiseen käyttöön.

Selkeäksi mittapuuksi aktiivisesta kirjallisesta tuotannosta ilman kieliteknologisia sovelluksia kannattaa ottaa vuosi 2014, joka on ollut inarinsaamen kirjallisen historian aktiivisin julkaisuvuosi: Anarâškielâ servi on julkaissut seitsemän kaunokirjallista teosta, Saamelaiskäräjät yhden kaunokirjallisen teoksen sekä kaksi oppimateriaalijulkaisua42. Vuosi 2014 on ollut kielenelvytyksen näkökulmasta siinä mielessä merkittävä, että 10 julkaisusta peräti kahdeksan on kirjoitettu inarinsaameksi ja ainoastaan kaksi kirjaa on käännöksiä. Kielen statusta ajatellen on positiivinen asia, että inarinsaamesta saadaan entistä useammin kirjojen kirjoituskieli. Kääntäminen on tietysti edelleen hyvä tapa saada lisää materiaalia. Merkittävää on myös se, että osa kirjoittajista ei ole äidinkielisiä, mutta myös äidinkielisten julkaisut ovat läpikäyneet kielenhuollon. Sekä vieraskieliset että äidinkieliset kirjoittajat hyötyvät sekä ortografisesta korjausohjelmasta että taivutusopin analysaattorista. Näitä on pohjoissaamessa käytetty esimerkiksi Ávvir-sanomalehden kielenhuollossa, jolloin lehden toimitus nopeutuu43. Syntaksin analysaattorin kehittely perustuu toimivaan taivutusopin analysaattoriin, eli syntaktista analysia joutuu siis toistaiseksi odottamaan.

Konekäännös tekstimäärän lisäämiseksi

Inarinsaamenkieliset kielenopetusmateriaalit pyritään mahdollisimman pitkälle laatimaan kielen omia tarpeita varten siten, etteivät ne olisi käännöksiä. Koska uuden oppikirjojan laadintaprosessi on hidas ja kallis, on edelleen nopeinta ja edullisinta kääntää oppikirjat muista kielistä. Suomessa Saamelaiskäräjillä työskentelee yksi vakituinen inarinsaamen kääntäjä, jonka työajasta pieni osa liikenee oppikirjakäännöksiin. Periaatteessa kumminkin oppikirjakääntäjät työskentelevät free lancer -periaatteella. Lisäksi Saamelaiskäräjillä on vuonna 2015 oppimateriaalityöntekijä. Vuosittain inarinsaamen parissa työskentelee 1–4 kääntäjää / oppikirjantekijää eri projekteissa. Inarinsaameksi on olemassa noin 50 koulukirjaa, pohjoissaameksi Suomessa taas ehkä noin 400–500 koulukirjaa. Peruskoulun oppiaineiden määrän perusteella pohjoissaamenkielisten oppimateriaalien kattavuus on melko hyvä, kun taas inarinsaamenkielisten materiaalien kattavuus on melko huono. Koska kääntäjäresursseja on vähän, käännösprosessin nopeuttaminen olisi mahdollista kieliteknologiaa hyödyntämällä.

Tromssan yliopistossa on tätä kirjoittaessa alkamassa kolmivuotinen konekäännösprojekti, jonka tavoitteena on rakentaa inarinsaamea varten käännösohjelma. Tämän avulla voidaan kääntää tekstejä pohjoissaamesta inarinsaameksi siten, että lähtökielestä saadaan kohdekieleen raakakäännös. Raakakäännöksen korjaaminen painokelpoiseksi tekstiksi on nopeampaa kuin manuaalinen kääntäminen lähtökielisestä tekstistä – tässä tapauksessa suomesta tai pohjoissaamesta. Vastaavien projektien perusteella on havaittu, että ajansäästö on suunnilleen 80 prosenttia normaalista käännöstyöhön käytetystä ajasta. Ajansäästö puolestaan vapauttaa niukkoja kääntäjäresursseja muihin tehtäviin44.

Inarinsaamen kieliteknologian tulevaisuudennäkymiä ja suunnitelmia

Koska kieliteknologiaa ei aiemmin ole systemaattisesti hyödynnetty inarinsaamen elvytyksessä, tätä varten ei ole ollut suunnitelmiakaan. Nyt on myös suunnitelmien aika.

On olennaista saada myös Suomen puolella käyntiin rinnakkaisia pienempiä kieliteknologisia projekteja, jotka edesauttavat sekä morfologisen jäsentimen valmistumista että kieliteknologiasovellusten juurruttamista Suomeen. Mahdollisia ovat muun muassa Saamelaiskäräjien sanakirjaprojektin loppuunsaattaminen sekä kieliteknologian mukaan tuominen saamelaiseen oppimateriaalityöhön. Myös kielen normitusta tarvitaan kieliteknologiaa silmällä pitäen – merkittävimpinä normitettavina kohteina tulevat olemaan uudissanat. Myös Suomen yliopistoihin on saatava asianmukaista kieliteknologian opetusta – kaikkia saamen kieliä ajatellen.

Tromssan yliopistossa kehitettävä käännösohjelma tulee hyödyttämään eniten inarinsaamenkielistä oppimateriaalituotantoa sekä ylipäänsä Saamelaiskäräjien inarinsaamen kääntäjää, joka käyttää lähtökielenään suomen kielen lisäksi myös pohjoissaamea ja kääntää näistä kielistä tulokieleen eli inarinsaameen. Myös käännösten käyttötarkoitusta olisi mietittävä ja laajennettava: olisiko lyhyen elinkaaren tekstien, kuten viranomaisten lehtitiedotteiden, lisäksi hyvä kääntää esimerkiksi maailmanklassikoita inarinsaameksi? Kuka tämän työn kustantaisi ja käytännössä tekisi? Tähän työhön konekäännös ei luonnollisestikaan sovi. Mutta jos konekäännöksen avulla pystytään kääntämään käyttöproosaa tehokaammin, niin ehkä kääntäjillä olisi aikaa kääntää vaikkapa tulevaisuuden “Harry Potterit” inarinsaameksi. Entä olisiko toimivien kieliteknologisten sovellusten ansiosta mahdollista saada inarinsaameksikin oma viikkolehti? Pohjoissaamen kokemuksista Norjassa tiedetään, että korjausohjelmat ovat kuluneet ahkerassa käytössä saamelaislehtien kirjoitus- ja toimitustyössä.

Haluamme sekä tällä artikkelillamme että Tromssan yliopiston käännösohjelmaprojektilla nostaa inarinsaamen kirjallistumisen uuteen aikakauteen – sellaiseen, jossa kieltä kirjoitetaan aktiivisesti siten, että sekä korkealaatuisten tekstien että kirjoittajien määrä lisääntyy merkittävästi. Alkakoon tämä aikakausi inarinsaamessa jo nyt.

Lähteet

  • Antonsen, Lene, Ciprian Gerstenberger, Trond Trosterud, Linda Wiechetek (2009) Sámi Langugage Technology at the University in Tromsø. Arctic Languages: Syntax, Morphology, Lexicon 2009. Tromssa: UiT, 24–26. http://giellatekno.uit.no/background/giellatekno3.pdf
  • Antonsen, Lene & Trond Trosterud (2010) Manne dihtor galgá máhttit grammatihka? (Why the computer should know its Sami grammar.) Sámi Dieđálaš Áigečála 2010 (1). Romsa–Guovdageaidnu: Universitetet i Tromso & Sámi Allaskuvla, 3–28. http://site.uit.no/aigecala/files/2013/03/2010-antonsen-ja-trosterud.pdf
  • Borg, E. W. (1859) Anar Sämi Kiela Aapis Kirje ja Doktor Martti Lutherus Ucca Katkismus. Oulu: Chr. Ev. Barck.
  • Clyne, Michael (1997) On the Undoing and Redoing Corpus Planning. Teoksessa Clyne, Michael (ed): Undoing and Redoing Corpus Planning. Berlin: Walter de Gruyter, 1–10.
  • Haugen, Einar (1983) The implementation of corpus planning: theory and practice. Teoksessa Cobarrubias J. & Fishman J. A: (eds): Progress in Language Planning: International Perspectives. Berlin: Mouton, 269–289. http://www.giella.no/artikkel.aspx?AId=3513&back=1&MId1=1124
  • Grenoble, Lenore A & Whaley, Lindsay J. (2006) Saving Languages. An Introduction to Language Revitalization. Cambridge: Cambridge University Press.
  • Inarilappisches Wörterbuch I – IV (1986 – 1991) Herausgegeben von Erkki Itkonen unter Mitarbeit von Raija Bartens und Lea Laitinen. Lexica Societatis Fenno-Ugricae XX, 1–4. Helsinki: Suomalais-Ugrilainen Seura.
  • Itkonen, Lauri (1902) Suoma Evangeliumlaš-Lutheralii Kirho Katkismus. Pyerrin keččum Suoma servikudii koalmad ohtsii čoakkimist ive 1893. Kemi: Lapin kirkollisrahasto, Lapin Kulttuurirahasto, Torniolaakson Kotiseututoimikunta, Rovaniemen Kotiseutuyhdistys Totto ry.
  • Itkonen, Lauri (1906) Ráámmat historjá. Ulmui máttááttim verrin heevitij F. W. Sundwall, seminaar ovdasalmai. Helsig: Suomâ Kirjálâšvuođâ Servi.
  • Johnson, Ryan, Lene Antonsen, Trond Trosterud 2013: Using finite state transducers for making efficient reading comprehension dictionaries. Proceedings of the 19th Nordic Conference of Computational Linguistics (NODALIDA 2013), May 22–24, 2013, Oslo University, Norway. NEALT Proceedings Series 16: 59–71.
  • Kaarret, Anja (2014) Mááđu peivi, suotâs eivi. Aanaar: Anarâškielâ servi ry.
  • Kaplan, B., Robert & Baldauf Jr., Richard B. (1997) Language Planning from Practice to Theory. Clevedon: Multilingual Matters.
  • Katekismus 2011. Helsig: Edita.
  • Kirkkokietâkirje (2002) Suomâ evangellâš-luuteerlâš kirho Kirkkokietâkirje anarâškielân. Pieksämäki: Kirho kuávdášruttârááju. http://sakasti.evl.fi/sakasti.nsf/0/031D9046BC845DF5C2257713004D0245/$FILE/inarijpkirja.pdf
  • Levenshtein, Vladimir I. 1965: Dvoičnye kody s ispravleniem vypadenij, vstavok i zameščenij simbolov. Doklady Akademij Nauk SSSR 163 (4): 845–8. Englanniksi: Levenshtein, Vladimir I. (February 1966). “Binary codes capable of correcting deletions, insertions, and reversals”. Soviet Physics Doklady 10 (8): 707–710.). http://profs.sci.univr.it/~liptak/ALBioinfo/files/levenshtein66.pdf
  • Linnanmäki, Teija (2013) Mijjân lii adelum maassâd mii lappum kielâ já identiteet. Eenikielâ molsom suomâkielâst anarâškielân. Pro gradu -tutkielma. Giellagas-instituutti. Oulu: Oulun yliopisto.
  • Lönnrot, Elias (1895 [1854]) Ueber den Enare-Lappischen Dialekt. Helsingfors: Acta Societatis scientiarum Fennicae.
  • Mattus, Ilmari (2014) Sevŋis vuođâlohán. Aanaar: Anarâškielâ seri ry.
  • Morottaja, Petter (2009a) Kirjálâšvuotâ jottáá já symboleh kirdâččeh fantasia suájáiguin. Teoksessa Ruppel, Klaas (toim.) Omin sanoin. Kirjoituksia vähemmistökielten kirjallistumisesta. Helsinki: Kotimaisten kielten tutkimuskeskus, 75–89. http://scripta.kotus.fi/www/verkkojulkaisut/julk6/Omin_sanoin.pdf
  • Morottaja, Petter (2009b) Inarinsaamelaisen kirjallisuuden ensiaskel ja askel sen jälkeen. Teoksessa Ruppel, Klaas (toim.) Omin sanoin. Kirjoituksia vähemmistökielten kirjallistumisesta. Helsinki: Kotimaisten kielten tutkimuskeskus, 70–74. http://scripta.kotus.fi/www/verkkojulkaisut/julk6/Omin_sanoin.pdf
  • Morottaja, Petter (2014a) Virkkuuvääri. Luuhâmkirje, čohčâ. Aanaar: Sämitigge.
  • Morottaja, Petter (2014b): Virkkuuvääri. Luuhâmkirje, kiđđâ. Aanaar: Sämitigge.
  • Haavisto, Mervi; Maliniemi, Kaisa; Niiranen, Leena; Paavalniemi, Pirjo; Reibo, Tove; Trosterud, Trond. 2013: Kvensk ordbok på nett – hvem har nytte av den?. Nordisk konferanse i leksikografi; Oslo.
  • Nuolijärvi, Pirkko (2009) Kirjallistuminen kielisosiologisena ja sosiolingvistisenä ilmiönä. Teoksessa Ruppel, Klaas (toim.) Omin sanoin. Kirjoituksia vähemmistökielten kirjallistumisesta. Helsinki: Kotimaisten kielten tutkimuskeskus, 19–26. http://scripta.kotus.fi/www/verkkojulkaisut/julk6/Omin_sanoin.pdf
  • Olthuis, Marja-Liisa (2000) Säämi-suomâ-säämi sänikirje. Aanaar: Sämitigge. Koekäytössä oleva versio.
  • Olthuis, Marja-Liisa (2007) Inarinsaamen lajinnimet. Lintujen ja sienten kansannimitysten historiaa ja oppitekoisten uudisnimien muodostuksen metodiikkaa. Avveel: Anarâškielâ servi ry.
  • Olthuis, Marja-Liisa (2009) Mii kirjekielâ lii já maht tot šadda? Teoksessa Ruppel, Klaas (toim.) Omin sanoin. Kirjoituksia vähemmistökielten kirjallistumisesta. 75–89. Helsinki: Kotimaisten kielten tutkimuskeskus. http://scripta.kotus.fi/www/verkkojulkaisut/julk6/Omin_sanoin.pdf
  • Olthuis – Kivelä & Skutnabb-Kangas (2013) Revitalising Indigenous Languages. How to Recreate a Lost Generation. Bristol: Multilingual Matters.
  • Párnái Ráámmát (2010). Helsinki: Lasten Keskus.
  • Rodgers, Lee (2014a) Saammâl já vuossâmuš sierâpeivi – Sammeli and the First Toyday. Aanaar: Anarâškielâ servi ry.
  • Rodgers, Lee (2014b) Saammâl já juovlâlisto – Sammeli and the Christmas List. Aanaar: Anarâškielâ servi ry.
  • Salmâkirje (1993) Tuhhiittum Kirholâščuákkimist ive 1993. Helsinki: Kirkkohallitus.
  • Sammallahti, Pekka & Morottaja, Matti (1993) Säämi-suomâ sänikirje. Ohcejohka: Girjegiisá.
  • Sarre, Anni (2014) Speijâlistem – Heijastus. Aanaar: Sämitigge.
  • Skopets, Mervi (2013) Uđđâ testament jurgâlem anarâškielân. Suomâkielâst anarâškielân – keevâtlâš pággu vâi máhdulâšvuotâ uccâ kielân? Pro gradu -tutkielma. Giellagas-instituutti. Oulu: Oulun yliopisto. http://www.oulu.fi/sites/default/files/content/Giellagas_Gradu_MerviSkopets_2013_0.pdf
  • Spolsky, Bernard (2009) Language Management. Cambridge: Cambridge University Press.
  • Vesala, Riitta (2014) Hirškiihâ já Myerji mainâseh 1–3. Aanaar: Anarâškielâ servi ry.

Viitteet

  1. Ks. Nuolijärvi 2009: 22; Kaplan & Baldauf 1997: 38–58; Grenoble & Whaley 2006: 137 – 159; Spolsky 2009: 76. 

  2. Nuolijärvi 2009: 22 

  3. Antonsen & Trosterud 2010: 3 

  4. Ks. Haugen 1983: 275. 

  5. Kaplan & Baldauf 1997: 38–58; Clyne 1997: 1. 

  6. Haugen 1983: 275. 

  7. s. 133–134 

  8. Olthuis 2009: 76; 2007: 69. 

  9. s. 191 

  10. Olthuis 2006: 398 

  11. Olthuis 2007: 70. 

  12. Olthuis 2009: 91; Morottaja 2009: 71. 

  13. Spolsky 2009: 76 

  14. http://www.giella.no/artikkel.aspx?AId=3513&back=1&MId1=1124 

  15. ks. Morottaja 2009b: 71–74. 

  16. Morottaja 2009a: 67. 

  17. Morottaja 2009b: 72 

  18. ks. Morottaja 2009: 67–70 

  19. Ks. http://ask.bibsys.no/ask/action/stdsearch , etsinnän asetukset: Språk = Inarisamisk ja Materialtype = Bøker

  20. ks. Vesala 2014. 

  21. Suullinen tieto Inarin alakoulusta 29.12.2014. 

  22. ks. Olthuis et al. 2013: 131–134. 

  23. Ks. Olthuis 2007: 1–5. 

  24. Suomen kielilaki on julkaistu netissä: https://www.finlex.fi/fi/laki/ajantasa/2003/20031086 

  25. Olthuis et al. 2013: 29; 2009: 75. 

  26. Linnanmäki 2013; Skopets 2013. 

  27. Ks. Olthuis 2007. 

  28. Jos analysoi Suomen valtioneuvoston vuoden 2012 tiedotetta kunnallisvaaleista kyseisten kielten analyysiohjelmien avulla (http://www.vaalit.fi/uploads/a4e6aj1pnyu9.pdf), tunnistamisprosentti on seuraava: suomi 99,5 %, pohjoissaame 96,1 %, koltansaame 31,5 % ja inarinsaame 27,2 %. Tasoeron analyysiohjelmien kesken voi itse todeta analysoimalla tekstiä kullekin kielelle sivun http://giellatekno.uit.no/smilang.fin.html kautta. Analysaattorin toiminnasta ks. Antonsen et al. 2009; Antonsen & Trosterud 2010. 

  29. Ks. Antonsen et al. 2009 

  30. ks. Olthuis et al. 2013. 

  31. Editointivirheillä tarkoitetaan lähinnä leikkaa-liimaa-virheitä. Välillä kirjoitusvirheen tulos voi olla olemassa oleva sana (esimerkiksi -ot -at-päätten tilalle lauseessa Sanot kertovat, pitää olla Sanat kertovat.)  

  32. Automaattien ongelmana esiintyy usein yligenerointi: kirjoitusvirheet peittyvät mahdollisten mutta ei käytössä olevien sanojen taakse, esim. pohjoissaamesta: biilat = väärä monikko sanasta biila ”auto”. Teoriassa muoto edustaa Nom PxSg2, mutta koska Px on käytössä vain elollisten sanojen yhteydessä, muoto on astevaihteluvirhe muodosta biillat. Ehdotuskentät voivat täyttyä myös toisilla sanoilla tai sanoilla, jotka eivät ole käytössä, esim. äijjih → lijjih, äijih, Fijih, Äijih, äigih; ovcci → Gucci. 

  33. Levenshtein 1966 

  34. Suullinen tieto Pekka Sammallahdelta 30.12.2014. Termillä ”sane” tarkoitetaan sanamuodon esiintymää. 

  35. Olthuis 2000. 

  36. Ks. http://spraakbanken.gu.se/korp ja http://gtweb.uit.no/korp 

  37. Ilmari Mattus on kerännyt Anâraš-lehden tekstit (yht. 1,3 milj. sanaa), ne on jaettu lauseiden mukaan ja sijoitettu Tromssan yliopiston Giellatekno-keskuksen korpushakukoneeseen Korp, ks. http://gtweb.uit.no/korp/?mode=smn. Sen lisäksi Suomen Saamelaiskäräjien inarinsaamen tekstit (n 100 000 sanetta) on kerätty osoitteeseen https://victorio.uit.no/freecorpus/orig/smn/admin/sd/www.samediggi.fi/ Näitä ei toistaiseksi ole lisätty hakukoneeseen. Useimmissa inarinsaamenkielisissä kirjoissa (yli 120 julkaisua) on suhteellisen vähän tekstiä, luultavasti alle 10000 sanetta/kirja. Muut inarinsaamen tekstintuottajat ovat YLE Säämi ja Inarin kunta. 

  38. ks. myös Olthuis 2007: 94. 

  39. Olthuis 2000. 

  40. Johnsen et al. 2013. 

  41. http://gtweb.uit.no/korp/?mode=smn

  42. Julkaistu kirjallisuus (ks. lähteet) : Riitta Vesala 2014; Lee Rodgers 2014a ja 2014b; Petter Morottaja 2014a ja 2014b; Anni Sarre 2014; Anja Kaarret 2014; Ilmari Mattus 2014. 

  43. Antonsen & Trosterud 2010: 24. 

  44. ks. myös Antonsen & Trosterud 2010: 24–25.