Giellateknomøte 23.12. Tilstede: Trond, Chiara, Lene !!! Saker: * Oppsummering av hausten * Korpusoppdateringa * NDS * Våren * Servarar * oahpa.no * Nasjonale minoritetsspråk !!! Oppsummering av hausten !! Artiklar * To artiklar i Sámi logut muitalit, publisert (Trond, Lene) * Artikkel om MT i UiO antologi (Trond, Lene) * Artikkel om leksikalisering, publisert (Linda, Tommi, Chiara, Trond) * LIA-artikkel for LIA-antologi (Lene) * Px i avisspråk, for SDÁ, publiseres 2020 (Lene, Laura) !Registrering i Cristin: * Trond registrerer /sjekkar Sámi logut muitalit !! Andre ting !Stavekontrollanseringar * fao lansert, fit og cor i betaversjon !Enaresamisk !Mastersudentar !! Migrering til python3 * python2 til python3 Chiara har arbeidd med dette. NDS er i Python 2, Brendan vil hjelpe til !!! Korpusoppdateringa !!Status: * u_korp: corpus oppdatert og Korp fra v2 til v6 (Chiara) * grep_corpus for de samiske + u_korp * Todo u_korp: legge til tidsinterval f_korp: både corpus og Korp oppdatering fra v2 til v6 korp: corpus oppdatering og eventuelt Korp fra v6 til v9 ny grep_corpus for de samiske * Chiara har lasta kode opp til github, [https://github.com/giellatekno] Oversikt i korp_corpus.txt under admin i det private korpuset. # u_korp = mhr 50, myv 9, mdf 9, mrj 5 mill ord. # f_korp = fiv parallelltekst, fit, fao. # korp = SIKOR, mykje ny parallelltekst Vi ser på prioritering av f_korp og korp den 4.1. !!Grensesnitt !Grafikk !Sikor mer synlig enn Korp !Markering av aktivt språk Ønskjemål: klårare markering av kva apråk som er aktivt !Tospråklege tekstar vi må ha __ei__ rullegardin for all fleirspråkleg tekst !!! NDS Her har det skjedd lite i det siste. * Trond har hatt to seminar med leksikografar * Chiara og Trond har arbeidd med spa-sme. Automatisk oppdatering av innhald: Dette gjer vi etter migrering til git. !!! Våren !! Planar for artiklar * MT av Ávvir til smj, Lene følger opp, samarbeid med Inga !!MT !Apertium smj, sma, ... !NMT Helsingfors har laga oppsett for NMT for samiske språk. Uleåborg vil ha MT-kurs, bruke både Hfors og oss. Vi vil samarbeide med både Helsingfors og Uleåborg om dette. !CG Trond diskutere med Eckhard om eitt språkpar og tilpassing til ny struktur i git. !!Sosiolingvistikk * Kasia blir phd-student hausten 2021, * SA har 4 phd-stipendiatar frå 2021 Vi bør samarbeide om phd-kurs Fellesseminar der studentane blir kjent + der institusjonane presenterer seg sjølv og ressursane sine. Også !!Undervisning !Språkhistorie Trond Våren 2021. Elles har vi ikkje undervisning. !Språkteknologi og korpuslingvistikk Våren 2022 !!Digitalisering og Samisk arkiv Vi bør invitere Arkivverket til eit møte om dette: * kva skal tekstar skal/kan digitaliserast, og til kva slags grensesnitt? * Kva rolle vil språkteknologien spele i dette? Blir tekstene digitalisert slik at de blir brukbare etterpå for analyse, samisk søk osv. __Trond__ følgjer opp dette. !!!Servarar Automatisk status: https://github.com/divvun/registry gtweb, gtoahpa, gtdict !!!oahpa.no Det har ikkje vore oppdatering av oahpa-dokumantasjonssidene sidan juni 2019. No blir det ein del aktivitet framover. !!!Nasjonale minoritetsspråk Trond diskutere dette med relavante kanalar.