Giellateknomøte 26.01.2021 Tilstede: Trond, Lene, Chiara !!!Saker: * oppfølgjing frå sist * Korp * MT * Sosling-gruppa * Digitaliseringstiltak på UiT * Neste møte !!! Oppfølgjing frå sist * Giellalt bµgger (Børre har sett på det), også for dei språkspesifikke sidene, t.d. [https://giellalt.uit.no/lang/fkv/KvenDocumentation.html] * Migrering av python2 til python3, Dette er framleis på oppdateringslista. * Digitalisering og Samisk arkiv. Trond har gjort framlegg om OCR-lesing av gamle tekstar. Det er mogleg vi får som svar at det berre gjeld fotografering av Riksarkivet og Samisk Arkiv. Vi får høyre. * Nasjonale minoritetsspråk. Trond har skrive brev til KD. * ssh og nøklar. Vi bør bestemme kva vi vil gjere, Chiara må svare. Hvis alle bruker ssh-nøkkel, kan man stenge for passordinnlogging. __Trond og Lene følger opp i dag__. * sms og +Comp til +Der/Comp. __Trond__ har skrive til Jack, skal følgje opp. * UArctic Digitalisering og sirkumpolare språk. __Trond__ har kontakt med Svein på SA om dette * ICALL-prosjekt for nasjonale minoritetspråk i Sverige -- dette blir det ikkje noko av i denne omgang. * HIF-10zz i regulære uttrykk og bruk av språkteknologi. Trond held eit samlingsbasert kurs til hausten. * SAM.30zz Språkteknologi og korpuslingvistikk. Haust eller vår? __Lene og Trond__ ser på dette. !!! Korp !!Buggane i u_korp Her har Chiara fiksa fleire: Omsetjingar av attributt og pop-up for taggar. På lista: Årstalsboksen. Deretter [https://github.com/giellatekno/korp-frontend/issues/5] !!Ting å gjere med SIKOR !Comp i sms Vi vl ha Der/Comp i den nye versjonen. !Evt. arbeid med smn Sjå på missing list !Grepkorpus Lene har gode rutiner: * Strengar med feil taggar (dobbel POS, ...) * Missing list (sjekk at det ikkje er nye ord på toppen) !Bibelen Få med bibelen parallellisert, også nob !!Framdrift # Tekniske ting og Bibel og lingvistisk arbeid # f_korp # SIKOR !!! MT !!NMT-møte Vi bør ha et oppsett på Giellatekno, vi ser på git-sidene med relevante pipelines, når vi får tid til det. !!fin-sme Trond og Lene har sett på dette, framleis litt att. Deretter er det snakk om betre dis-fil og tilpassing av syntaktiske taggar til vårt system. Det å få med funksjonstaggar krev val av fil (gjort) og tilpassing av syntaggar (må bli gjort). !!sme-smn Trond har ikkje sett på dette. __Lene__ ser på taggar i sme-smn, ser på regresjonstesting etter taggmøtet vi hadde. !!MT for smj Vi treng ikkje få godkjenning for innsamling av materiale hos NSDs fordi vi ikkje lagrar persondata. !!!Sosling Møte neste veke. __Lene__ kallar inn. !!!Digitaliseringstiltak på UiT [https://uit.no/tavla/artikkel/715700/midler_til_digitalisering?p_document_id=715700] Søknadsfrist er 19/2 2021. Digitaliseringsrådet forvalter et budsjett på 5 MNOK. Disse skal fordeles på digitaliseringstiltak som bidrar til at UiT når sine strategiske mål knyttet til utdanning, forskning og formidling. # Eksperimentell utprøving av løsninger for bedre undervisning eller forskning i små pilotprosjekt. Disse prosjektene vil ha som formål å finne ut om et verktøy eller en arbeidsmåte bidrar til mer læring eller bedre forskning. # Oppskalering av løsninger som har vært prøvd ut én eller flere steder i organisasjonen og som har gitt gode resultater. # Tilrettelegging for digital forskning og utdanning generelt, rettet mot vitenskapelig ansatte. Dette kan være samarbeidsarenaer, kurs, webinarer, organisering av informasjon eller tilrettelegging for deling av digitale læringsobjekter. Moglege ting å søke på * Utvide programmeringsressursar * Samle inn korpus * Handsame data frå Samisk arkiv * Jf. også jusprosjektet, evt. sykepleieterminologi * Argumentere for programmerar med ekstern ad hoc-finansiering for instituttet !!!Oppsummering * Småting i boks * Prioritering av og plan for Korp-arbeid * Strategisk satsing for å styrke programmering og teksthandsaming (__Lene, Trond__) !!! Neste møte Vi tar møte etter at vi har fått ein korpusversjon til på plass. __Chiara__ gir beskjed.