Divvun-møte 9.3.2021 Til stades: Duommá, Børre, Linda, Tommi, Katri, Ritva, Sara, Siri, Sjur Saker: * Sidan sist * Arbeid framover * Ymse !!! Sidan sist !! Duommá * gram-chk yaml * gram-chk testing o forbedring - word additions, disambiguahtor, bugzilla, errorth forms * GramDivvun-møte !! Børre * divvun-sdk-nodejs * korpus ** normalisere til NFC (det er hva fst-ene venter) ** flytte docx til odt (docx-konverteringen produserer innviklet html, odt-konvertering gir en mye enklere versjon) Kommentarar: * {{pandoc}} kan vera eit alternativ for å konvertera docx-filer (ikkje doc-filer). * divvun-sdk-nodejs - diskuter med Brendan Nettsideproblem: * static-files - ok no, bortsett frå LO-5-pluggen (må byggjast på nytt?) * Bugzilla - ikkje på plass enno * divvun.no med andre lokale enn dei som allereie finst (berre for Safari på Mac, ok for alle andre) - ikkje ok enno * nettstavekontrollen - byta til api-giellalt.uit.no som server (REST-api) * see-servar - framleis borte !! Linda * yaml-testar med Duommá (sammensettinger) * GramDivvun med Ritva og Duommá * diskuterer nye feiltyper med Ritva + yaml fil for å samle dem * neurale nettverk med Tommi, Chiara og Mika * evalueringskorpus med Børre * fulgte med på disputas om flerspråklighet !! Tommi * jobb med gold korpus for evaluering i nevral artikkel * fiksede bugger i divvun-normaliser * --enable-tts er i alle språk nå * mindre fikser til autogen.sh og configure også * hadde medarbeidersamtale {{--enable-tts}} bør automatisk slå på {{--enable-phonetic}} og {{--enable-tokenisers}}. !! Inga * TTS-møte & andre møte * rettet på tekster som skal brukes i TTS Jobba halv tid førre veka. !! Katri * tts-møte * omorganiserad speech-smj-privat-mappen ** nya mapp (tts-texts) för smj-teksterna som blir spelas in * ideen till workshop (Phonological diversity; 16.-19.9. Poznan: http://wa.amu.edu.pl/plm/2020/Home) * utvecklat och testat espeak tts vidare ** två+ siffriga grundtal fungerer nu, men ordningstal har några problemer * prosessera speech-smj-minicorpus för att trena en enkel neural vocoder som fungerar med 1 timmes taldata (Inga): behöver .txt + .wav par per setning ** har skrivit och testat Praat skripter för att konvertera och dela upp långa ljudfiler till kortare delar ** python skript för att dela upp tekstfiler också * added documentations! !! Ritva * Flammie hjalp til med svn-problemer * GramDivvun filer * 2x GramDivvun Workshop (Linda & Duommá) GramDivvun: kan vera vanskeleg å sjå kor ein er i teksten, etter at ein har klikka seg vidare. Innimellom viser til feil setning, både i MS Word og GoogleDocs. !! Sara Marja * admin saker Stor bokstav etter hermeteikn på mobiltastatur (iOS i alle fall) - skal ikkje vera slik. !! Sjur * Medarbeidersamtaler * Møte med ASTIN (observatørstatus for samisk og grønlandsk) * Sametingets workshop (Joint Sámi flagship project (IDIL 2022-2032)= * Forelesning, Helsinki uni * tekstnormalisering (TTS) - første del er på plass * møte med Antti Arppe * tekstrydding i nordsamiske tts-ressursar !! Göteborg * Studenten som jobber med talesyntese viste fram en demo med bra lyd * Divvun oneclick-installer. Enklere å installere: velg språk, installer verktøy og oppdateringshåndterer. Windowsversjonen slippes ganske snart. Når kjem det oppdateringar av mobiltastaturet? Dvs ordfullføring og ordprediksjon. — Ingen klare planar enno. !!! Arbeid framover * Medarbeidersamtaler !!! Ymse * Møtefrie dagar? * neste møte tysdag 16.3.2021