Saker: * nytt frå Sjur - situasjonsorientering * statusrapport frå alle * arbeid framover !!!nytt frå Sjur Situasjonsorientering !!!statusrapport frå alle !!Børre * korpuskonvertering * kodekonvertering Det meste er under kontroll, dei aller fleste dokumenta er korrekte no. Ulike problem med titlar, forfattarfelt og dokumenttekst. Usynlege orddelingsteikn og andre teikn deler orda i det konverterte materialet. Merk: Orddeling bør konverterast til Har ikkje sett på termwikien enno. Må prioriterast framover, frå neste veke. !!Inga Har jobba med missing-lista, 16 020 ord. Grupper med ord (lista etter frekvens): * typos * namn * samansette ord (av typen "førsteklassing", o.a. talord) * nordsamiske(?) låneord skrivne med smj-ortografi (frå tekstar frå svensk side) * norske ord * ulikestava låneord - mykje uklårt i systemet vårt Vanlege typos bør leggjast inn i leksikonet med +Err/Sub. !!Maja Tilbakemeldingar frå brukarane: * saknar ord frå godkjente lister - Maja har lagt inn (òg i digibaakoe) Har arbeidd med: * saknar MT-delen, dvs Apertium - vil leggja inn ordpar der * vil arbeida med resiproke pronomen, jf med nordsamisk * må arbeida med twol, treng hjelp -> Børre, Sjur * det trengst arbeid med ord som går til R (direkte eller indirekte) * added loan-lemma * + missinglist * properpronouns - kan man sette Attr Lexicon til R-lexicon? når det gjelder firstcomp. er jeg litt usikker/ambivalent på om det bare er å paste inn fra Bergsland, fordi systemet "spriker". Samtidig er det dette som er normen...drøfte dette. !!Sjur Har arbeidd mykje med hfst-stavekontrollar og bygginga av slike i det siste, + oxt for LibreOffice / OpenOffice. Framover: * Hunspell, PLX inn i ny infra !!Tomi * jobba med feil på sátni.org - funkar ikkje på maskina til Tomi ** ordboklista doesn't come up when clicking button ** Sjur prøver på eiga maskin * det har kome nokre feilmeldingar, frå SD og NN * skript for å importera frå termwikien ** funkar, men ikkje sikker på om alt er med *** lag unit-testar! Neste: skriv dokumentasjon for sátni.org-koden og korleis han kan testast. !!!Arbeid framover Hovudprosjekt utover våren: * oppdaterte og nye stavekontrollar ** missing for alle språk ** plx og hunspell inn i ny infra ** testa og utvikla hfst-stavekontrollane ** forslaga frå hfst-stavekontrollane * termwikien (børre) * ENG og CLDR/mobiltastatur m.m. * grammatikkontroll * tekst-til-tale * stavekontrolltesting -> slutt * sátni.org * gielese.no !!!Neste møte Måndag 17.3. kl 9.30