!!! Giellateknomøte 9. mai 2018 Tilstede: Ciprian, Trond, Chiara, Lene !!Saksliste * Serversaka * Alle orienterer * Preprosessering * LIA * Bibelen * NDS * NAV !!Serversaka Konteaksta fungerer ikkje fordi serveren (gtoahpa) er full. Det blir også problem med bookmarklet. [Serveroppgradering|https://giellalt.uit.no/infra/system/Serveroppgradering.html] __Trond__ tar kontakt med IT advelinga før lunsj i dag, dette er kritisk for oss. Dette er IT: {{{ Administrasjonen ved UiT Seksjon for grunntjenester Seksjon for digitale forskningstjenester Seksjon for systemutvikling og arkitektur Seksjon for digitale utdanningstjenester Seksjon for brukernær IT-støtte }}} !!Alle orienterer * Ciprian: Deadline 20.5. (2 artikler, 1 presentasjon), LIA, bibelen ** bortreist til 24.05. * Lene: arbeider med sma og CG, skriver Bz for diverse bugger i forbindelse med HFST, LIA, bibelen ** er bortreist på fredag * Trond: Studentar, preprosessering, taggflytting, CG-testing, sma * Chiara: Konteaksta, hfst-testing, NDS !!Preprosessering Output for HFST fungerer for Konteaksta. Trond og Sjur arbeider med output for forkortninger, vs. punktum som setningsgrense * skal punktum alltid være et eget token? * skal punktum være en del av lemma? * skal punktum være en del av lemma pluss eget token? Møte om dette med Lene, Trond, Kevin, Sjur og Linda. __Trond__ skriv e-post om dette, møte så snart som råd. !!LIA Scriptet Ciprian har laga er no klart til å bruke (inkludert MT). * __Lene og Ciprian__ diskuterer etter dette møtet !!Bibelen Ciprian har testa mange ulike konverteringar til vår xml og har laget et tilpasset skript for å få ut både xml og txt. Lene har analysert, og får relevante analyser på setningsnivå, og kan plukke ut setningene som de ønsker. Det er eitt teikn som blir prosessert i lag med ordet (enkelt hermeteikn for sitat i sitat). __Trond og Lene__ ser på problemet med teikn. Ønske fra Bibelselskapet: "Så er det også brukt en del ukjente ord og uttrykk i teksten. Er det mulig for dere å lokalisere slike ad maskinell vei?" Legge teksten inn i Korp-grensesnitt? Alternativer: * separat url? * legge inn som eget valg i vår test-2018-korp? * med lås (tar lang tid fordi vi ikke har dette implementert) Lingvistikk: * Legge til toppen av missinglist (vi + Thomas) Framdrift # Diskutere med Bibelselskapet # Sende missinglist til dem # Legge inn missing i lexc # Sende setningar som tekst !!NDS !Lenkje til Korp * Nokre ord får lenkje, andre får ikkje, dette er en bug * Forslag om at vi ikke legger inn lenke til bug hvis ordet ikke finnes i Korp ** da må vi ha generere liste over alle lemmaer !Paradigme på førstesida Børres framlegg. Dette vil være problematisk pga mye informasjon, og lite ønskelig for mobiltlf. TODO: Rydd opp i grå boks. !Adresse for tilbakemelding til NDS Vi må få en synlig knapp for tilbakemelding, helst med informasjon om hvilket ord brukeren ser på (dyp url). Helst mulighet for anonym tilbakemelding. !Ulike analysatorar for fkv Trond har lagt den riktige analyseren i /opt/ og i sanat.config.yaml, og skal sjekke inn endringa i svn. !sms Kompileringstida for sms er to timar. Det er noko gale der. Vi må sjå på det og diskutere med Jaska. __Lene__ tar kontakt med Jaska. {{{ *** Warning: Sublexicons defined but not used: A_NUORR A_AQLKHKHI A_VUAQMES GER-ESS_ GER-INSTR_ N_HYPOTEEQS PROP_KHEQRJJ TV_PIYKKLOOCHCHYD TV_VUAGGGAD V_PEITTAD }}} !!NAV Det skal vere møte i Kautokeino 11.6. om NAV-løysingar på samisk. Trond er bortreist på møte. Lene har planlagt å ta fri den dagen. __Trond__ høyrer med Sjur.