FAD-möte 17.9. Til stades: BM, Cip, Trond !!!Saker * Evaluering * Foredrag !!!Evaluering !!BM-Trond Vi har eit resultat for fordelinga av o, med grense linje 1700 i fad_only_p-fila, jf. dokumentet {{art/2013/oovtast/terms/eval.txt}} Neste steg: Repeter for merged-gt-fad og gt-only. __TILTAK__ * Trond genererer 50-filer * Trond og BM går gjennom og fordeler t, d, o * Oppsummering etterpå !!Ciprian - Bergensevaluering sjekke overlapp av våre nob med nob i NHH-KBN-NOT-termsamlinga. !!!Foredrag !!Formalia * Ytre ramme: 15 min + 15 min * Talarar: Cip, BM * Språk: eng, sme * Slides: mest bilder/illustrasjon, max 15 stk __Why__ - motivasjon - FAD - 1 slide __How__ - Hvordan med tall: Korpus - xml - parallellfiler - sentence alignment - filtrere støy - analysere m/ Oslo-Bergen og GT - word alignment - automatisk (terskel) & manuell - antall entry (ny data A, V, N) - sammenliknet med GT-data Overgang til what: En side med GT-data og nye fad-data (Ciprian har illustrajonen) __What__ - Evaluering: Hvor mye data har vi fått fra fad, evaluering, sammenlikning. Konklusjon : sammenfatning, peke på arbeid videre Ciprian: Evaluering mot database - Ciprians del: 7 slide Berits del: 8 slide - 5 slides med problematikk, 2 slides for brukbarhet, 1 slide konklusjon Berit: Frekvenser - hvordan er de laget: sme: FAD/GT, nob: FAD/Nowac Hvordan har vi gjort dette? Problemer med data, for lite data, ikke velbestemt domene Forklare hvordan vi har evaluert og hva resultatet er: dette er ferdig for fad_only, må også gjøres for de to andre gruppene Problematisk å vurdere data. Vi har gjort vår del, men vi er ikke normative Hva er vitsen : vi lager ordlister og økt antall lemma i ordboka, parallellkorpus, glossary, støtte for oversettere. Konklusjon: 1 slide Hente tall fra rapporten, tidligere presentasjon __TILTAK__ __Cip__ lagar ei ramme, eit .tex-dokument