FAD-möte 17.9.

Til stades: BM, Cip, Trond

!!!Saker

* Evaluering
* Foredrag


!!!Evaluering

!!BM-Trond

Vi har eit resultat for fordelinga av o, med grense linje 1700 i 
fad_only_p-fila, 
jf. dokumentet {{art/2013/oovtast/terms/eval.txt}}

Neste steg: Repeter for merged-gt-fad og gt-only.


__TILTAK__

* Trond genererer 50-filer
* Trond og BM går gjennom og fordeler t, d, o
* Oppsummering etterpå

!!Ciprian - Bergensevaluering

sjekke overlapp av våre nob med nob i NHH-KBN-NOT-termsamlinga.


!!!Foredrag

!!Formalia

* Ytre ramme: 15 min + 15 min
* Talarar: Cip, BM
* Språk: eng, sme
* Slides: mest bilder/illustrasjon, max 15 stk

__Why__ - motivasjon - FAD - 1 slide

__How__ - Hvordan med tall: Korpus - xml - parallellfiler - sentence alignment - filtrere støy - analysere m/ Oslo-Bergen og GT - word alignment - automatisk (terskel) & manuell - antall entry (ny data A, V, N) - sammenliknet med GT-data

Overgang til what: En side med GT-data og nye fad-data (Ciprian har illustrajonen)

__What__ - Evaluering: Hvor mye data har vi fått fra fad, evaluering, sammenlikning. Konklusjon : sammenfatning, peke på arbeid videre

Ciprian: Evaluering mot database - 

Ciprians del: 7 slide

Berits del: 8 slide - 5 slides med problematikk, 2 slides for brukbarhet, 1 slide konklusjon

Berit: Frekvenser - hvordan er de laget: sme: FAD/GT, nob: FAD/Nowac
Hvordan har vi gjort dette?
Problemer med data, for lite data, ikke velbestemt domene
Forklare hvordan vi har evaluert og hva resultatet er: dette er ferdig for fad_only, må også gjøres for de to andre gruppene 

Problematisk å vurdere data. Vi har gjort vår del, men vi er ikke normative

Hva er vitsen : vi lager ordlister og økt antall lemma i ordboka, parallellkorpus, glossary, støtte for oversettere. 

Konklusjon: 1 slide

Hente tall fra rapporten, tidligere presentasjon


__TILTAK__

__Cip__ lagar ei ramme, eit .tex-dokument