FAD-møte 25.6. Til stades: BM, Cip, Trond Saksliste: * Status quo * Unifisering * Enare !!!Status quo Cip har prøvekøyrt unifisering, og delt kjeldene i tre (separat gt, separat fad, felles), men ikkje unifisert fellesdelen, den er framleis i to ulike filer). BM har sett på filene. !!!Unifisering src-attributter: * nj= Nils Jernsletten * fad= fad-prosjektet * gt= giellatekno !!3 kataloger: dette er data som kun finnes i fad, og skal unifiseres separat: * {{main/words/dicts/nobsme/terms/admin/src_fad-only}} ** disse to inneholder felles lemma og skal slås sammen og unifiseres, først automatisk og siden manuelt: * {{main/words/dicts/nobsme/terms/admin/src_fad-gt_commons}} ** --> denne er ikke unifisert separat * {{main/words/dicts/nobsme/src_gt-fad_commons}} ** --> denne er unifisert separat gt ∩ fad = dei som har same nob. * freq_a = frekvens i hele korpuset (nob=nowac, sme=hele gt-korpuset) * freq_f = frekvens i fad-korpuset, både sme og nob Ordboksartikkelen skal sorteres etter freq_a, dette gjelder både nobsme og smenob Stor sannsynlighet for term : høy freq_f, src=fad og kanskje bare kun src=fad? !!!Enare Vi må før sommarferien formulere hypoteser til Enare !!!Neste møte Vi tar ei oppsummering før ferien.