!!!Giellateknomøte 5.11.14 !!Saker: * smenob/nobsme * Paradigmegeneratoren i cgi-bin * Big data -konferanse i Oslo * Samarbeid om Sameting og Giellagáldu om e-ordbøker * sme til nyinfra ~ fst-testing via VD-pipeline * forrest og hjemmesida * orienteringssaker: sjur/trond-møte !!smenob/nobsme På nett: Frå juni: * nds: Gamle NSS, * web: Gamle NSS, FAD-only, smenob: state-of-art: * src/ * src_fad2merge/ (6202 ord) {{{ tf-hsl-m0016:src ttr000$ cat *.xml|grep ' 11431 }}} !Tiltak * Normalisering av filnamn (__cipian__) * Slå saman filene i src/ (__ciprian__) * Fjern frå src/ og legg dei i ein separat katalog not_in_dict (__ciprian__) ** README i katalogen * Unifisering av fad2merge, algoritme ** Lage 3 kolonner: Lemma - VD - MERGE ** Legge til OK/NEI/RED i kolonne 4 (__Lene__, ekstern) ** Maskinelt unifisere alle med OK, osv. !Namna i xml-katalogen i Geo {{{ cat geo_smi.xml|grep '"sme"'|wc -l 5922 cat nounProp_smenob.xml |grep ' basis for en db for taggar) ** cgi-bin-skriptet endre taggar ** Match lokaliserte taggar med lokaliseringsspråk * Liste som før, ikkje to tabeller * Fjerne lemma heilt til venstre i tabellen * Lenkje til paradigmegeneratoren frå ordboka * Endre Send skjema / Sádde skovi ==> Send / Sádde !Tiltak * __Trond og Ciprian__ gjer dette. Paradigmegeneratoren: Fjerde kulepunkt. Trond: Lag bug. !!Samarbeid om Sameting og Giellagáldu om e-ordbøker Sametinget skal satse på e-ordbøker, Giellagáldu normerer !Tiltak * __Lene og Trond__ ser på dette. !Tidsplan * Små endringar til neste møte * Oppsummering og vidare plan på det møtet !!Common Crawl Foundation-workshop i Oslo Börre dit? Trond tar det vidare. [CCF workshop in Oslo|http://www.mn.uio.no/ifi/om/aktuelt/arrangementer/andre/nlpg.html] !!sme til nyinfra ~ fst-testing via VD-pipeline !Paradigmetesting Ciprian har skrive i e-post. Plukk ut 20 ord med ulike taggar (Allegro, miniparadigme, v1, v2) og test dei. Vi har testa Oahpa og analysen. Lage yaml av gamle VD-oppsett, eitt ord frå kvart kontleksikon. !abbr.txt * Trond: 1100 i gammal, 813 i ny * Lene: 1100 i gammal, 1100 i ny !Use/MT Use/MT -- skal fjernast overalt, men vere med i apertium-generator-fst-ar Ei anna sak er at den må bli merka for målspråk !Use/LexSub * [Use/LexSub|http://giellatekno.uit.no/bugzilla/show_bug.cgi?id=1904] Dette er ei sak for Divvun: Desse strengane skal ikkje med i Divvun-kontrollar. og ikkje med i den normative analysatoren. 5100 Err/Sub, 700 Use/LexSub Vi ville endre denne til Err/LexSub i vår, jf [møtereferat|/admin/weekly/2014/Meeting_2014-03-28.html] Strengen Use/LexSub må bli fjerna for den normative analysatoren (Divvun). Det er altså ei Divvun-sak. Konklusjon: For Gt sin del kan vi gå over til ny infra. Vi må flytte kildefilene for å ta vare på svn-historikken. # Lag ein kopi av gammal infra, for referanse. Frys den. # Flytt gammal til ny, med svn-historikk Trond tar det opp med sjur. !!Korp Ciprian kan trykke på knappen. Vi ser om det er nye ting i dag. Oppdatere korpus, og deretter Korp. !!forrest - hjemmeside !Fra møte 8.10.14: * forbedre innholdet i ramma som er (Trond, Ciprian 15.10) * forbedre oversettelser (Jussi, Ivan, Laura/Detmar), deretter * forbedring layout pluss tekniske ting i Forrest (Trond tar opp med Sjur 14.10) * endre layout innafor forrest (også lage ny forside, bilde etc.), ekstern person, januar 2015 !tabs I dag: || Tab || Går til | Hjem Home | Heimesida | Språklæring | oahpa.no | Divvun korrektur | divvun.no | Ordbøker | dicts.uit.no | Oversetting | gtweb.uit.no/mt | Tekstkorpus | gtweb.uit.no/korp | TechDoc | Techdoc-sidene Alternativ: Ha __Verkty for samiske språk__ (osb.) i tabbane der oppe Nye tabbar: * Desse vil vi ha ** Hjem Home ** Divvun ** Verktøy for samiske språk ** Verktøy for andre språk Desse går då ut (dei er dekt av andre lenkjer) * Språklæring * Ordböker * MT !Tiltak * __Lene__ implementerer det. !Dei fire framsidene Status for dei fire sidene: * forsida: her er det engelsk som gjeld. nno og sme er ulike * giellatekno.eng.xml er parallell * On oss er parallell * samarbeidspartnarar: nno, eng er parallel, og er utgangspunkt !Tiltak * Lene synkroniserer samisk og norsk * Trond ser på resten * Trond gjer om til bokmål !Sjur/Trond-referat (4.11): # kløyv gtuit-forrest i to likt Divvun # bygg ut gtuit til å vera fleirspråkleg slik Divvun er det # lag felles techdoc Tidsplan: Denne/neste veke. !!Bugzilla Betre politikk for prioritering: * Den som meldar inn buggen set alvorlegheitsgrad ** (feature request ... blocker). ** Så kan sjølvsagt alle involverte revidere alvorlegheitsgraden viss det viser seg at buggen er meir/mindre alvorleg enn vi først trudde. * Trond/Sjur/eigaren set prioritet ** (P1 ... P5) * Vi tar prioriteringane alvorleg, og lar det vere samsvar med P og realitet. Flytte bz-diskusjon over til dokumentasjonen? I visse tilfelle bør vi gjere det. !Tiltak * Trond diskuterer [/lang/sme/j-sme.html] med Sjur. Desse sidene må i bruk. !!Orienteringssaker Sjur/trond-møte Enare !Møtereferata main/techdoc/admin/giellatekno/ [/admin/meetings.html] !!Terminologi !Utlysing 1.12. språkrådet !SDÁ SDÁ-terminologi: Vaske ut akademisk tekst Vi vil ha SDÁ i Korp. __Lene__ kontaktar redaksjonskomitéen. !!Neste möte Om ei veke: Planar.