!!!Møte om sme-dict 23.8.2011 Til stades: Ciprian, Berit, Biret, Lene, Trond. !!!Saker * Hvordan gjøre vi det med hermetegnord? * Hvordan legge til ord som bare er ord nr 2 i faste uttrykk (f.eks. binná banná) - lage et felt for link til ord nr 1? * "jfr"-felt, med link for synonymer? moteksempler osv. * vs. * ny kompileren - når? * neahtta vs VD - * inc-listtut * enkeltord !!!Bakgrunn Alle ord frå visse bøker inn i ordbøkene. !!!Hvordan gjør vi det med hermetegnord? Sára beaivvegirji = For å la språket vise til 11 år gamal jente bruker forfattaren ordet "ambulansemann". # Skal dei med? # Viss ja, korleis? {{{ om kvinner }}} Kjeldetilvisng som attributt for x og xt: {{{ ... dakkár ilgadis olmmošlágan filbmasivdnádus, mii lea eambbo robohtalágan go olbmolágan. }}} Dette må inn i DTD-en! !!!Grammatisk informasjon om rørsleadverbial bajimussii {{{ bevegelse til øverst }}} {{{ + til øverst <==== ny Dál leige mu vuorru fas goargŋut bajimussii. Nå var det igjen min tur å klatre helt øverst. skoavddas skoavdasat om masse <===== lagt til hul f.eks. snø eller is <===== fjerna skoavdeláibi hult brød Jiekŋa lea skoavddas. Isen har hulrom. }}} !!!Hvordan legge til ord som bare er ord nr 2 i faste uttrykk (f.eks. binná banná) - lage et felt for link til ord nr 1? háluid - link til hiluid med eksempel med hiluid háluid - binná bánná {{{ mwe_smenob.xml: hiluid háluid }}} !!!jfr-felt, med link for synonymer? {{{ Initialt i : → vise til eit synonym ↛ vise til eit antonym ↓ vise til eit meir spesifikt ord ↑ vise til eit meir overordna ord vær obs på dette (bajimussii -> bajimusas) ! }}} {{{ balloŋŋa balluvdna ballong kantuvra kántuvra }}} !!!te vs. re ieža = sjøl (om flere) !!!inc-listtut Til saman 604 nye ord. {{{ inc-today.csv: njenecagiella ___ n ___ nenetsisk språk ___ a2 itáliagiella ___ n ___ italiensk språk ___ a2 news.1056.missing_nouns.csv: áviisa ___ n ___ avis bálkkašupmi ___ n ___ pris| belønning| premie ___ Munnje lea stuora gudni oažžut dán bálkkašumi. ___ For meg er det en stor ære å få denne prisen. ávvudeapmi ___ n ___ feiring| fest ___ Saami álbmotbeaivvi almmolaš ávvudeapmi lea kulturviesus. ___ Den offisielle markeringen av samefolkets dag er på kulturhuset. proseassa ___ n ___ prosess indiána ___ n ___ indianer }}} Format som i xxx_smafin.txt {{{ amma ___ pcle ___ toki $ pas | päs }}} __TODO__: # Trond rydder listene og evt. sletter det som ikke er oversatt. # Ciprian lager om til xml-format i en egen fil. # BM redigerer i xmlMind. # Deretter legger Ciprian dem inn i de eksisterende filene. !!!kompileren (smenob) Etter at man har lagt til/sjekka ca 604 oversatte ord fra inc-lister pluss incliste fra "Čábbámus iđitguovssu" Når? 15. september skal det være klart for kompilering: * inc er inne * ingen dubletter * Lene: rydde opp i prop-listene * at alle lemmaene er i (i)sme-norm.fst * bruke (i)sme.fst for sub-lemmaer * at Actor er i actor-fila, G3 er i g3-fila osv. !!!Neahtta vs VD Cip oppdaterer nettordboka annakvar veke. !!!nob-x * sjekke mot nob-frekvensordliste eller ordbok * se kritisk på artiklene * bli enige om et link-system - f.eks. få "áhkku" og "áddjá" inn under "besteforelder" uten å skrive nye artikler (?) Mål for snuing: 1. oktober. !!!Hva er målet med ordboksarbeidet? * ordbøkene er nyttige for folk flest * vise kombinasjonen leksikografi/morfologi * vi kan samarbeide med de leksikografiske miljøene * vi trenger transferleksikon for MT !!!Enkeltord Vi gikk gjennom lista fra Sárá beaivegirji, se words/dicts/smenob/inc/inc_sara_beaivegirji_sorted.txt