Nordplus-møte 14.8. 2013 Saker: * status+spørsmål for kvart språk * avsluttinga av prosjektet !!!Status+spørsmål for kvart språk !!sme Ferdig neste vek om eg ikkje blir enno meir førstyrret. !!sma Ferdig neste veke om eg kan arbeida uforstyrra. !!smj 1506 $-feil + mange andre feil. Folk bruker Divvun-stavekontrollen, så det er få feil i nye tekstar. !Interjeksjonar Kva gjer vi med interjeksjonar? Særleg slike som er klart muntlege i stil og ortografi. Døme, med noverande oppmerking: * hehe∞(nor) * Usj∞(nor) * haaaahaaaa! * Wups! * Hååååhååååj$ Håhåj Døme frå islandsk (vi merkar opp slik dersom vi ikkje vil ha med orda i testmaterialet): * óóóóógeðslegt * hahahaha∞(sla) der ‘sla’ = slang. !Andre problemfeil Desse vart diskuterte, og løysingar antyda som vist nedanfor: * (vuodoskåvlås ålgus vádtsám)¥(sub,nob-smj|vuodoskåvlåjn gærggam) ienep suohtas€(phr| * … (vuosedit ja informerit)€(infl,inf-sup|vuosedittjat ja informeritjit))¥(missing| mijá kultuvra birra. * (Saemiedigkie goh¥0 reereme)€(w|Saemiediegkie reerenasse)£(case,nom-ess|Saemiedigkie reerenassine) * (suv mañen$(ascii|maŋen) gievkanij viegaj)¥(redun;x|suv gievkanij viegadij) !!kal Elin har fått ny datamaskin igjen, og har måtta bruka tid på å få ting til å fungera igjen. Kommando for å finna alle $-feil: {{{$ find . -name '*correct.txt' | xargs cat | tr ' ' '\n' | fgrep '$' | sort | less / see / wc -l}}} der: * {{less}} viser lista med $-feil i terminalen * {{see}} opnar lista med $-feil i SubEthaEdit * {{wc -l}} tel og skriv ut kor mange $-feil det finst Har framleis kring 500 feil, men reknar med å få meir tid til å arbeida framover. !!isl Islandsk har no minst 1000 $-feil men det kan vera feil i oppmerkinga. !Spørsmål Kva gjer ein med manglande mellomrom? * Setning hér.Og setning hér. - (hér.Og)¢ - nei, bør vera (hér.Og)$(... Vil ikkje forkortingar og internettadresser som: * p.g.a. * www.eretre.eretta.com bli kunna blanda saman med feil av typen manglande mellomrom? Nei, berre unnataksvis. Stavekontrollane bør klara å oppdaga manglande mellomrom, og dei skal difor merkast som vanlege skrivefeil. Mange slike feil: * lítin$(con,suff,nn-n|lítinn) !Islandsk stavekontroll Har fått svar frå Púki, berre for Office/Win. Men Hulda har tidlegare fått e-post om at det finst eit kommondolinjeverkty. Ho skriv tilbake og ber om å få bruka det, med kopi til Sjur og Fridrik. !!!Avsluttinga av prosjektet Elin klarar ikkje å bruka alle timane sine før prosjektet sluttar, så Hulda kan bruka noko av dette for å merka opp fleire feil. Teknisk arbeid: * avslutt og korriger oppmerkinga - alle lingvistane * oppdater testbenken - Sjur ** støtte for Word-/PLX-stavekontrollen - ferdig ** oppdaterte grafar + html-tabellar * test stavekontrollane - Sjur Skrivearbeid: * dokumentasjon for kvart språk * rapport for kvart språk - innsamling og oppmerking ** Hvilke tekster ** Antall $-feil, + talet på andre feil som er merka opp ** Tidsbruk ** antall ord for heile korpuset ** klassifiseringa av feil som er brukt i oppmerkinga * rekneskap + samla tidsbruk - Inga * samla rapport med: ** evaluering av stavekontrollane, kvar for seg og samla ** evaluering av prosjektet Datoar: 26. august - neste møte, kl 12 norsk tid 30. august - siste arbeidsdag for Inga 15. oktober - ferdig med all oppmerking og skriving (både doku og rapport) 15. november - prosjektet blir avslutta