!!!Gøteborg-oppsummering fyrste føredrag * bra * kvifor gjekk det bra? * kommunestyre-dømet fungerte bra * fst-gjennomgangen fungerte * diskuterte cg-analysen av "vi ville kaste stein" (ville som pret) * grammatikkontroll, svensk frå Lingsoft, sme frå oss (Francis) * begeistring etterpå andre føredrag * ok Lars Borin: * kan ikkje koma ei heil veke i desember * kan koma ei heil veke i februar * estarane ei heil veke i jan/feb - overlapp? ikkje heilt men delvis? * kan ein av programmerarane koma? manglande framgang med deepdict * ciprian om deepdict: han har laga demo, har stoppa ved lemmatiseringa ** kva slags lemma ved dynamisk samansetjing? ** kva slags lemma ved avleiing? v -> n, v som lemma istf n {{{ hus+N+Neu+Sg+Cmp#bygge+V+Der/ing+N+Fem+Sg }}} !!kva slags lemma ved dynamisk samansetjing? Sletta alle taggar før +Cmp og # (inkl. +Cmp) => hus#bygge+V+Der/ing+N+Fem+Sg !!kva slags lemma ved avleiing? v -> n, v som lemma istf n transformera v+lemma + derivasjon til n-lemma: #. trekkja ut alle der-strengar: #. generera grunnform (derivert lemma) #. snu #. komponer {{{ hus#bygge+V+Der/ing+N+Fem+Sg bygge+V+Der/ing+N+Fem+Sg -> bygging+N+Fem+Sg => hus#bygging+N+Fem+Sg }}} {{{ 1. $[ +Der/ing +N ? +Sg ] ; -> ny fst med berre Der/ing 2. projiser +N ... +Sg på nedsida bygge+V+Der/ing+N:bygging bygge+V+Der/ing+N...+Sg:bygging+N...+Sg ny regel projisering 3. snu derfst 4. derfst .o. nob.fst bygging+N...+Sg:bygge+V+Der/ing+N .o. bygge+V+Der/ing+N...:bygging => bygging+N...+Sg:bygging }}} !!!Stor eng - glyf basert på n eller N? * no er det éin eng (eitt kodepunkt) som blir brukt for to ulike typografiske engar, ein N-lik og ein n-lik. * fontar varierer etter kva form dei bruker * ingen av formene er akseptable for alle, for kvart språk er det anten eller * ei kløyving i ulike kodar for ulike versjonar av 'eng' er den einaste fungerande løysinga - spørsmålet er berre kven som skal endra seg * kløyvinga vil føra til store kostnader for dei som må endra seg * eit mogleg prinsipp: den eldste forma står, den andre får ein ny kode * uansett problematisk, fordi kostnader og storleikstilhøve lett gjer at konflikten kan tolkast inn i ulike ramer basert på gamle historiske tilhøve * difor best å senda heile historia opp til politikarane, og be dei avgjera Michael: "I agree that the N-form, not the n-form capital eng should be the default. It is historically the older form." ||Språk || n/N || Talarar || Land | Afrikanske språk: | n | - | - | Bari | n | 750 000 | Sør-Sudan, Uganda, Den Demokratiske Republikken Kongo | Bemba | n | 3 600 000 | Zambia | Dinka | n | 1 400 000 | Sør-Sudan | Ewe | n | 3 600 000 | Ghana, Togo | Fula | n | 25 000 000 | Benin, Burkina Faso, Chad, Gambia, Guinea, Kamerun, Mali, Mauretania, Niger, Nigeria, Senegal, den Sentral-Afrikanske Republikken, Sierra Leone, Sudan, Togo | Ganda | n | 1 400 000 | Uganda | Mandingespråk: | n | - | - | kassonke | n | 1 600 000 | Mali, Senegal | mandinka | n | 1 300 000 | Gambia, Senegal | kita maninka | n | 450 000 | Mali | jahanka | n | 30 000 | Guinea | marka | n | 230 000 | Burkina Faso | bambara–dyula | n | 4 000 000 | Burkina Faso, Elfenbeinskysten, Mali | aust-maninka | n | 3 300 000 | Guinea, Mali, Liberia, Senegal, Sierra Leone, Elfenbeinskysten | bolon | n | 23 000 | Burkina Faso | sinikere | n | 6 000 | Burkina Faso | Songhayspråk: | n | - | - | zarma | n | 2 500 000 | Niger | koyraboro senni | n | 400 000 | Mali | koyra chiini | n | 200 000 | Mali | nordleg songhay | n | ? | Niger | Tonga | n | 1 100 000 | Zambia, Zimbabwe, Mozambique | Wolof | n | 4 200 000 | Senegal, Gambia, Mauretania | Amerikanske språk: | ? | - | - | O'odham | ? | 9 750 | USA, Mexico | Australske språk: | ? | - | - | Bandjalang | ? | 100 | Australia | Yolngu | ? | ? | Australia | Samiske språk: | N | - | - | enaresamisk | N | 300 | Finland | lulesamisk | N | 1 000 | Noreg, Sverige | nordsamisk | N | 21 000 | Finland, Noreg | skoltesamisk | N | 400 | Finland Kjelde: engelsk wikipedia Neste steg: * skriva ein rapport til UD/FAD/Sametinget, og be dei avklara på politisk og multilateralt nivå kven som skal endra seg. Spørsmål: * skal vi ha med estimat over eksisterande korpusstorleik? Programvare som må endrast?