Sjå [dette møtedokumentet|../../admin/linguists/200423_AvgrenseAvleiing.html] (frå 23.4. 2020) Her held vi fram frå møtet: !!!Konklusjon frå møtet * Vi skal endre +Comp og +Superl til +DerN+Der/Comp+A og +DerN+Der/Superl+A (nummeret på DerN må vi sjå på) ** dette medfører endringer i filene for (signer når det er gjort) *** NDS *** Apertium *** Gramchecker? *** cgi paradigmegenerator *** andre? * Vi bør observere og deretter forbetre 12345-grammatikken, og evt andre begrensninger * måtar å avgrensa derivasjonane på: ** Bare for normativ HFST: ved hjelp av Der12345-grammatikken ** For all analyse/generering: ved hjelp av fortsettingsleksikoner ** For all analyse/generering: ved hjelp av diakritiske flagg som også fungerer på desc (Px er løst slik) ** Leksikalisere selve derivasjonen, feks. buoremusvuohta ** Leksikalisere derivasjoner som er utgangspunkt for nye derivasjoner * I smj endrer vi slik at på -dibme og -ahtes ikke får Comp og Superl (ahtes skal få nummer likt eller etter Comp/Superl) !!!Steg framover # Legge Der/ til Comp/Superl # Deretter dei andre stega ovafor !!Derivasjoner som vi bør se på ! Caritiv med komparativ, når brukes det? I korp finnes noen få reelle eksempler (her trenges bedre disambiguering), så vi kunne ihvertfall begrense til bare leksikaliserte -heapme: * [Korpsøk sme -heapme Comp|http://gtweb.uit.no/korp/#?stats_reduce=word&cqp=%5Bmsd%20_%3D%20%22Comp%22%20%26%20lemma%20%26%3D%20%22heapme%22%5D&search_tab=1&sort=keyword&hpp=1000&search=cqp] * [Korpsøk sme -heapme Superl|http://gtweb.uit.no/korp/#?stats_reduce=word&cqp=%5Bmsd%20_%3D%20%22Superl%22%20%26%20lemma%20%26%3D%20%22heapme%22%5D&search_tab=1&sort=keyword&hpp=1000&search=cqp * Her er det meste ikke komperlativ. Her trenges god disambiguering] * Eksempler på bruk: ** __Geahnohat__ bealli dán riiddus lea ge eahpitkeahttá palestiinnálaččat. ** Sámit leat čuđiid jagiid čađa leamaš čađat __geahnohit__ ja vuoittahalli bealli riidduin guovlluid ja luondduresurssaid alde . ** ILO-konvenšuvdna lea __geahnoheabbo__ go kommišuvdna meahcceelliid várás ** Vuosttažettiin adnui sámi kultuvra __árvvoheabbon__ go dáža kultuvra 100 jagi dassá . ** ... vai eai manaše ruoktot vel ain __suruheabbon__ go ledje dalle_go bohte girkui. ** Norgga bahkken Davvi-Norgii lea dađistaga duvdán daid kultuvrralaččat __fámoheabbo__ sápmelaččaid eret . ** gutneheappo mielkkeheabbon návccaheappot ** kunne man tenke seg arvvoheabbo? * Eksempler på skrivefeil som blir skjult i 2018-korp: 27 bálkkáhit, 10 jávohit, 6 deattohit, 3 muosehit, 3 muittohit, 3 gieđahit, 2 vuođuhit, 2 mielahut, 2 lobihit, 2 báguhit, 2 arvvohit, – adv? viegada nu arvvohit ja ilolaččat 1 skihkahit, 1 sahkuhit, 1 rásehit, 1 lihkuhit, Háliidan lihkuhit njenecaid dan jagi davvi álbmogin . 1 leabohit, 1 himuhit, 1 govttohit, 1 dolahit, 1 bealehat, 1 arvvoheabbo, Don leat dál roahkkadeabbo ja arvvoheabbo, ja maiddái duostileabbo cuiggodit vearrivuođa ja duolbmama máid vásihat dán áigodagas. (her brukes ordet feil, men det kunne vært brukt?) 1 arvvohat, !!Logg over hva som blir gjort, med dato * 2020-05-20 sme: kommenterte ut stier for Der/Car for alleredere deriverte ord * 2020-05-20 sme smj sma smn endret tagger fra +Comp/+Superl til +Der/Comp og +Der/Superl, * 2020-05-26 smj: endra Der1+Der/Dimin til Der2+Der/Dimin * 2021-01-07 sms: sendt epost til jaska og trond om +Comp/+Superl til +Der/Comp og +Der/Superl * 2020-06-19 smj removed Der/Comp and Der/Superl path from lexicon DIBME and AHTES * 2021-01-13 sme: har sett på -heapme + Der/Comp i korpus og forbedret disambigueringa. -heapme + Der/Comp-formene skjuler mange skrivefeil, så man kan forbedre Divvun-programmet mye ved å fjerne stien fra det generelle forts.leksikonet, og heller lage eget forts.leksikon for de ordene som virkelig brukes * 2021-01-19 sme: kommenterte ut flere stier med Der/Car og komparasjon * 2021-01-19 smj: moved Der/Dimin form der1 to der2 * 2021-01-26 sme sma: endra +Comp og +Superl til +Gram/Comp og +Gram/Superl for adverb * 2021-01-26 sme: la -heapme adjektiver som kan gi infitivsanalyse til JEAGOHEAPMI_NOCOMP