!!! Võru Oahpa koosolek 30.03.2016 !!! Osalejad Jack, Heli, Sulev !!!Päevakord * FST * Oahpa * Eeltöö (materjalide ettevalmistamine FST ja Oahpa jaoks) !! FST ! Verbid Sulev tegi olemasolevad yaml-testid lõpuni (täiendas). Heli paneb püsti Morfa-C verbid. Sealt tuleb ideid, milliseid verbe vaja FST-sse lisada. Oahpa sõnastiku suurus on praegu 1300 sõna. ! Morfa-C jaoks vajalikud nimisõnad Jack on pannud suurema osa lexc-sse sisse. Sellega seoses tuleb kirjutada uusi jätkusõnastikke. Eraldi muutetüübid (ja siis ka yaml-testid) erineva tüvevokaaliga muidu sama tüüpi sõnade jaoks. {{{ hapnõqkurgiq hapukurk' gen hapnõkurgi vanaimä gen vanaimä part vannaimmä pl part vannoimmi linnukʼ pelmeenʼ keefiirʼ }}} ! Korrektuuritabelid Jack saatis noomenite korrektuuritabeli, Sulev tegeleb selle parandamise ja kommenteerimisega. ! Võru keele morf. analüsaator Võru-eesti masintõlke jaoks oleks võru keele morf. analüsaatorit juba lähemal ajal vaja. Kuidas FST sõnastiku katvust (võimalikult automaatselt) suurendada? Sulev saab synaq.org sõnastiku andmebaasi. Seal on küll teised tüübinumbrid. Soovitav oodata võru morf. analüsaatori integreerimisega masintõlkesse sügiseni. Hea treenimismaterjal - lasteraamatud, mis on olemas mitmes keeles. Paralleelkorpuses on "Suur must koer". Muidu on võru keelde tõlgitud ka "Punamütsike" ja "Sipsik". !! Oahpa ! Morfa-C Kordusi ei esine nüüd enam korraga näidatava 5 lause hulgas. Järgmised ülesanded: * Korduste vältimine järjestikustes lausete hulkades. * Markeerida negatiivse tähendusega verbid, et need ilmuksid harva. Sama tegelikult ka nimisõnade puhul - igas semantilises klassis on sõnu, mis on harva kasutatavad. * Morfa-C verbiülesanne püsti panna. Selleks on vaja lausemalle. Heli saadab Sulevile mingid mallid eestikeelsete lausetega, mis on tehtud sme eeskujul. ! Kasutajaliidese keele vahetus Mõnedes veebilehitsejates endiselt ei tööta. !! Eeltöö ! Adjektiivide eraldamine nimisõnadest Sulev jätkab, kui aega saab. ! Võru eesnimed Sulev küsib nimespetsialistidelt. ! Sõnade häälduste andmebaas Kaur lubas, et saab kevade jooksul. faili nimi = sõna, mitte number !! Muu Võru keele kõnesüntees [http://www.eki.ee/~indrek/voru/index.php] Kasutada saab kaht häält: hellä ja sulev2 (sulev on vana versioon, seda ei maksa). Kui Oahpas kasutada, siis oleks hellä ilmselt kenam. Või siis varieerida, et üks hääl loeb üht ja teine teist lauset. Võimalik kasutuskoht: Morfa-C küsimuste ettelugemine. !! Järgmine koosolek K, 20. aprill kell 10.