Hei Trond!
Lähetän tässä sinulle kaksitasomalliin liittyviä tiedostoja. Kaksi=
tasomalli noudattaa vanhaa Markon translitteraatiota, jossa pehmeä ja
kova merkki oli merkitty numeroilla. Tekstit-tiedostossa nämä merkit
on merkitty kulmasuluilla, siis < ja >. Kaksitasomalli varmaan
kannattaisi muuttaa käyttämään uudempaa Marko-translitteraatiota,
jotta voisi suoraan testata tekstit-tiedoston teksteillä. Tiedostot ja
niiden sisältö ovat seuraavat:
Rules - kaksitasosäännöt Mariaut - matriiseiksi käännetyt säännöt (en
ole varma vastaavatko rules-tiedoston säännöt ja mariaut täysin
toisiaan, on mahdollista että ovat eri kehittelyvaiheista; muita
tiedostoja minulla ei kuitenkaan ole) Maridic - kielioppileksikot ja
root-leksikon pätkä MaSana - 15 000 sanan root-leksikko Arto Moision
sanakirjasta (muokannut Anu Laine = v. 1992) Erisnime - Anu Laineen
vanhassa Markossa (siis siinä joka on sinullakin) esiintyneistä
erisnimistä muokkaama tiedosto Lisays - Anu Laineen vanhasta Markosta
tekemä MaSana:n täydennys, jossa tosin suuressa osassa sanoja ei ole
käännöksiä Transl<lo - Markosta opastusteksti, josta näkyy
translitteraatio ja jossa on tekstiluettelo (muut asiat kannattaa
jättää huomiotta) Tekstit - Nykyisen Marko-korpuksen itäistä
kirjakieltä olevat tekstit mallin testausta varten
Koeta, saatko kaikki tiedostot näkyviin, ja ilmoita heti jos on
ongelmia. = Hyvää kurssimatkaa!
Terv. Jorma
*****************************************************************************
*****************************************************************************
** **
** Sisällys **
** **
** 1. YLEISTA: **
** **
** 2. TRANSLITTEROINTIPERIAATTEET **
** **
** 3. VALITTAVANA OLEVAT TEKSTIPAKETIT **
** **
** 4. TEKSTILUETTELO **
** **
*****************************************************************************
*****************************************************************************
1. YLEISTA:
Ohjelmassa haun kohteina käytetyt tekstit on translitteroitu
kyrilliseltä kirjaimistolta v. 1986-1998. Alkuperäistekstien valokopioita
säilytetään Turun yliopiston suomalais-ugrilaisessa kielentutkimuksessa.
2. TRANSLITTEROINTIPERIAATTEET
Translitteraatiossa kutakin venäläistä kirjainmerkkiä vastaa
täsmälleen yksi
latinalainen kirjain, joko pieni tai kapiteelikirjain. Niissä tapauksissa,
joissa länsimaisesta kirjaimistosta puuttuvat venäläisiä vastaavat
merkit, on
käytetty latinalaisen kirjaimiston kapiteelivariantteja.
Venäläisten aakkosten liudentumista ja liudentumattomuutta
osoittavat erikoismerkit on translitteroitu merkeillä < ja >.
Alkutekstien isot kirjaimet on translitteroitu pieniksi. Erisnimissä esiinty-
vät isot kirjaimet on ilmaistu lisäämällä kirjaimen eteen +-merkki, esim.
+podmarev (=3D Podmarev).
Kaikkien välimerkkien edessä ja jäljessä on välilyönti. (Kolmen pisteen
(...) muodostava välimerkki on sen sijaan säilytetty yhtenäisenä, ts. sen
eteen ja jälkeen tulee välilyönnit mutta ei pisteiden väliin.)
Marilaisten aakkosten vastineet ovat seuraavat:
a l x
W m c
b n C
v N S
g o H
d O >
e p Y
Z r I
z s <
i t E
j u U
k y A
f
Vastaavat kyrilliset löytyvät esim. seuraavista lähteistä:
V. M. Vasiljev, A. A. Savatkova, Z. V. Utshajev: Marijsko-russkij
slovar' (Marla-rusla muter), Joshkar-Ola 1991, s. 9;
Arto Moisiö Marilais-suomalainen sanakirja, s. VII.
Jälkimmäisen lähteen aakkosto ei sisällä vuorimarilaisia kirjaimia
W (etinen lavea illabiaalivokaali) ja I (etisempi redusoitunut
vokaali).
3. VALITTAVANA OLEVAT TEKSTIPAKETIT
1: Kaikki tekstit
Korpusta varten translitteroitu materiaali kokonaisuudessaan,
sekä itäistä että läntistä kirjakieltä. (Tekstinumerot
1-150 ja 301-331.)
2: Vain itäisen kirjakielen tekstit
Noin 4/5 teksteistä on itäistä kirjakieltä. (Tekstinumerot
1-150.)
3: Vain läntisen kirjakielen (vuorimari) tekstit
Noin 1/5 teksteistä; suurimman osan tästä käsittää Osip
Shabdarin romaanin ydYramaS korno vuorimarilainen käännös.
(Tekstinumerot 301-331.)
4: Vain kielioppiesimerkistöt
Kolmen kieliopin esimerkkilauseet. (Tekstit n:o 77-79.)
5: Vain Shabdarin romaani kummallakin kirjakielellä
Osip Shabdarin romaani ydYramS korno ('Naisen tie')
alkuperäinen itäistä kirjakieltä edustava versio sekä
sen vuormarilainen käännös. (Saatu prof. Kazuto
Matsumuralta. Tekstinumerot 127-150 ja 308-331.))
6: Vain Shabdarin romaani itäisellä kirjakielellä
(Tekstinumerot 127-150.)
7: Vain Shabdarin romaani läntisellä kirjakielellä
Huomaa, että tekstissä on käytetty vanhaa ortografiaa,
jossa jälkitavujen etiset vokaalit W ja I on merkitty
takaisten vokaalien a ja Y merkeillä. (Tekstinumerot
308-331.)
8: Asiatekstikokoelma
Suurin osa korpuksen teksteistä on kaunokirjallisia. Asia-
tekstikokoelmaan on pyritty valitsemaan joukko tyypiltään
näistä poikkeavia ja mahdollisimman selkeästi asiaproosaa
edustavia tekstejä. Huomaa, että näiden lisäksi korpus
sisältää myös muitakin asiateksteiksi luonnehdittavia
kirjoituksia. (Tekstinumerot 22, 24, 55-58, 60-64, 66,
68-69, 72-76, 97, 101, 112.)
9: Nykyaikaisia sanomalehtitekstejä (Kugarn'a 1994)
Arvostetun ja kieleltään hyvänä pidetyn viikottain ilmestyvän
sanomalehden tekstejä vuodelta 1994. (Lehden eri teks-
teillä ei ole omia numeroita, vaan koko tekstipaketti on
korpuksessa teksti n:o 126.)
10: Vain vanhan MARKO-korpuksen (1989-1997) tekstit
Nykyistä edeltävän version tekstit on otettu mukaan siltä
varalta, että joku aikaisemman korpuksen käyttäjä haluaisi vielä
tehdä tarkistuksia tai lisähavaintoja. (Tekstit 1-76.)
11: Suppea krestomatiatekstikokoelma (demonstraatioita
ja kokeiluja varten)
Käsittää Alho Alhoniemen Marin kielen lukemiston (1986) itäisen
kirjakielen tekstit yhtä laulua lukuun ottamatta. Tätä suppeata
tekstipakettia voi käyttää esim. silloin, kun kokeilee erilaisia
hakujen määrittelyjä. (Tekstit 1-17.)
4. TEKSTILUETTELO (numerojärjestyksessä)
Numerointijärjestys on se järjestys, jossa tekstit on alun perin
translitteroitu. Eri tekstit voivat olla hyvinkin eripituisia.
Itäisen kirjakielen tekstien numerot ovat välillä 1-299 ja länti-
sen kirjakielen tekstien numerot 300-.
Eräiden kirjoittajien syntymä- ja kuolinvuosi on ilmoitettu.
Teksteistä on ilmoitettu
- tekstin tai teoksen nimi
- kirjoittaja
- tekstikokoelma tai aikakausjulkaisu, johon teksti sisältyy
- kirjoista painopaikka
- alkuteoksen sivunnumerot
Tekstit 1-17 myös teoksessa A. Alhoniemi, Marin kielen
lukemisto. Helsinki 1986.
1. jodYS da vaSmut. Anduganov, Juri (1949-). Turku 1984. -
Alhoniemi, A.: Marin kielen lukemisto, s. 9.
2. uremYSte. Anduganov, Juri (1949-). Turku 1984. - Alhoniemi,
A.: Marin kielen lukemisto, s. 9-10.
3. kok keCe ErtYmek, uremYSte. Anduganov, Juri (1949-). Turku
1984. - Alhoniemi, A.: Marin kielen lukemisto, s. 10-11.
4. unala tolmaS. Anduganov, Juri (1949-). Turku 1984. -
Alhoniemi, A.: Marin kielen lukemisto, s. 11.
5. unaSte. Anduganov, Juri (1949-). Turku 1984. - Alhoniemi,
A.: Marin kielen lukemisto, s. 12.
6. sonarze (lydaS ogYl manYn). Solovjev, V.: maneS-maneS. S.71.
Joshkar-Ola 1975. - Alhoniemi, A.: Marin kielen lukemisto,
s. 13.
7. CYla raS. Solovjev, V.: maneS-maneS. S.19. Joshkar-Ola 1975.
- Alhoniemi, A.: Marin kielen lukemisto, s. 13.
8. jYdalZYm Camanen. Solovjev, V.: maneS-maneS. S.23.
Joshkar-Ola 1975. - Alhoniemi, A.: Marin kielen lukemisto,
s. 13.
9. kO sajYnrak SojYSteS. Solovjev, V.: maneS-maneS. S.75-76.
Joshkar-Ola 1975. - Alhoniemi, A.: Marin kielen lukemisto,
s. 14-15.
10. meraN. Kitikov, A.E. (toim.): kysleze tukYm. S.53-54.
Joshkar-Ola 1979. - Alhoniemi, A.: Marin kielen lukemisto,
s. 15-16.
11. er kugYza. Aktsorin, V.A. (toim.): toSto marij oj-vlak.
S.45. Joshkar-Ola 1972. - Alhoniemi, A.: Marin kielen
lukemisto, s. 16-17.
12. kuze marij kalYk tamaka SupSaS da araka jyaS tunemYn.
Aktsorin, V.A. (toim.): toSto marij oj-vlak. S.68-71.
Joshkar-Ola 1972. - Alhoniemi, A.: Marin kielen lukemisto,
s. 18-22.
13. odo karman. Aktsorin, V.A. (toim.): toSto marij oj-vlak.
S.120-122. Joshkar-Ola 1972. Alhoniemi, A.: Marin kielen
lukemisto, s. 22-26.
14. Codrase urgYzo. Pinjasov, Jakov: ojlYmaS den jomak-vlak.
S.139-143. Joshkar-Ola 1965. -Alhoniemi, A.: Marin kielen
lukemisto, s. 26-31.
15. ENYZ pogYmo godYm. Vasiljev, Ilja (1914-1974): izi kuE.
S.32-36. Joshkar-Ola 1965. - Alhoniemi, A.: Marin kielen
lukemisto, s. 34-37.
16. +jYlanda. Tshavajn, S.(1888-1942): ojpogo. S.81-83.
Joshkar-Ola 1957. - Alhoniemi, A.: Marin kielen lukemisto,
s. 38-47.
17. maneS-maneS (onCYlmut olmeS). Solovjev, V.: maneS-maneS.
S.3-4. Joshkar-Ola 1975. - Alhoniemi, A.: Marin kielen
lukemisto, s. 46-49.
Tekstit 18-31 myös teoksessa T. A. Sebeok, Cheremis Literary
Reader. Louvain 1978.
18. kol kuCYmaSte. Ivanov, V. M.(1923-1971), ErgYm dene
mutlanYmaS, s. 13. Joshkar-Ola 1957. - Sebeok, Thomas A.:
Cheremis Literary Reader. S.25.
19. mo tugaj klimat? Oreskin, N. K., SoCmo jYlme. tyNaltYS
SkolYn kumSo klasSYlan ludSaS kniga, s. 207. Joshkar-Ola
1956.- Sebeok, Thomas A.: Cheremis Literary Reader. S.25-26.
20. +mosko burmistr. Tshetkarev, K. A.(1910-1956), nYlle ik SoA,
s. 11-12. Joshkar-Ola 1955. - Sebeok, Thomas A.: Cheremis
Literary Reader. S.26-27.
21. +rita sadovod. Lekajn, N. S. (J.)(1907-1960), OrYktarYSe
lYve, s. 11-14. Joshkar-Ola 1958. - Sebeok, Thomas A.:
Cheremis Literary Reader. S.28-30.
22. +s +g +Cavajn (1888-1942). sYlnemut pogo, s. 10. Joshkar-Ola
1960. - Sebeok, Thomas A.: Cheremis Literary Reader. S.34.
23. kniga - joCan Sym joltaSYZe. Stoljarov, V., literatura -
ilYSYn vyrSerZe, s. 159. Joshkar-ola 1960. - Sebeok, Thomas
A.: Cheremis Literary Reader. S.35.
24. respublikYn olaZe-SamYC. +joSkar-+ola. marijskij +a+s+s+r-
lan XXX ij, s. 37-43. Joshkar-Ola 1951. - Sebeok, Thomas
A.: Cheremis Literary Reader. S.41-46.
25. +landYSevYn eSYZe. Nikolajev, S. N.(1908-), Kum pesa, s.
145-159. Joshkar-Ola 1956. - Sebeok, Thomas A.: Cheremis
Literary Reader. S.47-60.
26. pisatel< den... Rybakov, N. (M.) F.(1932-), mik-mek, s.
42-44. Joshkar-Ola 1959. - Sebeok, Thomas A.: Cheremis
Literary Reader. S.61-63.
27. +Elnet. Tshavajn, S. G.(1888-1942), Elnet, s. 3-8.
Joshkar-Ola 1958. Sebeok, Thomas A.: Cheremis Literary
Reader. S.64-68.
28. usta kid. Isakov, K. A.(1914-1973), Sym vurgYZeS, s. 13-18.
Joshkar-Ola 1959.
- Sebeok, Thomas A.: Cheremis Literary Reader.
S.69-74.
29. kud voCko myj. Shketan, M.(1898-1937), mYskara, s. 115-122.
Joshkar-Ola 1954. - Sebeok, Thomas A.: Cheremis Literary
Reader. S.74-80.
30. palaS lijdYme Conan ajdeme. Tshehov, A. P., marlan kajSaS
ydYr, s. 31-33. Joshkar-Ola 1957. - Sebeok, Thomas A.:
Cheremis Literary Reader. S.81-83.
31. kO vinamat? Jatman, M., ojlYmaS-vlak (1927-1937), s. 17-19.
Joshkar-Ola 1960. - Sebeok, Thomas A.: Cheremis Literary
Reader. S.83-85.
32. ilYS savYra. Jevsejeva, Marija(1920-1970): ilYS savYra.
S.3-9. Joshkar-Ola 1968.
33. +savak vel. Oraj, Dim.(1901-1950): Colga SydYr. S.5-11.
Joshkar-Ola 1973.
34. dezertir-vlak. Tshavajn, S.(1888-1942), marij literatura 6.
S.78-88. Joshkar-Ola 1973.
35. +Ukej +egorov. Vasin, K.(1924-),marij literatura 6. S.25-30.
Joshkar-Ola 1973.
36. +sakeva. Juzykajn, A.M.(1929-), marij literatura 6. S.42-48.
Joshkar-Ola 1973.
37. anUkYn kuvavaZe. Beljajev, K.I.(1910-1964), marij
literatura 6. S.57-62. Joshkar-Ola 1973.
38. CYn lymZO +kuz
Last modified: Sun Jan 11 13:45:38 2004