Etymologiadata:Rakenne
Tämä sivu kuvaa wikin etymologisessa tietokannassa seuratut käytäneet.
Sivujen osoitteet
Kunkin tietokannan sivun nimi on muotoa Etymologiadata:[kielikoodi]:[sanan lemma-asu]
. Vertaa Sanat:Kielikoodit ja alla osio Lemmatisointi.
Käsitellyt kielimuodot
Lemmatisointi
Jokaisen vakiintuneen kirjakielen sanat luodaan tietokantaan oletusarvoisesti kirjakielen mukaisessa asussa, myös kyrillisiä aakkosia käyttävien kirjakielten. Kyseeseen tulevat ainakin seuraavat kielet:
- Suomi, vepsä, viro
- Etelä-, pohjois- koltan-, inarin-, kildininsaame
- Ovatko muiden saamelaiskielten ortografiat vielä tarpeeksi vakuuntuneita?
- Ersä, mokša
- Niittymari (jos omana kielimuotonaan)
- Udmurtti, komi
- Unkari (merkitäänkö ë?)
- Tundranenetsi, nganasaani
Seuraavien kielten kohdalla tavoitteena on seurata olemassaolevien laajojen murresanakirjojen asuja:
- Karjala: Karjalan kielen sanakirjan lemma-asu
- Vatja: Vadja keele sõnaraamatin lemma-asu
Ainakin seuraavien kielten tai kieliryhmien käsittely ovat avoimia kysymyksiä:
- Inkeroinen (Inkeroismurteiden sanakirja ei systematisoi sanueidensa lemmatisointia)
- Akkalansaame, ? keminsaame
- Mansi
- Hanti
- Metsänenetsi, enetsikielet
- Selkuppi
- Kamassi
- Matori (kelpaavatko Die matorische Sprache:n osittain rekonstruoidut hakusanamuodot?)