Etymologiadata:Rakenne

Sanatista

Tämä sivu kuvaa wikin etymologisessa tietokannassa seuratut käytäneet.

Sivujen osoitteet

Kunkin tietokannan sivun nimi on muotoa Etymologiadata:[kielikoodi]:[sanan lemma-asu]. Vertaa Sanat:Kielikoodit ja alla osio Lemmatisointi.

Käsitellyt kielimuodot

Lemmatisointi

Jokaisen vakiintuneen kirjakielen sanat luodaan tietokantaan oletusarvoisesti kirjakielen mukaisessa asussa, myös kyrillisiä aakkosia käyttävien kirjakielten. Kyseeseen tulevat ainakin seuraavat kielet:

  • Suomi, vepsä, viro
  • Etelä-, pohjois- koltan-, inarin-, kildininsaame
    • Ovatko muiden saamelaiskielten ortografiat vielä tarpeeksi vakuuntuneita?
  • Ersä, mokša
  • Niittymari (jos omana kielimuotonaan)
  • Udmurtti, komi
  • Unkari (merkitäänkö ë?)
  • Tundranenetsi, nganasaani

Seuraavien kielten kohdalla tavoitteena on seurata olemassaolevien laajojen murresanakirjojen asuja:

  • Karjala: Karjalan kielen sanakirjan lemma-asu
  • Vatja: Vadja keele sõnaraamatin lemma-asu

Ainakin seuraavien kielten tai kieliryhmien käsittely ovat avoimia kysymyksiä:

  • Inkeroinen (Inkeroismurteiden sanakirja ei systematisoi sanueidensa lemmatisointia)
  • Akkalansaame, ? keminsaame
  • Mansi
  • Hanti
  • Metsänenetsi, enetsikielet
  • Selkuppi
  • Kamassi
  • Matori (kelpaavatko Die matorische Sprache:n osittain rekonstruoidut hakusanamuodot?)