Etymologiadata talk:Rakenne

Sivun sisältöä ei tueta muilla kielillä.
Sanatista

Allaoleva siirretty sivulta Keskustelu Sanatista:Etymologiawiki. --J. Pystynen (lähetä viesti)

Etäsukukielten sanojen mallineistamisesta ehdottaisin seuraavaa: Yleistajuisella sivulla olevaan mallineeseen sivun tekijä kirjoittaa kielen nimen ja sanan, ja malline luo siitä linkin sanan etymologiadatasivulle, jolla on sanasta sekä kirjakielen kyrillinen että murresanakirjan asu, ja kumpikin niistä avaa linkin näitten sanakirjojen sivuille. Yleistajuisen sivun kirjoittajan on silti kirjoitettava sanan merkitys suomeksi auki, ja se merkitys kannattaa aina kun mahdollista suoraan ottaa näistä kielistä suomeen tehdyistä sanakirjoista. Joista kai yksikään ei ole verkossa, eli niitä ei voi linkittääkään. Mutta ensin tehdään joukko yleistajuisia sivuja, linkkimallineet lisätään saman tien tai heti kun se on teknisesti mahdollista, ja ne etymologiadatasivut lisätään sitten jossain vaiheessa. Eniten hyötyähän niistä on sitten kun niihin voidaan tehdä hakuja ym.--Sjunttila (keskustelu) 24. huhtikuuta 2020 kello 17.40 (EEST)

Tämä kuulostaa oikein hyvältä ja selkeältä! Niitä mallineita on sitten helppo lisätä jälkikäteen. --Sholopainen (keskustelu) 24. huhtikuuta 2020 kello 17.43 (EEST)
Olen aika lailla samoilla linjoilla. Tietokantasivuille en tosin ottaisi käytänteeksi, että sana itsessään linkittää yhtään minnekään wikin ulkopuolelle, vaan jokaisen ulkopuolisen linkin tulee selvästi ilmoittaa mikä nimenomainen lähde on kyseessä, eteenkin koska vaihtoehtoja voi olla monia. Tätä muiden kuin kantasuomen etymologiadatasivujen rakenteen ja muotoilun keskustelua ei ole yleensäkään muuten juuri edes vielä käyty, asia on aika monen niistä kohdalla melko monimutkainen.
Teknisesti olisi mahdollista että etäsukukielten sanoille määritellään tietokantaan ominaisuus "lyhyt suomenkielinen glossi" tms. ja mallineella tämä haetaan sieltä automaattisesti, samoin myös että niille määritellään standardiromanisaatio tms., mutta ensi vaiheessa eteenpäin pääsee tosiaan sillä että lisäämme yhden linkin ja merkityksen sitten vaikka käsin.
Oleellinen asia josta tätä varten tarvittaisiin jokin ainakin alustava sopimus on, mikä on muiden kielten sanojen lemma-asu tietokannassa? Varmasti kirjakielen asu vakiintuneille kirjakielille (alustavasti oli puhetta että näin myös kyrilliset), mutta hankalampia ovat
  • kielet joilla ei ole yhtä vakiintunutta standardia (esim. karjala, vatja — joiden kohdalla voimme kyllä seurata YSuS:n käytäntöä seurata KKS:n ja VKS:n lemmoja)
  • kielet joilla ei ole mitään kirjakieltä.
--J. Pystynen (lähetä viesti) 24. huhtikuuta 2020 kello 18.04 (EEST)
Romanisointiajatusta en oikein ymmärrä. Näitä kieliähän kirjoitetaan kyrillisin kirjaimin, eikä kyrillisiä ole mitenkään hankala lukea tai vaikea opetella. Eri kielten translitterointisäännöt taas eivät ole mitenkään yksiselitteisiä eivätkä muuttumattomia. Tietenkin myös kirjakielet muuttuvat, mutta translitteraatiot eivät pelkästään muutu vaan myös vaihtelevat kielestä ja kirjoittajasta toiseen.
Minusta etymologiadatasivuilla kukin sivu pitäisi nimetä (eli lemma-asu antaa) kirjakielen asun mukaan, oli se kummalla kirjaimistolla tahansa (siis kyrillisillä kirjoitettavissa kielissä kyrillisillä). Jos yksiselitteistä kirjakieltä ei ole, niin tärkeän, mielellään foneemikäytäntöä noudattavan murresanakirjan (KKS, VS jne.) mukaan. Sitten otsikon alle tosiaan linkit erikseen kuhunkin sanakirjaan, ja ne linkit sitten niitten sanakirjojen käytännön mukaan, eli ersän tapauksessa siinä on MdWb:n SUT-asu ja Erzjanj-ruzonj valksin asu kyrillisillä allekkain. --Sjunttila (keskustelu)
Murresanakirjojen seuraaminen onnistuu siis kyllä joillekin kielille. Lähes kaikille Siperian kielille sen sijaan valitettavasti ei. Tästä aiheesta olisi syytä laatia kattava työlista, josta ilmenee mitä on päätetty ja mitä ei, itsekin äsken unohdin että jo sovimme että käytetään kyrillistä kirjakieltä jos sellainen on. --J. Pystynen (lähetä viesti) 24. huhtikuuta 2020 kello 18.23 (EEST)
Avasin käytänteiden kuvauksen sivulle Etymologiadata:Rakenne. --J. Pystynen (lähetä viesti) 24. huhtikuuta 2020 kello 18.34 (EEST)
Jatketaanko rakenteista keskustelua rakenne-sivun keskusteluosiossa? Tai siis, tämä lienee loogista? --Sholopainen (keskustelu) 24. huhtikuuta 2020 kello 19.35 (EEST)
Joo, jatketaan rakennekeskustelua siellä. (Taidan itse asiassa siirtää tämän keskustelunpätkän tästä jo sinne.) --J. Pystynen (lähetä viesti) 24. huhtikuuta 2020 kello 19.45 (EEST)
Tämä nyt siirretty, uusia aiheita sopii avata alle. --J. Pystynen (lähetä viesti) 24. huhtikuuta 2020 kello 20.08 (EEST)


Unkari

Juhon mainitsema unkarin ë on mielestäni yleistajuisten sivujen kannalta vähän turha, koska sitä ei käytetä nykyisessä kirjakielessä. Siis yleistajuisen sivun lukija pahimmassa tapauksessa ihmettelee, miksi sana on kirjoitettu eri tavoin kuin Suomi-unkari-sanakirjassa. Tietysti jos ë kuitenkin pyörii tutkimushistoriasivuilla ym., jossa sille on oikeasti käyttöä, on toki hassua, jos unkarin sanoja kirjoitetaan samassa sanakirjassa kahdella eri tavalla. Tietysti tämä nyt on ehkä vähän marginaalinen ongelma tämän itämerensuomikeskeisen sanakirjan kannalta, mutta hyvä tässäkin on jokin linja tietysti olla.

Jos näille kyrillisillä kirjaimilla kirjoitettujen kielten sanoille tulee mallineita, joista näkee eri kirjoitusasuja, pitäisikö unkarin sanoille jossain vaiheessa tehdä malline, jota klikkaamalla pääsee sivulle, jossa on esim. murremuotoja tai muinaisunkarin muotoja? Meinaan siis silloin, jos niistä on jotain iloa (vähän samaan tyyliin kuin UEW:ssä). Yleistajuisille sivuille ei kannattane mitään unkarin variantteja kirjoittaa auki, menee muuten liian sekavaksi. --Sholopainen (keskustelu) 24. huhtikuuta 2020 kello 20.17 (EEST)

Tämä sivu koskee toki ainoastaan tietokannan käytänteitä, ei yleistajuisia sivuja.
Eri lähteiden mukaiset murremuodot, jos niitä jossain vaiheessa lisätään, olisi minusta havainnollisinta listata jossakin muodossa ihan suoraan tietokannan sivulla itsellään. Näihin voi tietysti myös sisällyttää ë-muodot vaivatta. Menee tässä vaiheessa aivan liian työlääksi jos rupeamme luomaan tsiljoonaa sivua erikseen jokaista yksittäistä lähdettä tai pitäjää kohden. (Ehkä sellaisetkin silti joskus aikanaan 2050-luvulla tms. tulevat…) --J. Pystynen (lähetä viesti) 24. huhtikuuta 2020 kello 20.34 (EEST)
Hyvä, siis en itsekään meinannut mitään pitäjäkohtaisia sivuja, vaan tyyliin sivua "unkarin fel", josta sitten löytyy e-muodot ja ö-muodot ja vanhan kirjakielen muodot. Siis että tietokannan sivulla X kun mainitaan unkarin sana fel, niin sitä klikkaamalla pääsee sivulle, jossa nuo muut relevantit muodot on lueteltu. Ilmeisesti siis molemmat tarkoitimme samaa?--Sholopainen (keskustelu) 24. huhtikuuta 2020 kello 22.02 (EEST)

Samojedikielet

Kuinka monen samojedikielen muotoja on tarkoitus siteerata yleistajuisilla sivuilla? Tästä ei ole oikein sovittu kunnolla mitään, ei myöskään hantista ja mansista. Varmaan tässä kannattaa mallineiden kanssa pelata jotain, tai että jos klikkaat tundranenetsin sanaa, pääset sivulle, jossa on eri merkintätavoilla sama sana, tai sitten sekä tundra- että metsänenetsin sanat, tai jotain tällaista. Mielestäni esimerkiksi matorin vaikeita sanoja ei yleistajuisella sivulla välttämättä tarvitse antaa (jos sana löytyy myös muista samojedikielistä, kuten useimmiten on), vaan johdattaa samojedista kiinnostunut lukija mallineiden avulla tiedon ääreen. --Sholopainen (keskustelu) 24. huhtikuuta 2020 kello 20.22 (EEST)

Tarkennan siis, että tuolla sivulla on tundranenetsi listattu kieliin, joita kirjoitamme kyrillisellä kirjakielellä. Tämä on ihan OK yleistajuisten sivujen osalta, ja sieltä voisi sitten olla juuri tuollainen mallinne, jota Santeri aiemmin kuvaili, siis mahdollisuus päästä lukemaan se myös FUT:lla tms. Mutta olisiko jokin yleissamojedilainen mallinne myös hyvä, eli lähtökohtaisesti listataan vastineet tundranenetsistä, ja sitä klikkaamalla pääsee jollekin sivulle, jossa näkyisi vastineet myös muista samojedikielistä, eikä tarvitsisi yleistajuiseen tekstiin laittaa muotoja näistä kielistä, joilla ei ole kunnon kirjoitusjärjestelmää (tai joita ei kunnolla tunneta, kuten tuo yllä mainittu matori). --Sholopainen (keskustelu) 24. huhtikuuta 2020 kello 20.26 (EEST)
Yleistajuisia sivuja koskeva keskustelu kopioitu sivulle Keskustelu Sanatista:Etymologiawiki. --J. Pystynen (lähetä viesti)
Ehdotuksessa yhdestä nenetsin muotoja esittelevästä sivusta olisi luonnollisesti se ongelma, että kaikilla metsänenetsin sanoilla ei ole suoraa tundranenetsin vastinetta. Näissä tapauksissa en mielellään rupeaisi pseudotundranenetsimuotoja keinotekoisesti konstruoimaan, kyse kun on kuitenkin kahdesta melko erilaisesta kielestä. Mulla on myös takataskussa se oma kantasamojedin tietokantani, jota varten aikanaan varmasti tulen laatimaan (tai saan jonkun muun laatimaan) wikiin jonkin YSuS:n tai SW versio 2:n tapaisen yleisesityksen. Tämä tulee kai olemaan luontevin paikka mainita eri samojedikielten saman sanueen edustus yhdessä paketissa. Yksittäisiä esimerkkejä tästä voisikin jo kokeeksi laatia jo EVEn kylkeen. Meidän tämänhetkinen aineisto tosin kattaa jo nyt toista sataa sanaa, joilla on vastineita samojedikielissä, ja niiden täyteen kattavuuteen en heti tähtäisi. Vastaan tulee pulmia esim. siitä että kantasamojedi on huomattavasti vähemmän triviaali kantakieli kuin kantasuomi, ja monessa tapauksessa samaa sanaa on ehdotettu useampaan yhteyteen, s.o. samojedikielten sanoille ei voi yksiselitteisesti määritellä että on tietty oikea kantasamojedin tietue jonka alla ne voidaan esittää. --J. Pystynen (lähetä viesti) 24. huhtikuuta 2020 kello 20.54 (EEST)
Joo, en toki meinannut, että pseudotundranenetsimuotoja pitäisi käyttää, se olisi kaamea vaihtoehto. --Sholopainen (keskustelu) 24. huhtikuuta 2020 kello 22.04 (EEST)

Saamelaiskielet

Muiden saamelaiskielten (kuin sivulla nyt mainitut etelä-, pohjois- koltan-, inarin-, kildininsaame) osalta normitustilanne on käsittääkseni se, että luulajansaamella on suhteellisen vakiintunut ortografia, jota on käytetty useita vuosikymmeniä. Sekä piitimen- että uumajansaamelle on myös muutama vuosi sitten vahvistettu ortografiastandardi, joiden mukaiset keskilaajat käyttösanakirjat on julkaistu, joten tietynlainen normi on olemassa. Etymologisista lähteistä näitä normeja eivät tietenkään käytännössä toistaiseksi noudata juuri muut kuin jotkin uusimmat ja valveutuneimmat, joten verkkosanakirjan toimituksen tehtäväksi jää monessa tapauksessa nykynormin mukaisen muodon löytäminen. (Asiaa voisi mahdollisesti edistää se, jos Wilburin piitimensaamen ja Barrukin uumajansaamen sanakirjojen sanasto voitaisiin jotenkin sisällyttää verkkosanakirjaan.) --Juha Kuokkala (keskustelu) 30. huhtikuuta 2020 kello 19.20 (EEST)