Keskustelu Sanatista:EVE/tutkimushistoriasivut

Page contents not supported in other languages.
Sanatista

Muotoiluhuomioita

Hei! Näyttää ensivilkaisulta pääkohdiltaan hyvältä. Joitain muotoiluseikkoja kuitenkin:

  • Nimiavaruus. Sivut on sijoitettu väärin ja pitää siirtää. Onnistuu kyllä oikein hyvin nyt kun niitä ei vielä ole kasapäin.
    1. Yleisesti ottaen: merkintätapa …/tunnus/nimi laittaa sivut pääsivuavaruuteen sivun /tunnus alasivuiksi, ei näihin meille pyydettyihin omiin nimiavaruuksiin. Oikein on …/tunnus:nimi, siis kaksoispisteellä. Näette ongelman tämän sivun otsikosta: tämä keskustelu on tällä hetkellä osoitteessa Keskustelu:EVE/tutkimushistoriasivut eikä osoitteessa muotoa EVE talk:… (tämä kai pitäisi muuten pyytää vaihdettavaksi suomenkieliseksi).
    2. Sivujen osoitteisiin pitäisi myös merkitä niiden kieli, eli vaikkapa …/tunnus:fi:nimi, jotta muidenkin kielten kuin suomen sanoille voidaan kirjoittaa huomiota tutkimushistoriasta. Tai toistaiseksihan nämä ovat kantasuomen alla, joten ennen tätä pitäisi käydä se keskustelu kielten tunnisteista.
    3. Eikö puheena ollut työnjako ollut, että nimiavaruuteen EVE: tulee ainoastaan yleistajuinen sanakirja, joka on vain meidän muokattavissamme, kun taas tämänlainen data tulee nimiavaruuteen Etymologiadata: ja olisi muidenkin muokattavissa?
  • En oikein pidä pitkistä tiivistelmämäisistä otsikoista. Ihan jo teknisenä ongelmana, jos lähteet joskus mallineistetaan, niin niitä ei kovin hyvin pysty sijoittamaan otsikkoihin. Ehdottaisin itse etymologioille pikemmin luettelo- tai taulukkorakennetta. Kappaleita voi käyttää pikemmin eri tyyppiselle metadatalle (esim. ==Viitteet==).
  • Sivuilla ei vielä juuri ole luokittelua. Tätä tulee kyllä varmaan parhaiten ajan myötä eri viite-, sana- jne. mallineiden mukana. Silti wikissä itsessään olisi hyvä olla ainakin jokin väliaikainen luokka näille, jotta olemassaolevat sivut pystyy jotenkin näkemään ja löytämään ilman sähköpostin pläräämistä. Aloitin luokan Luokka:Tutkimushistoriasivut.

Asiapointtina tulee mieleen ainoastaan, että joskus voi olla tarpeen erotella toisistaan esitettyjä etymologioita sen mukaan, eriytyvätkö mielipiteet jo itämerensuomen sisällä, vaiko vasta kantasuomen jälkeen. Näissä olisi mahdollista käyttää sitä mainitsemaani tekniikkaa, että kirjoitamme yhden tutkimushistoriasivun kantasuomen sanalle ja sisällytämme sen suoraan alaosiona suomen sanan tutkimushistoriasivulle.

--J. Pystynen (keskustelu) 1. lokakuuta 2018 kello 17.00 (EEST)

Hyvä, kiitos huomioista! Ensin otsikoista. Viitteen voin toki laskea otsikosta alas omaksi kappaleekseen. Ongelmaksi tulee kuitenkin se, että otsikko ei riitä erottelemaan etymologioita tapauksissa, joissa sama sana on saanut esimerkiksi kaksi eri germaanista etymologiaa. Pitäisikö ne otsikoida "Germaanisperäinen 1" ja "Germaanisperäinen 2"?

--Sjunttila (keskustelu) 1. lokakuuta 2018 kello 23.50 (EEST)

Jokin otsake etymologioilla varmasti kannattaa olla, mutta ihan siis teknisesti päätason ==Otsikko== tuntuu hankalalta. Jos tutkimushistorioiden halutaan olevan "infolaatikkokokoisia" ja siteerattavissa, niin silloin niihin ei voi sisällyttää väliotsikoita. Jokainen väliotsikko nimittäin luo wikisivun sisällysluetteloon oman pätkänsä aivan vain sen perusteella, miten vahvaksi otsikoksi se on määritelty. Jos vaikka jollain keskustelusivulla puhutaan otsikon X alla aiheesta Y ja joku lainaa sanan Z tutkimushistorian havainnollistamista varten, niin tällöin se siirtääkin kaiken sitä seuraavan keskustelun tutkimushistorian "mukana" tulevan uuden pääotsikon alle.
Vaihtoehto voisi olla vaikka jotain seuraavantapaista (esimerkki tapauksesta *ahvën):
Etymologia Lähteet Äännekehitys Vastineet
Ims-saamelainen Esittäjä Europaeus 1868
Puolesta SSA, NSES, EES
Vastaan
< vksm *ašŋen [1] saame *vōsŋōn
Balttilaisperäinen Esittäjä Thomsen 1890
Puolesta
Vastaan SSA, Hahmo 1994, Junttila 2012
< vksm *ašven [1] tai *ašmen [2] lt ašerỹs, ešerỹs 'ahven'
lv asars, asers ’ahven’
lt ašmuo 'terävä'
Lähteet väitteille voi tehdä alaviitteiksi <ref>-toiminnolla, jolloin ne saa tiiviimmiksi. Tai ne voi myös pitää aivan minimissä ja kirjoittaa auki vasta sanan varsinaiseen tietueeseen, jolloin perustaulukko sisältäisi vain koneluettavia viitetietoja. --J. Pystynen (keskustelu) 2. lokakuuta 2018 kello 00.51 (EEST)
Hyvä, luonnostelen jonkinlaisia taulukoita omiksi sivuikseen. Ilmeisesti sivulla https://fi.wikipedia.org/wiki/Ohje:Taulukot on käypä ohje? --Sjunttila (keskustelu) 2. lokakuuta 2018 kello 13.01 (EEST)

Nimiavaruuksista sitten. Kirjoitit sähköpostissa 16.8., että "pelkkään tietueen osoitteeseen ei ole mitään tarvetta vielä määritellä kantakielisyyttä, vaan pelkkä kieliryhmänkin koodi riittää". Ehdotan siis näille kielilyhenteeksi "imsm", joka on parempi kuin "imsu", jos suomi lyhennetään "sm" kuten SSAssä. Tutkimushistoriasivut voinevat siis olla osoitteissa tyyppiä //sanat.csc.fi/wiki:imsm:etymologiat:painetut:*[sana]? Tässä "painetut" viittaa painettuihin etymologioihin, joita sivulle voi täydentää sitä mukaan kun niitä ilmestyy. Erikseen sitten tulee jokaiselle kantasuomen sanalle julkaisualustasivu uusille etymologioille ja keskustelulle näistä, ja kunkin painetut-tutkimushistoriasivun voi kai mallineena tuoda saman sanan julkaisualustasivun yläosaan referenssiksi ja inspiraatioksi keskustelulle.

Julkaisualustasivun osoite voisi tällöin olla tyyppiä //sanat.csc.fi/wiki:imsm:etymologiat:tutkimus:*[sana] ja varsinaisen datasivun osoite //sanat.csc.fi/wiki:imsm:etymologiat:data:*[sana], jollet näe jotain muunlaista järjestelyä teknisesti parempana tai helpompana; tästä aiheesta lienee parempi aloittaa uusi keskustelusivu.

Voin siirtää luomani tutkimushistoriasivut tällaisiin uusiin osoitteisiin heti, kun niistä sovitaan, ja samalla vaihdan sivujen väliotsikotkin.

--Sjunttila (keskustelu) 2. lokakuuta 2018 kello 00.22 (EEST)

Lyhenne imsm kelpaa oikein hyvin sekin. Vielä tosin tekninen korjaus: oikein olisi esim. sanat.csc.fi/wiki/Etymologiadata:imsm:ahvën, tai siis lyhyemmin wikilinkkinä: Etymologiadata:imsm:ahvën. Tai vielä tarkemmin, koska tuumailtiin myös että tutkimushistoria on eri sivu kuin päätietue jossa vaikkapa luetellaan vastineet tai listataan johdoksia: Etymologiadata:imsm:ahvën/tutkimushistoria (vrt. aikaisemmat esimerkkisivuni Testi:Hauki ja Testi:Hauki/tutkimushistoria).
Ehdottaisin myös että tähdet jätetään sivun osoitteesta pois. Erikoismerkeistä sivujen nimissä tulee usein jonkinlaista teknistä riesaa. Jo lyhennekin oikeastaan osoittaa että kyse on rekonstruktiosta. Sivun sisällössä ne tietysti tulevat olemaan mukana (ja myös erilaisiin sanojen lainausmallineisiin yms ne voidaan laittaa tulemaan automaattisesti).
Painettujen ja painamattomien etymologioiden erottelu jo tietokannan rakenteessa taas ei oikein kuulosta toimivalta, koska sivuthan ovat sanue- eivätkä etymologiakohtaisia? Eli samalla sivulla voi jossain vaiheessa olla sekä painettuja että painamattomia etymologioita, ehkä tosin eri lailla listattuna. Siis referoituina: uusien "julkaisualustaetymologioiden" tarkemmalle esittelylle voi varmasti olla oma kanavansa. --J. Pystynen (keskustelu) 2. lokakuuta 2018 kello 01.07 (EEST)

Tuntemattomia vai perintösanoja

Yksi asiakommentti lisää sittenkin:

 Käsitettä "omaperäinen" ei käytetä, vaan sen asemesta kirjoitetaan "tuntematon"

Tämä on kummallisen oloinen ratkaisu, etenkin jos sitä ei mitenkään rajoiteta. Ims-saamelaisten sanojen voi kai oikein hyvin kuvailla olevan jotain tuntematonta alkuperää, mutta oudompaa on, jos myös selviä kantauralilaisia sanoja kuten *eci < *edə haukutaan "tuntemattomiksi". Ei kantaurali ole mitenkään kategorisesti tuntemattomampi kieli kuin kantagermaani tjsp. Ehkä ihan vain pelkän levikin mainitseminen riittää tälläisissä tapauksissa.

Jatkon kannalta ehdottaisin lisäksi jopa, että kaikkia ainakin kahden kielihaaran muutoin etymologiattomia sanoja kohdellaan tietokannan rakenteen kannalta "kantauralina" (muuten tulee liikaa pilkunviilausta siitä, onko jokin sana "tarpeeksi laajalevikkinen ollakseen oikeasti kantauralia"), ja varoitukset suppealevikkisyydestä mainitaan vasta tietueessa itsessään. --J. Pystynen (keskustelu) 1. lokakuuta 2018 kello 17.15 (EEST)

Tästäkin tulee toki omat komplikaationsa: emme varmaankaan halua luoda "kantauralilaisia" tietueita sanoille jotka on esim. lainattu germaanista luultavasti erillään sekä saameen että imsuun, mutta tällöin harmaaksi alueeksi jäävät sanat, joilla on sekä hieman laajempi levikki että jokin aika epävarma lainaetymologia (esim. Katzin ehdotus, että ims-mordvalainen *lešmä 'lehmä/hevonen' olisi esiarjalainen laina 'täplällinen > merkitty > kotieläin'). --J. Pystynen (keskustelu) 1. lokakuuta 2018 kello 18.39 (EEST)

On tässäkin puolensa. Ehdotan kompromissina, että uralilainen määritellään UED-kelpoiseksi. Antellahan on kriteerinä sanan esiintyminen kahdessa ei-vierekkäisessä kielihaarassa. Itämerensuomalais-saamelaiset ja itämerensuomalais-mordvalaiset sanat eivät siis ole vielä uralilaisia, mutta saamelais-itämerensuomalais-mordvalaiset ovat jo ainakin länsiuralilaisia. Etymologiakategorioita alkuperältään tuntemattomille sanoille olisivat tällöin "tuntematon" (= vain ims), "tuntematon ims–saa", "tuntematon ims–md", "länsiuralilainen" ja "uralilainen". --Sjunttila (keskustelu) 1. lokakuuta 2018 kello 23.30 (EEST)

Huomaa "tietokannan rakenteen kannalta". Siis esim. luokittelun ja sivujen nimeämisen osalta. Tälläiset tutkimushistoriassa mainittavat etuliitteet kuten "tuntematon" tai "länsiuralilainen" sen sijaan olisivat juuri "vasta tietueessa itsessään" mainittavia varoituksia. Sen sijaan jos joku vaikkapa haluaa etsiä tietokannasta kantakielistä rekonstruktiota *lešmä, minusta sen kannattaisi olla löydettävissä suoraan muiden varmempien kantauralin tapausten seasta, ilman että tarvitsee nimenomaisesti klikkailla läpi pariakymmentä muuta kategoriaa kuten "suomalais-mordvalaisuudet" tai "mordvalais-marilaisuudet". UED:ssä esiintyville sanoille tulee sitten tietysti oma hakemistonsa. --J. Pystynen (keskustelu) 2. lokakuuta 2018 kello 00.16 (EEST)
Ainakaan tässä vaiheessa hanketta niitä ei tulisi enempää kuin neljä: "tuntematon ims–saa", "tuntematon ims–md", "länsiuralilainen" ja "uralilainen". Etenkin ensin mainittu on hyvin yleinen ja syytä erottaa kantauralilaisista etymologioista. Kai hakukoneen voi ohjelmoida hakemaan kantauralin rekonstruktioita useammastakin etymologiakategoriasta? Joka tapauksessa sen on kyettävä etsimään niitä myös kategoriasta "indoeurooppalaisperäinen", eli kaikkien kantauralin rekonstruktioitten sijoittaminen tutkimushstoriasivulla samaan etymologiakategoriaan ei onnistuisi kuitenkaan. --Sjunttila (keskustelu) 2. lokakuuta 2018 kello 00.34 (EEST)
Tietysti ims-saamelaiset sanat erotetaan kantauralilaisista, mutta sitä ei tarvitse tehdä tietokannan rakenteessa. Hieman yksinkertaistaen kyse on siitä että pelkkään sivun osoitteeseen ei kannata "rakentaa sisään" yhtään enempää informaatiota kuin on tarpeen. Sivun sisältöön voi sitten kirjoittaa juuri niin paljon detaljeja kuin haluaa.
Vähintään tekstihaku löytää kyllä asioita mistä sivulta tahansa. Hankalampi sen sijaan on selaus tai ominaisuushaku: käyttäjä ei voi määritellä uusia luokkia ja ominaisuuksia lennosta, vaan joutuu nojaamaan olemassaoleviin. Eli voisi olla yksi pääluokka "uralilaiset rekonstruktiot" jossa ovat kaikki useamman kieliryhmän dataan perustuvat; sitten alaluokkia kuten "uralilaiset UED:n tms lähteen mukaan", "levikiltään suomalais-saamelaiset", jne. Samoin sekä sanoille *lešmä että *kala joutuu määrittelemään jonkin ominaisuuden tyyliin "rekonstruktioasu", ja tätä siis ei minusta kannata hajoittaa pienempiin ominaisuuksiin eri välikantakielittäin. --J. Pystynen (keskustelu) 2. lokakuuta 2018 kello 01.42 (EEST)

Tutkimushistoria taulukkomuodossa

Tein nyt taulukkomuotoisen tutkimushistoriasivun sanalle aitta osoitteeseen https://sanat.csc.fi/wiki/Etymologiadata:imsm:aitta. Katsopa, mitä sanot siitä. Taulukosta tuli varsin paljon oman tutkimushistoriallisen excel-taulukkoni kaltainen. Jos joku voisi lähettää minulle kuvan Häkkisen NESn aitta-artikkelista, saisin siitä lopullisemman näköisen, nyt Häkkisen argumentit puuttuvat.

--Sjunttila (keskustelu) 2. lokakuuta 2018 kello 20.27 (EEST)

Linkkinä siis: Etymologiadata:imsm:aitta (muox: nyttemmin Etymologiadata:imsm:aitta/th).
Muotoilun kannalta tässä ei taida olla mitään teknistä pulmaa. Näyttää tosin aikaisempia perusteellisemmalta. Alkuun varmasti pääsisi myös tiiviimmällä kirjallisuusluettelolla, ehkä SSA:n tapaan vain lyhyesti referoituna että kuka on minkä etymologian puolesta tai vastaan. Sulla on tietysti balttilaislainoina käsitellyistä jo olemassa ne tiedot mitä tähän malliin tarvitaan, mutta muiden sanojen kohdalla kaiken esiin kaiveleminen voi viedä kauan. — Itse olen erityisesti huomannut, että Erämetsän vanha hakemisto ja sen myötä myöskään SSA eivät lainkaan huomioi sellaisia viitteitä, joissa käsitellään jotain uralilaista sanuetta ilman, että suomen sanaa eksplisiittisesti mainitaan, minkä takia moni relevantti huomio ei ole löydettävissä pelkän SSA:n avulla. Jonkinlaista kattavuutta varten aivan vähintään pitäisi tsekata myös UEW:n mainitsemat viitteet. --J. Pystynen (keskustelu) 3. lokakuuta 2018 kello 01.40 (EEST)
Tietojen kaivelu on minulle oikeastaan opettanut, että eniten aikaa menee yhtäältä tiedon haeskelemiseen ja toisaalta lähdeteoksen kirjallisuusluetteloon lisäämiseen. Kun oikea kohta kerran on esillä, se kannattaa lukea ja kirjata myös argumentti ylös. Tällä sanakirjan käyttäjä voittaa paljon aikaa siihen nähden, että joutuu itse hakemaan oikean kohdan painetusta kirjasta. Tässä Donner, Erämetsä ja kumppanit säästivät omaa aikaansa väärässä paikassa. Meidän tutkimushistoriamallineiden on tarkoitus toimia inspiraationlähteenä etymologeille ja siinä onnistumme varmasti parhaiten, kun keräämme tutkimushistoriatiedot valmiiksi kompaktiin taulukkomuotoon, josta koko keskustelu argumentteineen on nähtävissä.
Kaikki suomen sanojen etymologiset viitetietokannat rajoittuvat suomen sanojen mainintojen mainitsemiseen. Meillä on hankkeen nimestä huolimatta yleisfenniläisempi tutkimusote, joten jonkinlaista hyötyä tullee meille olemaan myös viron sanojen etymologisesta kortistosta, joka nyt on viron etymologisen sanakirjan toimituksen käytössä ja joka toivottavasti tulee lähitulevaisuutena hakukelpoiseen muotoon. Minulla on kuitenkin kokemus niitten korttien käytöstä osoittanut, että niistä löytyy hyvin vähän minkään arvoista lähdetietoa, jota ei suomen sanojen viitetietokannoissa olisi. Paras tutkimus kerta kaikkiaan on joko keskittynyt suomen sanoihin tai ainakin muistaa mainita ne tutkimiensa sanojen vastineina. Siksi ehdotankin, että yritetään ensin saada tutkimushistoriasivut valmiiksi suomen sanojen etymologisten mainintojen osalta ja ryhdytään vasta sitten hakemaan niitä mainitsemattomia lähteitä --Sjunttila (keskustelu) 3. lokakuuta 2018 kello 21.25 (EEST)

UEW

Tässä lukiessa tuli mieleen, että oliko sovittu, että UEW:iin ei viitata tutkimushistoriassa ollenkaan? Jos näin on, niin sopiihan se, mutta usein se sisältää aika paljon keskustelua kantasuomalaistenkin sanojen etymologiasta, varsinkin tällaisten aita-tyyppisten tapausten. Tietysti monestihan se toistaa vain muualla esitettyjä argumentteja, mutta tällaisen puolesta- ja vastaan-tyyppisten ajatusten kannalta kai UEW:llakin pitäisi olla merkitystä (tuolla esim. vastustetaan balttilaista etymologiaa http://uralonet.nytud.hu/eintrag.cgi?id_eintrag=1187). (Kaikille on varmaan selvää, etten pidä UEW:tä erityisen onnistuneena etymologisena sanakirjana, enkä halua turhaan korostaa sen roolia etymologisessa tutkimuksessa, lähinnä tuli mieleen, että olisiko siihenkin syytä viitata.)

--Sholopainen (keskustelu) 2. lokakuuta 2018 kello 22.27 (EEST)

Ilman muuta pitäisi ainakin viite olla, jos jokin sana UEW:ssä esiintyy. Samoin kai muissakin vastaavanlaisissa. Eri asia on, onko jokaista lähteestä tarpeen heti laatia tiivistelmää. --J. Pystynen (keskustelu) 3. lokakuuta 2018 kello 01.50 (EEST)
Sanoisin, että UEWiin ei pääsääntöisesti tarvitse viitata, koska SSA tekee sen jo. UEWn asema tutkimushistoriassa on sitä myöten sama kuin kaikkien vanhempien lähteitten, vaikkapa SKESn. Samalla tapaa monet etymologiat mainitaan useissa kymmenissä ennen SSAää ilmestyneissä teoksissa. Meillä on muutenkin niin paljon tekemistä verkkosanakirjassa, ettei jo tehtyä työtä kannata toistaa. Toiseksi, myös Ante väittää käyneensä läpi kaikki UEWn etymologiat UEDn pohjatyönä. Eri juttu on toki, jos UEWssa tai muussa vanhassa teoksessa sanotaan jotain meidän mielestä fiksua, jota ei aiemmin eikä myöhemmin ole sanottu, mutta sekään ei edellytä UEWn selaamista jokaisen EVEn sanan osalta. Minä olen sen taulukkooni jo tehnyt siinä olevien sanojen osalta: esimerkiksi tämä aitta-sanalle esitetyn balttilaisetymologian kritiikki on esitetty jo ennen UEWiä ja sen jälkeen.
Vaikka etymologioille mainitaan tutkimushistoriasivuilla ensimmäinen esittäjä, niin kritiikki- ja tukikommentit argumentteineen on huomioitu vasta SSAn jälkeiseltä ajalta. Tämä siis lähinnä siksi, että työtä on paljon ja jo kerran tehtyä ei ole mieltä tehdä uudestaan. Silti voisi toki harkita semmoista muutosta yleislinjaan, jossa kritiikki- ja tukikommentit mainitaan SSAstä alkaen, että tapauksissa, joissa kommentti vain toistaa jotain vanhaa argumenttia, sen sijasta mainitaan argumentin ensimmäinen esittäjä. Tässä aitta-tapauksessa se on Nieminen 1940. Tämä muutos linjaan lisäisi työn määrää, muttei läheskään niin paljon kuin kaiken aikojen alusta julkaistujen käsitysten mukaan ottaminen. --Sjunttila (keskustelu) 3. lokakuuta 2018 kello 21.05 (EEST)
Eihän UEW ole ihan mikä tahansa vanha lähde, vaan (1) toistaiseksi viimeisin laaja uralilainen etymologinen sanakirja, käytännössä alan perusteos ja (2) verkossa linkitettävissä. Monesti myös (3) viimeisin lähde, jossa on esitetty ~kantauralin rekonstruktio (SSA:han näitä ei oikein anna ja Janhusen-Sammallahden-Aikion akseli käsittelee vain selvimpiä tapauksia). Entä eikö meillä muutenkin ollut tarkoituksena käyttää SSA:ta pohjana, eli siis listata myös kaikki SSA:n mainitsemat lähteet? Nehän saadaan sieltä (edelleen toivon mukaan) ihan kopsattaviksi, eli ei tässä kai mitään tuplatyötä tarvitse tehdä. Voi olla, että olen käsittänyt nyt jotain aivan eri tavalla kuin Santeri, mutta "koska SSA tekee sen jo" kuulostaa minun korviini suunnilleen samalta kuin "ei vastineita tarvitse esittää, koska ne voi katsoa SSA:sta". Onko vikana se, että minä puhun ainoastaan viittaamisesta mutta Santeri kaikkien argumenttien kirjaamisesta?
Muuten sivuhuomioksi myös: jos ja kun lähteet jossain vaiheessa mallineistetaan (merkittävimmät kannattanee tehdä jo nyt projektin aikana), niin silloin niistä saadaan vähällä vaivalla kasaan myös yleispätevät lähdekohtaiset sanahakemistot. Jos tutkimushistoriasivulla viitataan esim. UEW:hen omalla mallineellaan, niin ko. mallineella voi myös laittaa sen menemään luokkaan tai asettaa sanalle ominaisuuden "UEW:n käsittelemät sanat". Näistä saadaan edelleen sitten tehtyä ristihakuja tyyliin: sanat jotka esiintyvät sekä lähteessä A että B. --J. Pystynen (keskustelu) 4. lokakuuta 2018 kello 06.01 (EEST)
Juuri näin pitäisi olla: saamme linkittää verkko-SSAn sana-artikkelit sellaisinaan niin, että ne näkyvät tutkimushistoriasivulla kokonaan. Minun ajatuksissani SSA-artikkeli näkyy kunkin sivun ylälaidassa ja meidän tutkimushistoriataulukot sen alla. Mutta ei kai verkko-SSAään tule mitään linkkejä, vaan ainoastaan sama teksti kuin painettuunkin kirjaan? Ja jos SSAn teksti vain "heijastuu" meidän sivuille, niin emmehän me voi siihen mitään linkkejä lisätä?
Ehdotan edelleen pääsäännöksi sitä, että itse kirjaamme sivuille SSAää uudemmat, uusia etymologioita ja uusia argumentteja esittävät lähteet, ja vanhempien osalta jäämme SSAn artikkelien lähdekappaleitten varaan. Pääsäännöstä poikkeuksina 1) vain periaatteessa vanhempi mutta käytännössä SSAn toimittamista uudempi LägLoS I; 2) etymologioitten esittäjinä mainitaan alkuperäinen esittäjä, jottei joku luule SSAn jälkeistä etymologian puoltajaa sen esittäjäksi; 3) mahdollisesti myös kritiikki- ja tukiargumenteille kirjataan lähteeksi ensimmäinen esittäjä; olen itse jo kallellani tälle kannalle, koska "ensimmäinen SSAn jälkeinen esittäjä" on kriteerinä sattumanvaraisehko; 4) sellaiset vanhat etymologiat tai argumentit, joita SSA tai mikään uudempi lähde ei mainitse, mutta joissa on meidän mielestämme perää.
Sitten kun meillä on tähän tapaan laaditut tutkimushistoriat EVEn sanoista, mietitään uudelleen UEWn tietojen lisäämistä. Tällöin saattaa Anten UED olla jo jossain laajuudessa saatavilla ja osaamme arvioida tarvetta uudelta pohjalta.

--Sjunttila (keskustelu) 4. lokakuuta 2018 kello 13.18 (EEST)

Joo ahaa, ilmeisesti mua hämäsi se että olet edellä oleviin esimerkkitaulukoihin lisännyt myös vanhempia lähteitä. Aiemmin olin siinä käsityksessä että olisi joko yksi laatikko jossa on SSA:n lähdeluettelo ja sitten sen jatkoksi erillään meidän etsimiämme lähteitä, tai sitten kaikki yhdessä listassa. Mulle on itse asiassa vielä epäselvää, onko tässä tärkeää säilyttää se tieto, että johonkin lähteeseen on viitattu nimenomaan SSA:ssa, vai riittäisikö myös että meillä on samat lähteet plus lisiä listattuna jossain muodossa. Jos saan joskus SSA:n viiteosiot leikittäväkseni, niin ainakin yleisimmät lähteet voi uudelleenmuotoilla könttänä aika helposti.
Tieto siitä minkä näköinen verkko-SSA tulee olemaan ei ole vielä tainnut ilmestyä, mutta jos se saadaan wikiin sisällytettyä, niin silloin kyllä sen lähdelyhenteet voi tehdä linkeiksi itse tekstiä muuttamatta. En ole varma, onko suora "heijastuminen" aivan eri sivustolta edes mahdollista.
"Kaksilaatikkoisen" mallin tapauksessa pitäisi pohtia myös, mikä tieto sitten muotoillaan olevan suoraan lainattavissa keskusteluihin? Koko sivu kaikkine osineen? Pelkästään SSA? Pelkästään uudet lähteet? Molemmat jonkinlaisena tiivistelmänä, ja sitten itse sivulla myös laajempi selostus? Wikisivuihin voi nimittäin määritellä, että jokin osa sivua ei näy kun se lainataan toiselle sivulle, jolloin tutkimushistoriasivuilla voi olla esim. sekä jokin bibliografinen tiivistelmälaatikko että jokin laajempi argumenttien erittely. --J. Pystynen (keskustelu) 4. lokakuuta 2018 kello 17.10 (EEST)
Tuo tyyppi "SSAn lähdeluettelo + meidän etsimät uudemmat lähteet" oli alun perin minunkin ajatus, mutta kun ylempänä sanoit, että taulukkomuoto olisi parempi, niin ryhdyin sitten sellaista kehittämään. Taulukossahan on ensimmäisenä sarakkeena tietotyyppi, toisena lähde ja kolmannessa itse tieto (etymologia tai argumentti). Bibliografisen tiivistelmälaatikon siitä saa, kun ottaa vain keskimmäisen sarakkeen. Ehkä taulukosta pystyy määrittelemään, mikä sarake siitä milloinkin keskusteluun lainataan?
Jaa, jännä idea… Sivun osia pystyy kylläkin korkeintaan määrittelemään joko sisällytettäviksi tai ei sisällytettäviksi. En ole testannut, mutta ehkä tämä onnistuisi jopa taulukon sisällä. Jos tätä tarkempaa jaottelua kaipaa (eli haluaisi minkä tahansa taulukon osan olevan erillään automaattisesti lainattavissa), niin luulen että tällöin pitäisi hajottaa jokainen esitetty etymologia omaksi sivukseen ja määritellä näille iso kimppu tietokantaominaisuuksia kuten "esittäjän nimi" "2. puoltajan nimi" "3. vastustajan esittämät argumentit", eli menee turhan työlääksi. Aina voi kuitenkin linkittää ja sanoa, että katsokaa tuolta tarkemmin. --J. Pystynen (keskustelu) 7. lokakuuta 2018 kello 19.23 (EEST)
Ei meille se ole olennaista, onko jokin lähdeviite juuri SSAstä. Itse tahtoisin tehdä lähdeviitteet samalla periaatteella kuin SSA, mutta paremmin, eli viitata vain niihin lähteisiin, jotka antavat uutta tietoa: etymologia, tarkennus, argumentti puolesta tai vastaan, lisävastine. SSA viittaa lisäksi myös standardilähteisiin (SKES, EEW, UEW) ja niin olen minäkin noissa koesivuissa tehnyt (NES, EES), mutta mieluummin luopuisin siitä. Tutkijalle on jonkin vanhan etymologian maininta lähteessä nimittäin yhtä tyhjän kanssa, oli lähde sitten sanakirja tai mikä tahansa muu, jollei se perustele etymologiaa tai viittaa aiempaan perusteluun. Jos lähde taas vain viittaa aiempaan perusteluun, on tutkijalle ajanhukkaa kaivaa se esiin, joten meidän pitäisi viitata vain alkuperäisiin lähteisiin jokaisen informaation kohdalla. Tältä osalta minun kantani on siis selkiytynyt. Edellisessä puheenvuorossani antamani määritelmän voi lyhyemmin esittää näin: Tutkimushistoriasivu kuvaa lyhyesti kaiken SSAn jälkeisessä kirjallisuudessa esiin tulleen etymologisen tiedon hakusanasta – etymologiat ja niiden muunnelmat, tarkennukset ja lisätiedot sekä argumentit niitten puolesta ja vastaan – viitaten kuitenkin jokaisen tiedon kohdalla sen alkuperäiseen lähteeseen, vaikka se olisi SSAää vanhempi. Lisäksi tutkimushistoriaan sisällytetään vastaavan SSAn hakusanan lähdetietokappale sellaisenaan. --Sjunttila (keskustelu) 4. lokakuuta 2018 kello 21.40 (EEST)

Viitteen ominaisuudet

Hieman teknisempi aihe: ääneen ajattelua siitä, miten viitteet muotoillaan ja mallinnetaan. Eri ominaisuudet voisi luokitella ehkä seuraavasti:

  1. Tunniste: tekijän sukunimi + julkaisuvuosi, mahd. kirjaintunniste ("Hahmo 1994", "Setällä 1896a"). Isoille lähteille pelkkä kirjainlyhenne ("SSA").
  2. Tekijän etunimi, lähteen otsikko, mahd. kokoomateoksen nimi tai aikakausjulkaisun nimi ja numero.
  3. Bibliografinen pilkunviilaus: toimittajat, julkaisusarja, julkaisija ja julkaisupaikka, sivunumerot, ISBN, jne.
  4. Lähteen esittämä tai puoltama etymologia: laina- vai perintösana, jos laina niin miltä suunnalta.
  5. Esitetyt vastineet itämerensuomen (yleisemmin: ko. kielihaaran) sisältä.
  6. Esitetyt kaukaisemmat vastineet (lainanantajataholta tai etäsukukielistä).
  7. Käsitellyt etymologian piirteet — lähinnä kai: merkitys, äänneasu, muoto-oppi, levikki.
  8. Esitetyt tai puolletut argumentit.

Wikiin ilmeisesti joka tapauksessa pitää toimittaa jonkinmuotoinen bibliografia (oli se sitten ihan vain perinteinen lista tai jotain tietokantaistetumpaa), joten kohdat 2 ja 3 ovat kai tarpeettomia useimmissa viiteyhteyksissä. (Erottelen ne toisistaan sillä subjektiivisella perusteella, että kohdan 3 tietoja en ole koskaan tarvinnyt yhdenkään viitteen löytämiseksi, ja esim. muilta tutkijoilta voisi vaatia, että uusien viitteiden bibliografiaan lisäämistä varten kohtien 1-2 tiedot ovat pakollisia mutta kohdan 3 eivät.)

Tutkimushistorian esittämistä varten minimidata olisi kai 1 + 4. SSA esittää säännönmukaisesti suunnilleen yhdistelmän 1 + 4–6, sen sijaan kohtien 7 ja 8 tietoa vain satunnaisesti. Meillä ainakin kohta 5 ja mahdollisesti 6 tulevat itse sanan tietueeseen, ja niitä ei kai kannata toistaa tutkimushistoriasivulla (sikäli kun tarkoitus oli, että tutkimushistoriasivu aina lainataan tietuesivulla). Jos haluaa dokumentoida tietoa tyyliin "missä tämä vepsän sana on ensi kerran lisätty tähän ims. sanueeseen", se kai kuuluu pikemmin osaksi vepsän sanan tutkimushistoriaa, ei suomen tai kantasuomen.

Toistaiseksi Santerin ehdotus näyttää olleen käsitellä kohdat 1 + 4–8. Jos aika jossain vaiheessa työtä kuitenkin osoittautuu loppuvan käsiin täydellisen jäljen tekemisen kannalta, esittäisin, että kohta 7 kannattaa priorisoida, myös siksi että se on mallinnettavissa koneluettavaksi, toisin kuin 8, jonka täytyy jäädä aika lailla vapaaksi proosaksi. Vai voiko sitä järjellisesti vielä jakaa pienempiin osiin? Yksi teoreettinen mahdollisuus olisi jotenkin luokitella yleisiä argumentteja, esim. "vetoaa äännelakiin *x > y" tai "viittaa merkityskehityksen kissa > koira olevan yleinen". Mutta tämä taas kuulostaa jo aivan eri projektilta kuin mitä meidän piti tässä olla tekemässä (menee kai enemmän Jannen etymologioiden typologia -puuhaksi). --J. Pystynen (keskustelu) 4. lokakuuta 2018 kello 18.05 (EEST)

Hyvä, että tätäkin käsitellään jo nyt. Muutama huomio:
Suosittelen julkaisuvuoden perään liitettävästä juoksevasta kirjaintunnisteesta luopumista, koska semmoinen vaatii jatkuvaa koordinointia lähdeluettelon avulla. Paljon helpompi on vanha sanakirjakäytäntö: jokaiselle lehdelle ja sarjalle luodaan helposti tunnistettava lyhenne (Vir, SUST jne.) joka annetaan julkaisuvuoden ja sivunnumeron välissä. Samanlaiset lyhenteet otetaan myös artikkelikokoelmille. Monografiat eivät lyhennettä tarvitse, ellei joku ole julkaissut usemapia samana vuonna, mikä on äärimmäisen harvinaista. Sanakirjoilla taas on lyhenteet ja niitten yhteydessä ei tarvitse mainita tekijääkään (NES ja EEW riittävät, ei tarvitse olla Häkkinen NES ja Mägiste EEW). Tässä käytännössä on se hyvä puoli, että sen tunteva näkee heti viitteestä, onko lähteenä monografia, sanakirja vai jokin muu.
Kohdan 3 tietojen tarpeettomuudesta olen samaa mieltä.
Kohta 5, ims vastineet, kuuluu tosiaan omalle sivulleen niissä poikkeustapauksissa, joissa jostakin vastineesta on ollut erimielisyyttä; muissa sanoissa niitä ei tutkimushistoriasivulle tarvita. Olen kuitenkin sitä mieltä, että kohta 6, kauemmat vastineet, kuuluu tutkimushistoriassa esitettäväksi, koska etäsukukielten vastineista on erimielisyyksiä erittäin usein ja ne myös määräävät, mikä laina- tai johdosalkuperä tulee kysymykseen.
Kohdan 7 merkitseminen erikseen saa tutkimushistoriasivun muistuttamaan jo erittäin paljon minun väitöskirjani tutkimushistoriallista excel-taulukkoa. Siinä on neljälle argumenttityypille (muoto-, merkitys-, lähtömuoto- ja levikkiargumentit) oma sarakkeensa, joista kunkin arvona voi olla tyhjä (ei mainintaa), +(positiivinen eli puoltoargumentti), - (negatiivinen eli vasta-argumentti (itse asiassa minulle jäi käyttöön kirjain eikä miinusmerkki)) ja x (sekä positiivisia että negatiivisia argumentteja). Voihan tällaisenkin merkintätavan ottaa käyttöön, mutta tahdon myös kirjoittaa argumentit auki (kohta 8), jotta sivusta on tutkijalle paljon enemmän iloa. Tänne kaavailluni tutkimushistoriataulukkomallissa nämä kohdan 7 merkinnät annettaisiin kumminkin yhdessä solussa vain sanan yhdelle etymologialle/lähde, koska kullekin sanan etymologialle on oma taulukko. Minulla excel-taulukossa kukin merkintä koskee kaikkia saman lähteen mainitsemia saman sanan etymologioita, mikä ei osoittautunut kovin hyväksi käytännöksi.
Vielä kohdassa 7 mainituista piirteistä. Muotoargumentit on syytä niputtaa yhteen, koska rajanveto fonologisen ja morfologisen argumentin välillä on erittäin usein vaikeata, eikä meidän kannata jäädä pähkäilemään sen aiheuttamien kysymysten kanssa. Oman sarakkeensa sen sijaan tarvitsevat lähtömuotoargumentit, jotka voi muotoilla eksitenssin kysymyksiksi: onko lainan oletettu lähtömuoto tai johdoksen oletettu kantasana niin uusi, että sitä ei ole ollut olemassakaan oletetulla kontaktikaudella tai oletetussa kantakielimuodossa? Tai oliko vaikkapa kantasuomalaista -As: -AhA-johdinta olemassa? (Väitöskirjassa käytin näistä nimitystä lähtökieliargumentit, mutta se ei päde lainaetymologioitten ulkopuolella. Lähtömuotoargumentti on myös huono nimitys, koska menee sekaisin muotoargumentin kanssa. Yksiselitteisin nimitys on varmaan eksistenssiargumentti. Se on siitäkin hyvä, että siihen voi sisällyttää myös harvinaisemman argumenttityypin, jossa on kysymys jonkin lainakerrostuman olemassaolosta.) --Sjunttila (keskustelu) 4. lokakuuta 2018 kello 22.18 (EEST)
Juokseva tunniste jää minusta ongelmattomaksi, jos ne määritellään "tarvejärjestyksessä". Siis ei esim. otsikon mukaisessa aakkosjärjestyksessä tai muussa vastaavassa, joka pakottaisi säätämään aikaisempia tunnisteita ees taas noin joka toinen kerta jos halutaan lisätä joku uusi pikkuartikkeli. Monien tuotteliaiden henkilöiden kuten Koivulehton kohdalla voitaisiin myös seurata olemassaolevaa julkaisuluetteloa.
Kohdassa 6 kysymykseksi tarkemmin ajatellen tulee lähinnä, miten paljon vastineita siteerataan. Kielihaarakohtainen tarkkuus riittänee? Jos esim. jotain esitetään germaaniseksi lainaksi, niin ei silloin kai ole tarvetta mainita, oliko se keskifriisin tai nykyfäärin vastine varmasti annettu lähteessä, vaan jokin "selvempi" vastine kuten nykysaksan tai muinaisnorjan varmasti riittää identifioimaan, mistä sanueesta onkaan kyse. Perintösanoissa tosin ainakin samojedikielten vastineiden keskinäisessäkin yhteenkuuluvuudessa tulee joskus ongelmia. Ehkä myös udmurtti ja komi on edelleen hyvä erotella; näissä ehkä yleisempi ilmiö on, että yhdelle on esitetty ims. vastineita, mutta toinen osoittaa tämän rinnastuksen mahdottomaksi.
7 olisi minusta lähinnä hyvä kevyempi vaihtoehto 8:lle, koska toisinaan argumentit ovat hyvinkin pitkiä eivätkä ole oikeasti tiivistettävissä pariin lauseeseen. Hankalien perintösanaetymologioiden kohdalla usein "kaikki riippuu kaikesta" ja yhden sanueen tulkinta hajoaa välillisesti kymmeniin muihin eri äännehistoriallisiin ja etymologisiin kysymyksiin. Eli jos johonkin on vedettävä raja, 7:n ja 8:n väli näyttäisi selvimmältä. --J. Pystynen (keskustelu) 8. lokakuuta 2018 kello 16.35 (EEST)
Tämä aihe on nyt tarkemmassa jatkosuunnittelussa sivulla Käyttäjä:Jpystynen/Bibliografia. --J. Pystynen (lähetä viesti) 12. heinäkuuta 2019 kello 15.26 (EEST)

Uusi vs. vanha etymologia

Tämänhetkisestä ohjeesta:

Vanhan etymologian tarkennuksen ja uuden etymologian ero on siinä, että uusi etymologia yhdistää lainana tai johdoksena pidetyn sanan (lähtökielen) eri sanueeseen kuin vanha, taikka lainan samaan sanueeseen, mutta eri lainanantajakielikunnan haaraan kuin vanha (esim. skandinaavisena lainana esitetyn sanan arvioiminen kantagermaaniseksi lainaksi ei ole uusi etymologia, mutta uudelleenarvioiminen länsigermaaniseksi lainaksi on, koska tällöin siirrytään kielipuussa paitsi pysty- myös vaakasuunnassa).

Ihan OK useimmissa tapauksissa, mutta tästä voi tulla "transitiivisuusongelmia" jos rinnastus siirtyy kahdesti pystysuunnassa. Eli jos sanaa ehdotetaan ensin kantagermaaniseksi, sitten yhtäältä skandinaaviseksi ja toisaalta goottilaiseksi, niin tällöin kantagermaanin etymologia tällä periaatteella "on sama" kuin kumpikin uusista, vaikka ne "eivät ole sama" keskenään.

Mun mielestä haaraero on selvästi vähäisempi asia kuin rinnastus kokonaan eri sanueeseen. Käsitän tämän alakäsitteenä "reitityksestä", joka sisältää lisäksi myös esim. erilaiset tulkinnat lainautumisajoista, äännekehityksestä ja rinnakkaislainaamisesta (viimeisesti esimerkkinä: vaikkapa sanan kerta etymologia ei sinänsä muutu, pidettiinpä sitä baltoslaavilaisena lainana sm.-volgalaiseen kantakieleen vaiko erillisenä balttilaislainana vasta kantasuomeen). Mitä mieltä olisit siitä, että kokonaan erilaiset etymologiat erotellaan vahvemmin, esim. eri sivun alaotsikoiden alle, erihaaraiset samasanueiset etymologiat sen sijaan omina taulukoinaan yhteisen alaotsikon alle? --J. Pystynen (lähetä viesti) 12. heinäkuuta 2019 kello 15.25 (EEST)

Ohjesivulta linkki tutkimushistoriasivujen listaan

Tästä ei ehkä ole hirveästi ollut puhetta, mutta wikimme eri sivuilla siirtyminen on aika vaikeaa, jos ei tiedä mitä etsiä. Esimerkiksi tältä Tutkimushistoriasivut-etusivulta ei ole linkkiä luokkasivulle, josta näkee kaikki olemassa olevat th-sivut. Siis toisin päin on, mutta ei näin, eli jos joku tottumampi käyttäjä löytää tänne vanhasta muistista, ei hän täältä löydä itse tutkimushistoriasivuja kuitenkaan. Voisi varmaan tehdä wikin sisällä navigoinnin mahdollisemman helpoksi lisäilemällä sisäisiä linkkejä ja ohjeita. --Sholopainen (keskustelu) 21. toukokuuta 2020 kello 18.32 (EEST)

Jos vain keksii tarpeita, linkkien lisäily on ei ainoastaan sallittua vaan ihan myös suotavaa. --J. Pystynen (lähetä viesti) 22. toukokuuta 2020 kello 07.46 (EEST)

Uralilaisten etymologioiden esittäminen

Sampsalla oli tästä hyviä kommentteja jotka siirrän *sarvën tutkimushistoriakeskustelusivulta. --J. Pystynen (lähetä viesti)

Uralilaisten sanojen esittäminen on paljon monimutkaisempaa, kuin lainojen. Lainasanathan ovat yleensä joko ar, balt, germ jne., joko puolesta tai vastaan, ja sitten on tarkennuksia ja lisätietoja. Uralilaisen sanaston tutkimushistoria on hankalaa esittää, koska itse perusrinnastus voi olla vanha, siis että itämerensuomen sanalla on vastine unkarissa tai mordvassa tai jossain, mutta sitten levikki on saattanut muuttua radikaalisti suuntaan ja toiseen vuosien varrella. SSAssahan on hyvin listattu, että + md, + sam jne., mutta ei ole varmaankaan järkeä kopioida sitä koko listaa tänne, kun se kuitenkin tulee sellaisenaan nähtäväksi aikanaan. Vai? Siis jos rinnastuksen on ekana esittänyt vaikka Ahlqvist, ja se on säilynyt samana 150 vuotta, on helppoa laittaa ekaksi maininnaksi Ahlqvist ja sitten lisätä SSAn jälkeiset äännehistorialliset huomiot Hontilta ja Aikiolta ja muilta, mutta yleensä tilanne ei ole suinkaan tämä.

Kysyin tätä jo alustavasti Santerilta, ja hän ehdotti, että samoin kuin balttilaislainojen suhteen ekana lähteenä on Thomsen (vaikka osa rinnastuksista on sitä vanhempia), voisi Budenzin 1860-luvun tuotanto (Thomsenin ikävätoveri) olla samanlainen vedenjakaja perintösanoissa. Tämä on periaatteessa hyvä ajatus, mutta ei kuitenkaan käytännössä tunnu toimivan, koska kaikkia rinnastuksia hänellä ei ole (en totta puhuen ole nyt tähän hätään käynyt alkuperäislähteitä läpi vaan luottanut SSAn tutkimushistoriaan Budenzin osalta).

Laitoin tähän sarvi-sanaan nyt Castrénin toistaiseksi kompromissiratkaisuksi, koska hän on eka, jolla on varsin täydellinen setti kasassa (päättelin tämän SSAn bibliografiatiedoista siis).

Minä olisin oikeastaan taipuvainen jättämään kaikki Sammallahtea ja/tai UEW:ia edeltävät uralilaiset pois näistä meidän jutuistamme tässä vaiheessa, koska on selvää, että SSAsta ne tiedot löytyvät, ja ne tulevat myös verkkosanakirjan käyttäjien saataville. UEW on puutteistaan aika peruslähde, johon voisi huoletta viitata tässä, ja sitten lisättäisiin normaalisti sen jälkeen tulleet huomiot, parannukset ja täydennykset. Tai sitten samantyylinen viite Sammallahteen. Vielä sellainenkin vaihtoehto olisi, kuin "uralilainen, ks. SSA".

Lisäksi ihan muuna huomiona: aika monen sanan alkuperäinen arjalainen etymologia on Tomaschekilta, joten olen laittanut hänet nyt tähänkin ensimmäiseksi esittäjäksi. Minulla ei (tietääkseni) ole tällä hetkellä pääsyä lukemaan sitä työtä, jossa nämä lainat on esitetty, ja siksi viite näyttää nyt torsolta. Parantelen näitä toivottavasti kesällä viimeistään. --Sholopainen (keskustelu) 21. toukokuuta 2020 kello 03.34 (EEST)

Yksi huomio näistä on, että tällä hetkellähän laadimme vasta itämerensuomen sanueiden tutkimushistorioita. Aikanaan pitäisi oikeastaan saada erilliset tutkimushistoriasivut uralilaisille sanueille itsessään (sinne vähintään kaikki argumentit tyyppiä onko rekonstruktio sitä vai tätä, kai myös kuuluuko vastine X settiin vai ei) ja muiden kielihaarojen sanueille (sinne vähintään kaikki argumentit tyyppiä mikä on ollut niiden oma äänne-, merkitys-, muoto-opillinen kehitys). Olen kaavaillut että näille tulisi tutkimushistorian osien peilaus, eli ural. sanueen koko "oma" tutkimushistoria tulisi imsm. sanueen uralilaisen etymologian alle, ehkä jonkinlaiseen laatikkoon. Ennen kuin tämän saa toimimaan, niin ei tosin kannata vielä ruveta laajemmin luomaan mitään :ural:kala/th -sivuja.
Vedenjakajien määrittelyn kannalta näiden työsarkojen erottelu olisi siis tärkein kysymys, koska nykyisen projektin puitteissa emme missään tapauksessa pysty selvittämään uralilaisten sanueiden koko tutkimushistoriaa. UEW:n ja MNyTESz:n kirjallisuusviitteet ovat sekä rajallisempia että huonommin kommentoituja kuin SSA:n, muista kielistä ei ole saatavilla tämänkään vertaa (KESK, DEWOS ja YSaS yleensä antavat korkeintaan yhden viitteen, esim. SW ei yhtäkään).
Kannattaisin sitten perintöetymologioiden nipussa pitämistä: jos ainakin yksi esitetyistä etävastineista on pysynyt alusta asti samana, niin muiden etävastineiden mukaantulo tai poisjääminen ei muuttaisi imsm. sanan etymologian lajia. Sen sijaan esim. vanha, mm. Castrénin aivo = oaivi kyllä olisi eri etymologia kuin nykyinen aivo = vuoigŋašat. Erityisesti korollaarina: "samaa" etymologiaa ei minusta tulisi esittää erikseen "uralilaisena" ja "länsiuralilaisena".
Eniten näiden tutkimushistorioiden mallinnusta toistaiseksi sitten hankaloittaa uralilaisten ja vanhojen lainaetymologioiden erottelu. Nämä lainaetymologiat kun ovat periaatteessa nekin "saman" etymologian laajennuksia. Lähes jokainen huomio joka koskee uralilaisten vastineiden keskinäisiä suhteita on relevantti myös lainaetymologialle. Eli iir. etymologian oikeastaan pitäisi aikanaan mennä "kantauralin" eikä kantasuomen alle! Tietysti tapauksittain asiaankuuluvin varoituksin siitä, että laina voi olla tiukasti kantauralia nuorempi, rinnakkainen eri kielihaaroihin jne. Tilanne on täysin vastaava sen kanssa, että laadimme paraikaa nimenomaan lainaetymologioita jotka tulevat kantasuomen alle, vaikka kantasuomalaisuus on jo sinänsä etymologia omille tytärkielilleen. Tässä siis ilmenee että etymologiat ovat hierarkkisia: ei voi väittää että sanalla ainoastaan joko on tai ei ole etymologiaa, vaan sillä voi olla etymologioita johonkin asti: aluksi N perintöaskelta (uralilaisten kielten tapauksessa joko 1 tai 2), sen jäljessä lisäksi vielä laina- tai johdosetymologia. --J. Pystynen (lähetä viesti) 22. toukokuuta 2020 kello 15.06 (EEST)