Keskustelu Sanatista:Kielikoodit

Page contents not supported in other languages.
Sanatista

Uusia koodeja EVE-projektiin

Etymologisessa verkkosanakirjassa tulee tarpeeseen siteerata sanoja useista kielistä, joille ei ole standardikoodia: vähintään kantakielet sekä mansin, hantin ym. eri murteet. Näille lienee tarpeen luoda yksi tai useampia pseudokielikoodeja.

Kielikoodien käyttökohteet

Santeri on toivonut, että EVEssä käytettäisiin enimmäkseen vakiintuneita suomenkielisiä lyhenteitä kuten sm = suomi, unk = unkari. Näin voidaan varmasti tehdä ainakin leipätekstissä, ehkä myös muualla. Merkittävin käyttökohde jossa olisi jotain syytä käyttää kansainvälisiä standardikoodeja tulee kai olemaan sivujen nimien tai ominaisuuksien määrittely tietokantaan, eli esim. suomen sana kala tulisi olemaan osoitteessa Etymologiadata:fin:kala, vastaavasti karjalan sana kala osoitteessa Etymologiadata:krl:kala.

Muotoilua ja viittaamista varten eri mallineet voidaan laatia tuntemaan molempia lyhenteitä. Tarkemmin: voin luoda yleiskäytännöllisen "alimallineen", joka muuntaa sille annetun ISO-koodin suomenkieliseksi lyhenteeksi tai kielen nimeksi tai päinvastoin. Jos luomme vaikka mallineen {{m}} sanojen mainitsemista varten, niin ei ole mitään yleistä estettä sille, että merkinnät {{m|fin|kala}} ja {{m|sm|kala}} linkittävät samaan sanaan — paitsi jos joskus käy niin, että sama kirjainjono onkin käytössä sekä suomenkielisenä että ISO-lyhenteenä. Tämä on teoriassa mahdollista (esim. unk on arawaka-kieliin kuuluvan enawene-nawan kielen tunniste), mutta luulen, että tästä ei juuri tule ongelmaa niin kauan kuin wiki keskittyy ainoastaan uralilaisiin kieliin. Ainakin jos sovimme, että käytämme ainoastaan kolmikirjaimisia ISO 639-2 ja 639-3 -tunnisteita (emme muutamalle kielelle määriteltyjä kaksikirjaimisia 639-1-tunnisteita, joissa esim. ku on kurdi ja saattaisi sekoittua suomenkieliseen lyhenteeseen kantauralille).

Onko leipätekstin, mallineiden ja sivujen osoitteiden lisäksi mitään muita yleisiä käyttökohteita, joissa tarvitaan kielten tunnisteita tai lyhenteitä? --J. Pystynen (keskustelu) 4. lokakuuta 2018 kello 21.04 (EEST)