RAPOLAN 1800-LUVUN SANASTO

Sanatista

Petri Lauerma (Kotimaisten kielten keskus)

Niko Partanen (Helsingin yliopisto), koordinointi

Antti Kanner (Helsingin yliopisto), tekninen toteutus


Vanhan kirjasuomen ja suomen murteiden tutkijana ansioitunut Martti Rapola (1891–1972) kokosi 1800-luvun kirjasuomesta laajan aineiston, jonka hän järjesti merkityksen mukaan. Näistä 1930–1950-luvuilla tehdyistä poiminnoista syntyi Rapolan 1800-luvun sanakokoelma, joka käsittää kaikkiaan 44 000 sanalippua. Rapola hyödynsi aineistoaan monissa 1940–1950 -luvuilla julkaisemissaan artikkeleissa ja vuonna 1960 painetussa valikoimassa Sanojemme ensiesiintymiä Agricolasta Yrjö-Koskiseen, joka nimensä mukaisesti sisältää vain kirjasuomeen vakiintunutta sanastoa.

Verkossa julkaistava aineisto pohjautuu alkuperäisiin sanalippuihin, jotka on valikoiden toimitettu tietokannaksi. Tämä sisältää tietoja kaikkiaan 5600 sanasta, jotka jakautuvat 1070 käsitteeseen. Alkuperäisestä aineistosta tämä muodostaa noin neljänneksen.

Aineiston rajaus

Tietokantaa toimitettaessa on keskitytty niiden käsitteiden ilmauksiin, joille 1800-luvulla kehittyi suomalainen vastine, sikäli kuin näistä on alkuperäisessä lipustossa useampia tietoja. Pois on karsittu sellaiset käsitteet, jotka saivat sittemmin vakiintuneen suomalaisen ilmauksensa jo vanhan kirjasuomen kaudella (esim. AAPINEN ja HOLHOOJA). Näistä jo Vanhan kirjasuomen sanakirja tarjoaa aineistoa. Tietokantaan on kuitenkin otettu mukaan ilmaisultaan vain lainasanan varaan jääneet käsitteet (esim. ANANAS ja KONSERTTI), joille esitetyistä suomalaisista vastineista mikään ei 1800-luvullakaan vakiintunut.

Tietokannasta on samaten rajattu pois vasta 1900-luvulla vakiintuneen suomalaisen ilmauksensa saaneet käsitteet, joita alkuperäisessä lipustossa on vain satunnaisesti. Esim. käsitettä KANSANEDUSTAJA ei tietokannassa siksi ole. Nykysuomen sanakirja ja etenkin sen alkuperäislipusto tarjoaa aineistoa tällaisista sanoista.

Tietokantaan sisältyvää materiaalia voi hakea paitsi käsitteittäin ja hakusanoittain, myös rakennepiirteittäin, vuosittain ja lähteittäin.

Käsite, hakusana ja sanan asu

Käsite

Tietokannassa on operoitu Rapolan luomilla käsitteillä niin pitkälle kuin tämä on ollut mahdollista. Jonkin verran käsitteitä on jouduttu yhdistelemään, sillä etenkin lainasanoja on alkuperäislipustossa hajaantunut erilleen suomalaisista vastineistaan. Joskus harvoin käsitteitä on jouduttu hajottamaankin (esim. käsite LYYRILLINEN käsitteiksi LYYRIKKO, LYYRILLINEN ja LYYRILLINEN RUNO).

Oman pienen ongelmansa aiheuttaa se, että 1930–1950-luvuilla tehty kokoelma ei tietenkään kaikista käsitteistä tavoita nykyisin käytössä olevia asuja. Muutamien käsitteiden nimitysten kieliasua on siksi modernisoitu Rapolan käyttämästä (esim. EVANKEELINEN > EVANKELINEN; KOMISSAARIO > KOMISARIO).

Hakusana

Hakusanoina ovat kustakin käsitteestä tallennetut ilmaukset, jotka on järjestetty käsitteittäin aikajärjestykseen vanhimmista nuorimpaan. Hakusanat on tarvittaessa yleiskielistetty, jotta näiden pohjalta voitaisiin tarvittaessa hakea aineistoa myös muista korpuksista. Yleiskielistyksessä on noudatettu seuraavia periaatteita.

Aineistossa verraten harvoissa lähteissä tavattavat vanhan ortografian mukaiset muodot on hakusanoissa oikeinkirjoitukseltaan modernisoitu. Keskeiset muutokset ovat x > ks, tz > ts, mb > mp, ld > lt, nd > nt, ng > nk (vahvassa asteessa), nk > ng (heikossa asteessa), c > k tai s, ph > f ja w > v. Vokaaleista on muuteltu etenkin jälkitavujen lyhyiksi merkittyjä pitkiä vokaaleja kahdella vokaalimerkillä merkityiksi. Varsinkin oi-loppuisia diftongeja on kirjakielen normien mukaisesti muuteltu välillä i:ttömiksi, o:lliseksi merkittyjä asuja taas diftongillisiksi.

Osa tietokannan aineistosta on nykyistä tuntuvasti murteellisempia. Esim. loppuheittoisia muotoja on palautettu i-loppuisiksi, itämurteisen d:ttömiä tai diftongiutuneita muotoja d:llisiksi ja pitkävokaalisiksi. Lainasanoja on varovasti myös yleiskielistetty muiltakin osin, mikäli näistä tunnetaan vakiintuneempia asuja (esim. terehtyöri > tirehtööri ’johtaja’, raadi > raati ’raati’, revormatsioni > reformaatio ’uskonpuhdistus’; ennallaan sen sijaan esim. bildhugari ’kuvanveistäjä’), mutta a-loppuisia ei ole yleiskielistetty i-loppuisiksi.

Asu

Sanan autenttinen kirjoitusasu on mainittu, jos se poikkeaa hakusanoitetusta yleiskielisestä asusta. Keskeiset tapaukset on esitelty edellä. Joissain tapauksissa Rapola itse on merkinnyt keräämistään muodoista vain yleiskielistetyn asun. Tällaisia ovat monet etenkin v:n (versus w:n) sisältävät muodot, mutta valitettavasti myös monien Rapolan tallentamien yhdyssanojen kirjoitusasuun on syytä suhtautua varovaisuudella, varsinkin jos alkuperäisillä lipuilla on ollut pelkkä hakusana ilman lause-esimerkkiä.

Hakusanoissa on yleiskielistetty myös yhdyssanojen oikeinkirjoitusta, mutta näiden alkuperäinen kirjoitusasu käy ilmi vasta yhdyssanojen koodauksesta (ks. kohta 4).

Aineiston koodaus

Aineisto on koodattu jäännöksettömästi seuraaviin perusryhmiin:

j = johdos

y = yhdyssana

sl = sanaliitto

L = laina

p = perussana

Etenkin johdokset ja yhdyssanat on jaettu lukuisiin alaryhmiin.

Johdokset

Johdokset (ja Rapolan kokoelmaansa sisällyttämät partisiipit) on koodattu isokirjaimisilla lyhenteillä (esim. kaave E, valaista AISE). Nomini- ja verbijohdosten alaryhmittely käy ilmi seuraavasta luettelosta.


NominijohdoksetVerbijohdokset
Epuhe, peiteNArähinäAISEilmaista
EAtörkeäNEesineDAvaota
ELOpuikeloNENkukkanenELEihmetellä
ImalttiNIEKKAsävelniekkaHTIhuolehtia
IASoppias, harviasNKImaininkiILEkuvailla
INavainNKOalanko, ylänköIAhuolia, jukkia, toimia
INEjalkineNNAkuninkaannaINTUkehiintyä, vakiintua
INENaurinkoinen,eteläinenNNEharjanne, jyrkänneKSIhalveksia, haaveksia
IOarvio, hylkiöNTAannanta, heitäntäKSUhalveksua, otaksua
ISAsatoisa, näkyisäNTIvientiLTAedeltää, sisältää
ISASruokaisasNTOuskontoNTAsomentaa,suomentaa
JAistuja, tekijäNUTvalistunutNTUtointua, vakaantua
JAINENarpajaisetOmuisto, näköOAanoa, katsoa, sijoa
KAINENpienokainenOSkaivosOIDAluennoida, ympäröidä
KASrahakasREpölkäreOITTArajoittaa, sähköittää
KEniemekeRImittariSKENTELEtyöskentelee
KKAmustikkaSTOkirjasto, kurjalistoSTAjalostaa, maustaa
KKIvalokkiTARkieletärSTUmuodostua, onnistua
KKOkivikko, männikköTEpäätösteTAkuvata, sisätä, huveta
KSEveljesTONelämätön; tietämätönTAAsisustaa, säveltää
LAmummolaTTIkuvattiTSEharkita, ympäritä
LAINENvenäläinenTTOvangittoTTApainattaa, piirittää
LASoppilas, lähettiläsTTUkuvattuTUitsenäistyä
LEkappale, liittile, sävelUmaksu, näkyUkehittyä, soveltua
LLINENmaallinenUEpoikueUTAkotiuta, mukaua
LMAjärjelmäUSylennysUTTAaiheuttaa
LOhenkilö, nuottiloUSTAvierustaUTUpolveutua, vakautua
MAesitelmäUTkuuhut, päähytUUTTAperuuttaa, sivuutta
MAINENpoikamainenUUhakkuu
MINENeläminenUUSaituus, isännyys
MOlaskimoVA-aluonteva, äänevä
MOINENyhdenmöinenVA-pelävä, sointuva
MUSjuopumusVASluontevas

Yhdyssanat

Hakusanoissa yhdyssanat on kirjoitettu nykyisen yleiskielen mukaisesti. Yhdyssanojen alkuperäinen kirjoitusasu käy ilmi näiden koodauksesta, joka kertoo myös, kuinka monesta sanasta yhdyssana koostuu ja millainen on määriteosien sisältämien sanojen sijanvalinta. Koodissa oleva yhdysviiva osoittaa tämän paikan yhdyssanassa, y-koodia edeltävä numero 3 tai 4 kertoo puolestaan kahdesta sanasta muodostuvia pitempien yhdyssanojen osien lukumäärän. Esim.

elokeino y (= elokeino)

laskuoppi y-s (= lasku-oppi)

hietaerämaa 3y-ys (= hieta-erämaa)

kivipiirrepaino 3ys-s (= kivipiirre-paino)

poisjättömerkki 3y-s-s (pois-jättö-merkki)

valtavaratoimikunta 4ysss (= valtavaratoimikunta)

Lyhenteellä g on merkitty genetiivin sisältävät yhdyssanat. Lyhennettä edeltävä numero kertoo genetiivin sijainnin yhdyssanassa, M-kirjain kyseessä olevan monikon genetiivin.

ajanhenki 1Gy (= ajanhenki)

sanainkamppaus M1Gy (= sanainkamppaus)

erämaanmies 2g3y (= erämaanmies)

maanpallonkeskipiiru 1G2G4y-s-s-s (= maan-pallon-keski-piiru)

Muilla sijoilla alkavat yhdyssanat on varustettu koodeilla ABL (= ablatiivi), ADE (= adessiivi), ALL (= allatiivi), ILL (= illatiivi), INE (= inessiivi), INSTR (= instruktiivi), PROL (= prolatiivi) tai PRT (= partitiivi), esim.

edeltäluulo ABLy (= edeltäluulo)

eteenasetus ILLy-s (= eteenasetus)

kaksintaistelu INSTRy (= kaksintaistelu)

yhtämuotoisuus PRTy-s (= yhtämuotoisuus)

Sanaliitot

Sanaliittojen koodina on sl. Verbit on varustettu tätä edeltävällä v-kirjaimella. Koodi s l viittaa erikseen kirjoitettuihin sanoihin, jotka yhteen kirjoitettuina tulkittaisiin yhdyssanoiksi (esim. höyry vaunu ’höyry-vaunu’). Harvalukuisten kolmesta sanasta koostuvien lainojen koodina on sl3 (esim. itse itsensä opettanut ’itseoppinut’). Sanaliitot on koodattu yhdyssanojen tapaan myös määriteosan sijanvalinnan mukaan. Lisäksi sanaliitot on koodattu adjektiivi- tai partisiippialkuisuuden mukaisesti lyhenteillä Asl tai Pasl (esim. kansallinen varallisuus Asl ’kansallisvarallisuus’; kiertävä koulu Pasl ’kiertokoulu’, sivistynyt kansa Pasl ’sivistyskansa’).

Lainasanat

Lainasanojen koodina on ls.

Perussanat

Perussanojen koodina on p. Perussanoiksi on katsottu kaikki ne muodot, joita ei voi pitää sen enempää johdettuina, lainattuina kuin yhdistettyinäkään. Kysymysmerkillisinä mukana ovat muutamat vanhat etymologialtaan tai johtosuhteiltaan hankalat sanat (tanhua, sydän) sekä sellaiset kolmitavuiset muodot kuin happama ’hapan’, lämpimä ~ lämpymä ’lämmin’ ja ympyrä, jotka ovat todellisuudessa pikemminkin vartaloyleistyksiä tai takaperoisjohdoksia.

Lähde- ja lisätiedot

Kirjoittaja

Kirjoittajalla tarkoitetaan kunkin muodon konkreettista käyttäjää, niin alun perin suomeksi kirjoittanutta kuin toisesta kielestä kääntänyttä. Suurin osa kirjoittajista on merkitty pelkällä sukunimellä. Jos samaa sukunimeä käyttäneitä on useita, harvinaisemmat käyttäjät esiintyvät etunimillään tai nimikirjaimillaan (näin esim. Ahlqvist = August Ahlqvist, mutta tämän pikkuveli on merkitty: Ahlqvist, Fredrik). Kirjoittajiksi on merkitty myös muutamia kollektiiveja, kuten Komitea ja SKS:n tar(kistajat). Anonyymeina ilmestyneiden asetus- ja säädöstekstien kirjoittajaksi on merkitty Asetussuomentaja. Suuri osa muodoista on kuitenkin vailla tekijää, joksi on tällaisissa tapauksissa merkitty vain Anon (= anonyymi).

Julkaisutyyppi

Tästä käy ilmi, onko muoto peräisin sanakirjasta tai kalendaarijulkaisusta. Sanakirjoista peräisin olevien muotojen yleiskoodina on sk, jota on tarvittaessa tarkennettu seuraavasti.

sk = (tavallinen) sanakirja

sk s = sanasto

sk ts = tulkkisanakirja

sk m = muu sanakirja

Kalendaarijulkaisuista suurin osa on erilaisia lehtiä. Jonkin verran mukana on muita aikakautisia julkaisuja, kuten almanakkoja ja asetuksia, sekä kirjeitä.

Kirja

Lyhenteellä on merkitty kirja, josta muoto on. Lyhenteiden selitykset ovat omassa luettelossa.

Päivämäärä

Päivämäärä on mainittu ennen kaikkea asetuksista ja kirjeistä, joskus myös esim. päiväkirjoista ja pöytäkirjamerkinnöistä (harvemmin lehdistä, joista on merkitty numero).

Vuosi

Vuosilukutieto on enimmäkseen painovuoden mukainen, ainoastaan ensimmäisen jakson Suomi-kirjat on merkitty albumin vuoden mukaisesti, samaten eräät edellisenä vuonna painetut kalenterit.

a/b

Samana vuonna julkaistuille teoksille on annettu a-, b- tai c-tarkenne.

Sivu

Kunkin muodon sivunumero on mainittu, mikäli tämä on sanalipulla lipulla esitetty. Lehdistä mainittu numero voi olla myös lehden numero. Jos on selvää, kummasta on kyse, merkinnässä on käytetty lyhenteitä n:o (= numero) ja s (= sivu).

Sanaviite

Sanakirjoista ja sanastoista peräisin olevista muodoista on mainittu sanaviite, mikäli se ei ole sama kuin itse tarkasteltava muoto. Tulkkisanakirjoista on voitu mainita silti myös sivunumero.

Viime-esiintymä

Vakiintumatta jääneiden muotojen viimeinen aineistoesiintymä (ainakin käsitesarakkeen mukaisessa merkityksessä) on esitetty järjestyksessä Tekijä, Julkaisutyyppi tai Teos, Vuosiluku, Sivu tai Sanaviite, esim. Ahlman sk 1872 sv. Idéal Ahlqvist Geografia 1844:17 Lyhenteet käyvät ilmi samasta erillisestä lyhenneluettelosta, jossa ovat foorumien ja kirjojen lyhenteetkin.

Huom.

Huom.-sarakkeessa on erilaista lisätietoa, kuten R-lyhenteellä varustettuja mainintoja Rapolan omista kommenteista sanalipuilla ja Pg-lyhenteisiä viittauksia joidenkin lähdeteosten numerosignumiin Fredrik Wilhelm Pippingin teoksessa Luettelo suomeksi präntätyistä kirjoista. SE-lyhenteellä on merkitty tiedot, jotka ovat peräisin vasta Rapolan omasta Sanojemme ensiesiintymiä -julkaisusta. Sarakkeessa on myös Vanhan kirjasuomen sanakirjaan (lyh. VKS) viittaavia tietoja muotojen levikistä vanhassa kirjasuomessa (http://kaino.kotus.fi/vks/) ja Suomen murteiden sanakirjaan (lyh. SMS) pohjautuvia murretietoja (http://kaino.kotus.fi/sms/). Huom.-sarakkeessa on lisäksi tietoja Rapolan keruutyössään osin hyödyntämistä sekundaarilähteistä, jotka on selitetty tarkemmin lähteiden lyhenneluettelon lopussa.

Vakiintuma

Rapolan kokoelmassa hakumuotoina olevat nykysuomeen vakiintuneet esiintymät on koodattu §-merkillä, jotta ne voisi löytää myös mekaanisella sanahaulla.


Kirjallisuutta

Lauerma, Petri 2018a: Martti Rapolan 1800-luvun sanakokoelma, sen tausta ja vaikutus. Virittäjä 122, 255–281. Kotikielen Seura, Helsinki. Abstrakti: https://journal.fi/virittaja/article/view/66978

Lauerma, Petri 2018b: Finska språkets lånordsförråd i ljuset av Martti Rapolas ordsamling. Nordiske Studier i Leksikografi 14 & Skrifter udgivet af Nordisk Förening for Leksikografi 15, 178–185. Nordisk Förening for Leksikografi & Árni Magnússon Instituttet for islandske studier, Reykjavik.

Lauerma, Petri 2019: The development of 19th century Finnish vocabulary in the light of Martti Rapola’s word collection. Folia Uralica Debreceniensia 25, 133–152. Debreceni Egyetemi Kiadó, Debrecen. http://finnugor.arts.unideb.hu/fud/fud25/fud25_2.pdf

Nykysuomen sanakirja. WSOY, Porvoo 1951–1961.

Pipping, Fredrik Wilhelm 1856–1857: Luettelo suomeksi präntätyistä kirjoista. SKST 20. SKS, Helsinki.

Rapola, Martti 1960: Sanastomme ensiesiintymiä Agricolasta Yrjö-Koskiseen. Tietolipas 22. SKS, Helsinki.

Suomen murteiden sanakirja. Kotimaisten kielten tutkimuskeskuksen julkaisuja 36. Kotimaisten kielten tutkimuskeskus, Helsinki 1985–. http://kaino.kotus.fi/sms/

Vanhan kirjasuomen sanakirja. Kotimaisten kielten tutkimuskeskuksen julkaisuja 33. Kotimaisten kielten tutkimuskeskus, Helsinki 1985–. http://kaino.kotus.fi/vks/