RAPOLAN 1800-LUVUN SANASTO
Petri Lauerma (Kotimaisten kielten keskus)
Niko Partanen (Helsingin yliopisto), koordinointi
Antti Kanner (Helsingin yliopisto), tekninen toteutus
Vanhan kirjasuomen ja suomen murteiden tutkijana ansioitunut Martti Rapola (1891–1972) kokosi 1800-luvun kirjasuomesta laajan aineiston, jonka hän järjesti merkityksen mukaan. Näistä 1930–1950-luvuilla tehdyistä poiminnoista syntyi Rapolan 1800-luvun sanakokoelma, joka käsittää kaikkiaan 44 000 sanalippua. Rapola hyödynsi aineistoaan monissa 1940–1950 -luvuilla julkaisemissaan artikkeleissa ja vuonna 1960 painetussa valikoimassa Sanojemme ensiesiintymiä Agricolasta Yrjö-Koskiseen, joka nimensä mukaisesti sisältää vain kirjasuomeen vakiintunutta sanastoa.
Verkossa julkaistava aineisto pohjautuu alkuperäisiin sanalippuihin, jotka on valikoiden toimitettu tietokannaksi. Tämä sisältää tietoja kaikkiaan 5600 sanasta, jotka jakautuvat 1070 käsitteeseen. Alkuperäisestä aineistosta tämä muodostaa noin neljänneksen.
Aineiston rajaus
Tietokantaa toimitettaessa on keskitytty niiden käsitteiden ilmauksiin, joille 1800-luvulla kehittyi suomalainen vastine, sikäli kuin näistä on alkuperäisessä lipustossa useampia tietoja. Pois on karsittu sellaiset käsitteet, jotka saivat sittemmin vakiintuneen suomalaisen ilmauksensa jo vanhan kirjasuomen kaudella (esim. AAPINEN ja HOLHOOJA). Näistä jo Vanhan kirjasuomen sanakirja tarjoaa aineistoa. Tietokantaan on kuitenkin otettu mukaan ilmaisultaan vain lainasanan varaan jääneet käsitteet (esim. ANANAS ja KONSERTTI), joille esitetyistä suomalaisista vastineista mikään ei 1800-luvullakaan vakiintunut.
Tietokannasta on samaten rajattu pois vasta 1900-luvulla vakiintuneen suomalaisen ilmauksensa saaneet käsitteet, joita alkuperäisessä lipustossa on vain satunnaisesti. Esim. käsitettä KANSANEDUSTAJA ei tietokannassa siksi ole. Nykysuomen sanakirja ja etenkin sen alkuperäislipusto tarjoaa aineistoa tällaisista sanoista.
Tietokantaan sisältyvää materiaalia voi hakea paitsi käsitteittäin ja hakusanoittain, myös rakennepiirteittäin, vuosittain ja lähteittäin.
Käsite, hakusana ja sanan asu
Käsite
Tietokannassa on operoitu Rapolan luomilla käsitteillä niin pitkälle kuin tämä on ollut mahdollista. Jonkin verran käsitteitä on jouduttu yhdistelemään, sillä etenkin lainasanoja on alkuperäislipustossa hajaantunut erilleen suomalaisista vastineistaan. Joskus harvoin käsitteitä on jouduttu hajottamaankin (esim. käsite LYYRILLINEN käsitteiksi LYYRIKKO, LYYRILLINEN ja LYYRILLINEN RUNO).
Oman pienen ongelmansa aiheuttaa se, että 1930–1950-luvuilla tehty kokoelma ei tietenkään kaikista käsitteistä tavoita nykyisin käytössä olevia asuja. Muutamien käsitteiden nimitysten kieliasua on siksi modernisoitu Rapolan käyttämästä (esim. EVANKEELINEN > EVANKELINEN; KOMISSAARIO > KOMISARIO).
Hakusana
Hakusanoina ovat kustakin käsitteestä tallennetut ilmaukset, jotka on järjestetty käsitteittäin aikajärjestykseen vanhimmista nuorimpaan. Hakusanat on tarvittaessa yleiskielistetty, jotta näiden pohjalta voitaisiin tarvittaessa hakea aineistoa myös muista korpuksista. Yleiskielistyksessä on noudatettu seuraavia periaatteita.
Aineistossa verraten harvoissa lähteissä tavattavat vanhan ortografian mukaiset muodot on hakusanoissa oikeinkirjoitukseltaan modernisoitu. Keskeiset muutokset ovat x > ks, tz > ts, mb > mp, ld > lt, nd > nt, ng > nk (vahvassa asteessa), nk > ng (heikossa asteessa), c > k tai s, ph > f ja w > v. Vokaaleista on muuteltu etenkin jälkitavujen lyhyiksi merkittyjä pitkiä vokaaleja kahdella vokaalimerkillä merkityiksi. Varsinkin oi-loppuisia diftongeja on kirjakielen normien mukaisesti muuteltu välillä i:ttömiksi, o:lliseksi merkittyjä asuja taas diftongillisiksi.
Osa tietokannan aineistosta on nykyistä tuntuvasti murteellisempia. Esim. loppuheittoisia muotoja on palautettu i-loppuisiksi, itämurteisen d:ttömiä tai diftongiutuneita muotoja d:llisiksi ja pitkävokaalisiksi. Lainasanoja on varovasti myös yleiskielistetty muiltakin osin, mikäli näistä tunnetaan vakiintuneempia asuja (esim. terehtyöri > tirehtööri ’johtaja’, raadi > raati ’raati’, revormatsioni > reformaatio ’uskonpuhdistus’; ennallaan sen sijaan esim. bildhugari ’kuvanveistäjä’), mutta a-loppuisia ei ole yleiskielistetty i-loppuisiksi.
Asu
Sanan autenttinen kirjoitusasu on mainittu, jos se poikkeaa hakusanoitetusta yleiskielisestä asusta. Keskeiset tapaukset on esitelty edellä. Joissain tapauksissa Rapola itse on merkinnyt keräämistään muodoista vain yleiskielistetyn asun. Tällaisia ovat monet etenkin v:n (versus w:n) sisältävät muodot, mutta valitettavasti myös monien Rapolan tallentamien yhdyssanojen kirjoitusasuun on syytä suhtautua varovaisuudella, varsinkin jos alkuperäisillä lipuilla on ollut pelkkä hakusana ilman lause-esimerkkiä.
Hakusanoissa on yleiskielistetty myös yhdyssanojen oikeinkirjoitusta, mutta näiden alkuperäinen kirjoitusasu käy ilmi vasta yhdyssanojen koodauksesta (ks. kohta 4).
Aineiston koodaus
Aineisto on koodattu jäännöksettömästi seuraaviin perusryhmiin:
j = johdos
y = yhdyssana
sl = sanaliitto
L = laina
p = perussana
Etenkin johdokset ja yhdyssanat on jaettu lukuisiin alaryhmiin.
Johdokset
Johdokset (ja Rapolan kokoelmaansa sisällyttämät partisiipit) on koodattu isokirjaimisilla lyhenteillä (esim. kaave E, valaista AISE). Nomini- ja verbijohdosten alaryhmittely käy ilmi seuraavasta luettelosta.
Nominijohdokset | Verbijohdokset | ||||
---|---|---|---|---|---|
E | puhe, peite | NA | rähinä | AISE | ilmaista |
EA | törkeä | NE | esine | DA | vaota |
ELO | puikelo | NEN | kukkanen | ELE | ihmetellä |
I | maltti | NIEKKA | sävelniekka | HTI | huolehtia |
IAS | oppias, harvias | NKI | maininki | ILE | kuvailla |
IN | avain | NKO | alanko, ylänkö | IA | huolia, jukkia, toimia |
INE | jalkine | NNA | kuninkaanna | INTU | kehiintyä, vakiintua |
INEN | aurinkoinen,eteläinen | NNE | harjanne, jyrkänne | KSI | halveksia, haaveksia |
IO | arvio, hylkiö | NTA | annanta, heitäntä | KSU | halveksua, otaksua |
ISA | satoisa, näkyisä | NTI | vienti | LTA | edeltää, sisältää |
ISAS | ruokaisas | NTO | uskonto | NTA | somentaa,suomentaa |
JA | istuja, tekijä | NUT | valistunut | NTU | tointua, vakaantua |
JAINEN | arpajaiset | O | muisto, näkö | OA | anoa, katsoa, sijoa |
KAINEN | pienokainen | OS | kaivos | OIDA | luennoida, ympäröidä |
KAS | rahakas | RE | pölkäre | OITTA | rajoittaa, sähköittää |
KE | niemeke | RI | mittari | SKENTELE | työskentelee |
KKA | mustikka | STO | kirjasto, kurjalisto | STA | jalostaa, maustaa |
KKI | valokki | TAR | kieletär | STU | muodostua, onnistua |
KKO | kivikko, männikkö | TE | päätöste | TA | kuvata, sisätä, huveta |
KSE | veljes | TON | elämätön; tietämätön | TAA | sisustaa, säveltää |
LA | mummola | TTI | kuvatti | TSE | harkita, ympäritä |
LAINEN | venäläinen | TTO | vangitto | TTA | painattaa, piirittää |
LAS | oppilas, lähettiläs | TTU | kuvattu | TU | itsenäistyä |
LE | kappale, liittile, sävel | U | maksu, näky | U | kehittyä, soveltua |
LLINEN | maallinen | UE | poikue | UTA | kotiuta, mukaua |
LMA | järjelmä | US | ylennys | UTTA | aiheuttaa |
LO | henkilö, nuottilo | USTA | vierusta | UTU | polveutua, vakautua |
MA | esitelmä | UT | kuuhut, päähyt | UUTTA | peruuttaa, sivuutta |
MAINEN | poikamainen | UU | hakkuu | ||
MINEN | eläminen | UUS | aituus, isännyys | ||
MO | laskimo | VA-a | luonteva, äänevä | ||
MOINEN | yhdenmöinen | VA-p | elävä, sointuva | ||
MUS | juopumus | VAS | luontevas |
Yhdyssanat
Hakusanoissa yhdyssanat on kirjoitettu nykyisen yleiskielen mukaisesti. Yhdyssanojen alkuperäinen kirjoitusasu käy ilmi näiden koodauksesta, joka kertoo myös, kuinka monesta sanasta yhdyssana koostuu ja millainen on määriteosien sisältämien sanojen sijanvalinta. Koodissa oleva yhdysviiva osoittaa tämän paikan yhdyssanassa, y-koodia edeltävä numero 3 tai 4 kertoo puolestaan kahdesta sanasta muodostuvia pitempien yhdyssanojen osien lukumäärän. Esim.
elokeino y (= elokeino)
laskuoppi y-s (= lasku-oppi)
hietaerämaa 3y-ys (= hieta-erämaa)
kivipiirrepaino 3ys-s (= kivipiirre-paino)
poisjättömerkki 3y-s-s (pois-jättö-merkki)
valtavaratoimikunta 4ysss (= valtavaratoimikunta)
Lyhenteellä g on merkitty genetiivin sisältävät yhdyssanat. Lyhennettä edeltävä numero kertoo genetiivin sijainnin yhdyssanassa, M-kirjain kyseessä olevan monikon genetiivin.
ajanhenki 1Gy (= ajanhenki)
sanainkamppaus M1Gy (= sanainkamppaus)
erämaanmies 2g3y (= erämaanmies)
maanpallonkeskipiiru 1G2G4y-s-s-s (= maan-pallon-keski-piiru)
Muilla sijoilla alkavat yhdyssanat on varustettu koodeilla ABL (= ablatiivi), ADE (= adessiivi), ALL (= allatiivi), ILL (= illatiivi), INE (= inessiivi), INSTR (= instruktiivi), PROL (= prolatiivi) tai PRT (= partitiivi), esim.
edeltäluulo ABLy (= edeltäluulo)
eteenasetus ILLy-s (= eteenasetus)
kaksintaistelu INSTRy (= kaksintaistelu)
yhtämuotoisuus PRTy-s (= yhtämuotoisuus)
Sanaliitot
Sanaliittojen koodina on sl. Verbit on varustettu tätä edeltävällä v-kirjaimella. Koodi s l viittaa erikseen kirjoitettuihin sanoihin, jotka yhteen kirjoitettuina tulkittaisiin yhdyssanoiksi (esim. höyry vaunu ’höyry-vaunu’). Harvalukuisten kolmesta sanasta koostuvien lainojen koodina on sl3 (esim. itse itsensä opettanut ’itseoppinut’). Sanaliitot on koodattu yhdyssanojen tapaan myös määriteosan sijanvalinnan mukaan. Lisäksi sanaliitot on koodattu adjektiivi- tai partisiippialkuisuuden mukaisesti lyhenteillä Asl tai Pasl (esim. kansallinen varallisuus Asl ’kansallisvarallisuus’; kiertävä koulu Pasl ’kiertokoulu’, sivistynyt kansa Pasl ’sivistyskansa’).
Lainasanat
Lainasanojen koodina on ls.
Perussanat
Perussanojen koodina on p. Perussanoiksi on katsottu kaikki ne muodot, joita ei voi pitää sen enempää johdettuina, lainattuina kuin yhdistettyinäkään. Kysymysmerkillisinä mukana ovat muutamat vanhat etymologialtaan tai johtosuhteiltaan hankalat sanat (tanhua, sydän) sekä sellaiset kolmitavuiset muodot kuin happama ’hapan’, lämpimä ~ lämpymä ’lämmin’ ja ympyrä, jotka ovat todellisuudessa pikemminkin vartaloyleistyksiä tai takaperoisjohdoksia.
Lähde- ja lisätiedot
Kirjoittaja
Kirjoittajalla tarkoitetaan kunkin muodon konkreettista käyttäjää, niin alun perin suomeksi kirjoittanutta kuin toisesta kielestä kääntänyttä. Suurin osa kirjoittajista on merkitty pelkällä sukunimellä. Jos samaa sukunimeä käyttäneitä on useita, harvinaisemmat käyttäjät esiintyvät etunimillään tai nimikirjaimillaan (näin esim. Ahlqvist = August Ahlqvist, mutta tämän pikkuveli on merkitty: Ahlqvist, Fredrik). Kirjoittajiksi on merkitty myös muutamia kollektiiveja, kuten Komitea ja SKS:n tar(kistajat). Anonyymeina ilmestyneiden asetus- ja säädöstekstien kirjoittajaksi on merkitty Asetussuomentaja. Suuri osa muodoista on kuitenkin vailla tekijää, joksi on tällaisissa tapauksissa merkitty vain Anon (= anonyymi).
Julkaisutyyppi
Tästä käy ilmi, onko muoto peräisin sanakirjasta tai kalendaarijulkaisusta. Sanakirjoista peräisin olevien muotojen yleiskoodina on sk, jota on tarvittaessa tarkennettu seuraavasti.
sk = (tavallinen) sanakirja
sk s = sanasto
sk ts = tulkkisanakirja
sk m = muu sanakirja
Kalendaarijulkaisuista suurin osa on erilaisia lehtiä. Jonkin verran mukana on muita aikakautisia julkaisuja, kuten almanakkoja ja asetuksia, sekä kirjeitä.
Kirja
Lyhenteellä on merkitty kirja, josta muoto on. Lyhenteiden selitykset ovat omassa luettelossa.
Päivämäärä
Päivämäärä on mainittu ennen kaikkea asetuksista ja kirjeistä, joskus myös esim. päiväkirjoista ja pöytäkirjamerkinnöistä (harvemmin lehdistä, joista on merkitty numero).
Vuosi
Vuosilukutieto on enimmäkseen painovuoden mukainen, ainoastaan ensimmäisen jakson Suomi-kirjat on merkitty albumin vuoden mukaisesti, samaten eräät edellisenä vuonna painetut kalenterit.
a/b
Samana vuonna julkaistuille teoksille on annettu a-, b- tai c-tarkenne.
Sivu
Kunkin muodon sivunumero on mainittu, mikäli tämä on sanalipulla lipulla esitetty. Lehdistä mainittu numero voi olla myös lehden numero. Jos on selvää, kummasta on kyse, merkinnässä on käytetty lyhenteitä n:o (= numero) ja s (= sivu).
Sanakirjoista ja sanastoista peräisin olevista muodoista on mainittu sanaviite, mikäli se ei ole sama kuin itse tarkasteltava muoto. Tulkkisanakirjoista on voitu mainita silti myös sivunumero.
Viime-esiintymä
Vakiintumatta jääneiden muotojen viimeinen aineistoesiintymä (ainakin käsitesarakkeen mukaisessa merkityksessä) on esitetty järjestyksessä Tekijä, Julkaisutyyppi tai Teos, Vuosiluku, Sivu tai Sanaviite, esim. Ahlman sk 1872 sv. Idéal Ahlqvist Geografia 1844:17 Lyhenteet käyvät ilmi samasta erillisestä lyhenneluettelosta, jossa ovat foorumien ja kirjojen lyhenteetkin.
Huom.
Huom.-sarakkeessa on erilaista lisätietoa, kuten R-lyhenteellä varustettuja mainintoja Rapolan omista kommenteista sanalipuilla ja Pg-lyhenteisiä viittauksia joidenkin lähdeteosten numerosignumiin Fredrik Wilhelm Pippingin teoksessa Luettelo suomeksi präntätyistä kirjoista. SE-lyhenteellä on merkitty tiedot, jotka ovat peräisin vasta Rapolan omasta Sanojemme ensiesiintymiä -julkaisusta. Sarakkeessa on myös Vanhan kirjasuomen sanakirjaan (lyh. VKS) viittaavia tietoja muotojen levikistä vanhassa kirjasuomessa (http://kaino.kotus.fi/vks/) ja Suomen murteiden sanakirjaan (lyh. SMS) pohjautuvia murretietoja (http://kaino.kotus.fi/sms/). Huom.-sarakkeessa on lisäksi tietoja Rapolan keruutyössään osin hyödyntämistä sekundaarilähteistä, jotka on selitetty tarkemmin lähteiden lyhenneluettelon lopussa.
Vakiintuma
Rapolan kokoelmassa hakumuotoina olevat nykysuomeen vakiintuneet esiintymät on koodattu §-merkillä, jotta ne voisi löytää myös mekaanisella sanahaulla.
Kirjallisuutta
Lauerma, Petri 2018a: Martti Rapolan 1800-luvun sanakokoelma, sen tausta ja vaikutus. Virittäjä 122, 255–281. Kotikielen Seura, Helsinki. Abstrakti: https://journal.fi/virittaja/article/view/66978
Lauerma, Petri 2018b: Finska språkets lånordsförråd i ljuset av Martti Rapolas ordsamling. Nordiske Studier i Leksikografi 14 & Skrifter udgivet af Nordisk Förening for Leksikografi 15, 178–185. Nordisk Förening for Leksikografi & Árni Magnússon Instituttet for islandske studier, Reykjavik.
Lauerma, Petri 2019: The development of 19th century Finnish vocabulary in the light of Martti Rapola’s word collection. Folia Uralica Debreceniensia 25, 133–152. Debreceni Egyetemi Kiadó, Debrecen. http://finnugor.arts.unideb.hu/fud/fud25/fud25_2.pdf
Nykysuomen sanakirja. WSOY, Porvoo 1951–1961.
Pipping, Fredrik Wilhelm 1856–1857: Luettelo suomeksi präntätyistä kirjoista. SKST 20. SKS, Helsinki.
Rapola, Martti 1960: Sanastomme ensiesiintymiä Agricolasta Yrjö-Koskiseen. Tietolipas 22. SKS, Helsinki.
Suomen murteiden sanakirja. Kotimaisten kielten tutkimuskeskuksen julkaisuja 36. Kotimaisten kielten tutkimuskeskus, Helsinki 1985–. http://kaino.kotus.fi/sms/
Vanhan kirjasuomen sanakirja. Kotimaisten kielten tutkimuskeskuksen julkaisuja 33. Kotimaisten kielten tutkimuskeskus, Helsinki 1985–. http://kaino.kotus.fi/vks/