Kysymys siitä, missä kielessä on eniten sanoja, on järkyttävän kiistanalainen – jopa kielitieteilijät itse yrittävät usein päästä eroon tästä keskustelusta. Silti kun alamme vertailla kieliä, etsiminen sen selvittämiseksi, kenellä on eniten sanoja, on väistämätöntä. Näennäisestä yksinkertaisuudesta huolimatta tämä ei ole helppo kysymys, ja yrittäminen vastata siihen on kunnianhimoinen sitoumus.
Voimmeko luottaa sanakirjoihin selvittääksemme, millä kielellä on eniten sanoja?
Jos vastauksemme perustuisi vain sanakirjojen tiukkaan määrään, englanti on sanamäärältään yksi suurimmista kielistä. Sillä on yli 200 000 sanaa Oxfordin englanninkielisessä sanakirjassa, mukaan lukien käytössä olevat 171 476 sanaa ja 47 156 vanhentunutta sanaa.
Tämä johtuu suurelta osin viikinkien ja sitten normannien hyökkäyksistä Englantiin sekä kolonisaatiosta ja tutkimusaallot, jotka täydensivät englannin sanastoa lukuisilla vierailla sanoilla. Tänään, kun englantia käytetään lingua francana globaalissa maailmassa, uusia sanoja lisätään päivittäin.
Samaan aikaan ranska – josta sanakirjassa Larousse luetellaan noin 59 000 sanaa – näyttää ensi silmäyksellä olevan kieli, jolla on paljon pienempi sanasto. Mutta onko se niin yksinkertaista? Se tosiasia, että vuosien ajan yleisesti käytetyt sanat, kuten burrata, yuzu tai covoiturer, tulivat vasta äskettäin Larousseen, herättää epäilyn siitä, että sanakirjojen olisi oltava pätevin viite mittauksessamme. Esimerkiksi sanakirjassa Littré on 132 000 aktiivista sanaa, mikä on yli kaksinkertainen määrä Laroussen merkintöjä, vaikka ne olisivatkin samaa kieltä. Nämä sanakirjat rajoittuvat yhden maan sanoihin, mutta ranskaa käytetään paljon Ranskan rajojen ulkopuolella. Ranskan kielen luettelot eroavat varmasti Québecissä ja Togossa tehtyjen sanakirjojen välillä.
Nyt on selvää, että tämä mittaus, oletettavasti suoraviivainen numeropeli, on monimutkaisempi, kun todella kaivautuu sisään. Mutta emme anna periksi vielä !
Onko olemassa muuta tapaa mitata?
Jos sanojen kokonaismäärän löytäminen on monimutkaista, voimme silti etsiä vastausta toisella tavalla. Ehkä kielen kyky kuvata sanastonsa ja idiomaattisten ilmaisujensa avulla on parempi mittasuhde.
Tämän kiistan ytimessä on keskustelu siitä, mikä sana todellisuudessa on. Merriam-Websterin mukaan sana on ”puheen ääni tai sarja ääniääniä, joka symboloi ja välittää merkityksen yleensä olematta jaettavissa pienempiin yksiköihin, jotka kykenevät itsenäiseen käyttöön.” Kielitieteilijät menevät askeleen pidemmälle ja kutsuvat näitä pienimpiä merkityksiä tuottavia yksiköitä morfeemeiksi. Koska sana koostuu usein useista morfeemeista – joista osa on sinänsä sanoja -, sanojen välille voi usein olla vaikeaa muodostaa vankkoja rajoja.
Pitäisikö meidän ottaa huomioon muutokset, jotka johtuvat verbijuurien taivutuksesta eri sanoiksi? Näin on espanjan kielellä beso, besito, besar (suudelma, nokka poskelle, syleily). Toissijainen kysymys syntyy tosiasia, että yhdellä sanalla voi olla useita merkityksiä. Englanninkielisiä on lukemattomia: esimerkiksi sana kävellä viittaa sekä verbiin (kävelemään) että substantiiviin (kävelemään).
Lisäksi Joissakin kielissä on yleistä käytäntöä uusien sanojen luomisesta yhdistämällä muut sanat yhteen.Saksa, jossa on monia Lego-tyyppisiä yhdistettyjä substantiiveja, on tyypillinen tapaus. Mutta voimmeko todellakin sanoa, että kahden substantiivin yksinkertainen linkittäminen muodostaa täysin uuden sanan? Onko Unabhängigkeitserklärung, joka tarkoittaa ”ilmoitusta riippuvuus ”, kokonaan uusi sana, kun se koostuu vain kahdesta tavallisesta sanasta?
Vastaavasti turkki, agglutinatiivinen kieli, sallii sanojen rakentamisen monista yhteen liitetyistä loppuliitteistä. Erittäin värikkäässä muvaffakiyetsizleştiricileştiriveremeyebileceklerimizdenmişsinizcesine, mikä tarkoittaa ”ikään kuin sinä olisit sellaisista, joita emme ehkä pysty tekemään helposti epäonnistuneiden valmistajiksi”, on 70 kirjainta. Pitäisikö meidän pitää sitä erillisenä merkintänä tai laskea se yksinomaan juurisana muvaffakiyet (menestys)?
Entä muita kirjoitinjärjestelmiä käyttävät kielet?
Ongelma pahenee kielillä, joissa tarvitaan yhdistelmiä. Kiinalaiset eivät ole huolissaan käsitteestä sanan, koska perusyksikkö on merkki (tai logogrammi teknisestä näkökulmasta). Sen käyttö yhdessä toisen logogrammin kanssa luo merkityksen. 中国 (Zhōngguó) on sana Kiinalle. ”Keski-imperiumi ”, Vaikka värikkäämpi, on vain kirjaimellinen käännös jokaisesta hahmosta, mutta siinä yhdistyvät sanat keski ja imperiumi. Tarkoittaako tämä sitä, että Zhōngguó ei ole oma sanansa?
Sen sijaan, että mittaisimme kieliä toistensa suhteen, miksi emme kysy, kuinka vieraat kielet rikastuttavat toisiaan? Joten vaikka englanti on selkeä kilpailija siitä, että sanoja on eniten, ja saksalla ja turkilla on suuri kapasiteetti äärettömiin yhdistelmiin, kaikki kielet vaikuttavat lopulta muihin.Jokainen niistä edustaa ainutlaatuista universumia, joka on verrattavissa palapelin palaan, jossa jokainen kieli myötävaikuttaa kokonaiskuvan täydentämiseen. Ehkä valaisevampi harjoitus kuin sanojen laskeminen olisi kysyä tältä: Kuinka monta kieltä sinun on puhuttava, ennen kuin voit välittää koko ihmiskokemuksen?