De vraag welke taal de meeste woorden heeft, is schokkend controversieel – zelfs taalkundigen proberen vaak dit debat te vermijden. Maar als we talen beginnen te vergelijken, wordt de zoektocht om erachter te komen welke de meeste woorden heeft, onvermijdelijk. Ondanks de schijnbare eenvoud is dit geen gemakkelijke vraag, en het is een ambitieuze onderneming om erop te antwoorden.
Kunnen we op woordenboeken vertrouwen om erachter te komen welke taal de meeste woorden heeft?
Als we ons antwoord alleen zouden baseren op het strikte aantal woordenboekvermeldingen, is Engels een van de grootste talen op basis van het aantal woorden. Het heeft meer dan 200.000 woorden in het Oxford English Dictionary, waaronder 171.476 woorden in gebruik en 47.156 verouderde woorden.
Dit is grotendeels te wijten aan de invallen van Engeland door de Vikingen en daarna de Noormannen, evenals kolonisatie en verkenningsgolven die het Engelse vocabulaire aanvulden met een groot aantal buitenlandse woorden. Tegenwoordig, met Engels als de lingua franca in onze mondiale wereld, worden er elke dag nieuwe woorden toegevoegd.
Ondertussen lijkt Frans – waarvoor het woordenboek Larousse zo’n 59.000 woorden opsomt – op het eerste gezicht een taal met een veel kleinere woordenschat. Maar is het zo simpel? Het feit dat woorden die al jaren vaak worden gebruikt, zoals burrata, yuzu of covoiturer pas onlangs Larousse binnenkwamen, doet twijfels rijzen over het idee dat woordenboeken de meest geldige referentie zouden moeten zijn voor onze metingen. Het woordenboek Littré heeft bijvoorbeeld 132.000 actieve woorden, wat meer is dan het dubbele van het aantal ingangen in Larousse, ook al zijn ze voor dezelfde taal. En deze woordenboeken zijn beperkt tot de woorden van één land, maar Frans wordt tot ver buiten de grenzen van Frankrijk gebruikt. De lijsten voor het Frans zouden zeker verschillen tussen woordenboeken die in Québec zijn gemaakt en in Togo.
Nu is het duidelijk dat deze meting, zogenaamd een rechttoe rechtaan getallenspel, ingewikkelder is als je er echt in graaft. Maar laten we nog niet opgeven !
Is er een andere manier om te meten?
Als het moeilijk is om het totale aantal woorden te vinden, kunnen we toch op een andere manier een antwoord zoeken. Misschien is het vermogen van een taal om te beschrijven, door middel van zijn vocabulaire en idiomatische uitdrukkingen, een betere maatstaf voor de breedte.
De kern van deze controverse is het debat over wat een woord eigenlijk is. Volgens Merriam-Webster is een woord ‘een spraakklank of een reeks spraakklanken die een betekenis symboliseren en overbrengen die gewoonlijk niet opgedeeld kan worden in kleinere eenheden die onafhankelijk kunnen worden gebruikt’. Taalkundigen gaan een stap verder en noemen deze kleinste betekenisproducerende eenheden morfemen. Aangezien een woord vaak uit meerdere morfemen bestaat – waarvan sommige woorden op zichzelf zijn – kan het vaak moeilijk zijn om duidelijke grenzen tussen woorden vast te stellen.
Moeten we rekening houden met de veranderingen die het gevolg zijn van de verbuiging van werkwoordswortels als verschillende woorden? Dit is het geval met beso, besito, besar (kus, kus op de wang, omhelzing) in het Spaans. Een secundaire vraag rijst vanwege de feit dat één woord meerdere betekenissen kan hebben. Er zijn er talloze in het Engels: het woord walk verwijst bijvoorbeeld naar zowel het werkwoord (lopen) als het zelfstandig naamwoord (walk).
Verder, sommige talen maken het gebruikelijk om nieuwe woorden te creëren door andere woorden samen te voegen. Duits, met zijn vele lego-achtige samengestelde zelfstandige naamwoorden, is een typisch geval. Maar kunnen we echt zeggen dat het eenvoudig koppelen van twee zelfstandige naamwoorden een geheel nieuw woord vormt? Is Unabhängigkeitserklärung, wat zich vertaalt als “verklaring van in afhankelijkheid, “een heel nieuw woord als het slechts uit twee alledaagse woorden bestaat?
Evenzo maakt Turks, een agglutinerende taal, de constructie mogelijk van woorden uit vele aan elkaar geplakte achtervoegsels. De zeer kleurrijke muvaffakiyetsizleştiricileştiriveremeyebileceklerimizdenmişsinizcesine, wat betekent ‘alsof u behoort tot degenen van wie we misschien niet gemakkelijk een maker van mislukte exemplaren kunnen maken’, heeft 70 letters. Moeten we het als een aparte vermelding beschouwen, of alleen op de stamwoord muvaffakiyet (succes)?
Hoe zit het met talen die andere schrijfsystemen gebruiken?
Het probleem wordt erger voor talen waarbij combinaties nodig zijn. De Chinezen maken zich geen zorgen over het concept van een woord omdat de basiseenheid een teken is (of een logogram, vanuit technisch perspectief). Het is het gebruik ervan, gecombineerd met een ander logogram, dat betekenis creëert. 中国 (Zhōngguó) is het woord voor China. “Empire of the Middle , ”Hoewel kleurrijker, is slechts een letterlijke vertaling van elk personage, maar het combineert de woorden middle en empire. Betekent dit dat Zhōngguó geen op zichzelf staand woord is?
Waarom vragen we niet, in plaats van talen tegen elkaar af te meten, hoe vreemde talen elkaar verrijken? Dus hoewel Engels een duidelijke kanshebber is om de meeste woorden te hebben en Duits en Turks een grote capaciteit hebben voor oneindige combinaties, beïnvloeden alle talen uiteindelijk anderen.Elk van hen vertegenwoordigt een uniek universum, vergelijkbaar met een puzzelstukje waarin elke taal bijdraagt aan het completeren van het grote geheel. Misschien zou een meer verhelderende oefening dan het tellen van woorden zijn om de volgende vraag te stellen: hoeveel talen moet je spreken voordat je het volledige scala aan menselijke ervaring kunt overbrengen?