La question de savoir quelle langue a le plus de mots est une question scandaleusement controversée – même les linguistes eux-mêmes essaient souvent d’éviter ce débat. Pourtant, lorsque nous commençons à comparer des langues, la recherche de celle qui contient le plus de mots devient inévitable. Malgré sa simplicité apparente, ce n’est pas une question facile, et essayer d’y répondre est une entreprise ambitieuse.
Pouvons-nous nous fier aux dictionnaires pour découvrir quelle langue contient le plus de mots?
Si nous devions baser notre réponse uniquement sur le nombre strict d’entrées de dictionnaire, l’anglais est parmi les plus grandes langues en nombre de mots. Il contient plus de 200 000 mots dans l’Oxford English Dictionary, dont 171 476 mots en usage et 47 156 mots obsolètes.
Ceci est largement dû aux invasions de l’Angleterre par les Vikings puis les Normands, ainsi qu’à la colonisation et des vagues d’exploration qui ont complété le vocabulaire anglais avec une multitude de mots étrangers. Aujourd’hui, avec l’anglais utilisé comme lingua franca dans notre monde global, de nouveaux mots sont ajoutés chaque jour.
Pendant ce temps, le français – pour lequel le dictionnaire Larousse répertorie quelque 59 000 mots – apparaît à première vue comme un langue avec un vocabulaire beaucoup plus petit. Mais est-ce aussi simple que cela? Le fait que des mots couramment utilisés depuis des années comme burrata, yuzu ou covoiturer ne soient entrés que récemment dans Larousse jette un doute sur l’idée que les dictionnaires devraient être la référence la plus valable pour nos mesures. Par exemple, le dictionnaire Littré compte 132 000 mots actifs, soit plus du double du nombre d’entrées de Larousse, même s’il s’agit de la même langue. Et ces dictionnaires sont limités aux mots d’un pays, mais le français est utilisé bien au-delà des frontières de la France. Les listes pour le français seraient sûrement différentes entre les dictionnaires québécois et togolais.
Maintenant, il est évident que cette mesure, supposée être un simple jeu de nombres, est plus complexe quand on creuse vraiment. Mais n’abandonnons pas encore !
Y a-t-il une autre façon de mesurer?
Si essayer de trouver le nombre total de mots est compliqué, nous pouvons toujours chercher une réponse d’une autre façon. La capacité d’une langue à décrire, à travers son vocabulaire et ses expressions idiomatiques, est peut-être une meilleure mesure de l’ampleur.
Au cœur de cette controverse se trouve le débat sur ce qu’est réellement un mot. Selon Merriam-Webster, un mot est « un son de parole ou une série de sons de parole qui symbolise et communique une signification généralement sans être divisible en unités plus petites capables d’une utilisation indépendante. » Les linguistes vont plus loin et appellent ces plus petites unités productrices de sens des morphèmes. Puisqu’un mot est souvent composé de plusieurs morphèmes – dont certains sont des mots en eux-mêmes – il peut souvent être difficile d’établir des frontières solides entre les mots.
Doit-on prendre en compte les changements résultant de l’inflexion des racines verbales en mots différents? C’est le cas de beso, besito, besar (baiser, picorer sur la joue, embrasser) en espagnol. Une question secondaire se pose fait qu’un mot peut avoir plusieurs significations. Il y en a d’innombrables en anglais: le mot walk, par exemple, fait référence à la fois au verbe (marcher) et au nom (marcher).
De plus, dans certaines langues, il est courant de créer de nouveaux mots en joignant d’autres mots. L’allemand, avec ses nombreux noms composites de type Lego, est un cas typique. Mais pouvons-nous vraiment dire que la simple liaison de deux noms forme un mot entièrement nouveau? Est Unabhängigkeitserklärung, qui se traduit par « déclaration de dépendance, « un tout nouveau mot quand il est simplement composé de deux mots courants?
De même, le turc, une langue agglutinante, permet la construction de mots à partir de nombreux suffixes collés ensemble. Le très coloré muvaffakiyetsizleştiricileştiriveremeyebileceklerimizdenmişsinizcesine, qui signifie « comme si vous apparteniez à ceux que nous ne pourrions peut-être pas facilement transformer en fabricant de lettres infructueuses », contient 70 lettres. Devrions-nous le considérer comme une entrée séparée, ou compter uniquement sur le mot racine muvaffakiyet (succès)?
Qu’en est-il des langues utilisant d’autres systèmes d’écriture?
Le problème s’aggrave pour les langues où les combinaisons sont nécessaires. Les Chinois ne sont pas concernés par le concept d’un mot parce que l’unité de base est un caractère (ou un logogramme, d’un point de vue technique). C’est son utilisation, combinée à un autre logogramme, qui crée un sens. 中国 (Zhōngguó) est le mot pour la Chine. « Empire du Milieu , ”Bien que plus coloré, n’est qu’une traduction littérale de chaque caractère, mais il combine les mots milieu et empire. Cela signifie-t-il que Zhōngguó n’est pas un mot à part entière?
Plutôt que de mesurer les langues les unes par rapport aux autres, pourquoi ne pas se demander comment les langues étrangères s’enrichissent mutuellement? Ainsi, alors que l’anglais est un prétendant clair pour avoir le plus de mots et que l’allemand et le turc ont une grande capacité pour des combinaisons infinies, toutes les langues finissent par en influencer les autres.Chacun d’eux représente un univers unique, comparable à une pièce de puzzle dans laquelle chaque langue contribue à compléter la vue d’ensemble. Peut-être qu’un exercice plus instructif que de compter les mots serait de demander ceci: combien de langues avez-vous besoin de parler avant de pouvoir transmettre toute la gamme de l’expérience humaine?