Quelle est (vraiment) la meilleure langue ?


Quelle est la meilleure langue ? Cette question est un énorme pavé dans la mare pour un linguiste, et je l’ai beaucoup évitée. Aujourd’hui, je vais voir s’il est possible d’y répondre de manière définitive.


Sommaire

  1. Une langue est meilleure quand elle a des normes
    1. D’où ça vient ?
    2. Est-ce que ça marche ?
      1. Le concept de norme
      2. L’origine de la norme
      3. L’action de la norme
      4. Conclusion sur la norme
  2. Une langue est meilleure quand elle est plus facile d’apprentissage
    1. Est-ce que ça marche ?
  3. Une langue est meilleure quand elle est plus précise
    1. Qu’est-ce que ça veut dire ?
    2. D’où ça vient ?
    3. Est-ce que ça marche ?
      1. La productivité des langues
      2. L’aire d’influence des langues occidentales et le soft power
      3. Le retour du jugement de valeur
      4. Conclusion sur la précision / richesse de la langue
  4. Une langue est meilleure quand elle est plus efficace
    1. Qu’est-ce que ça veut dire ?
    2. D’où ça vient ?
    3. Est-ce que ça marche ?
  5. Conclusion
  6. Sources

0. Quand une langue est-elle meilleure ?

Si on veut chercher une réponse scientifique à la question « quelle est la meilleure langue ? », il faut commencer par s’entendre sur la définition des termes. Quel critère utiliser pour juger si une langue est meilleure qu’une autre ?

Quatre définitions sont assez couramment utilisées pour considérer une langue comme meilleure ou supérieure à d’autres :

  • les langues sont meilleures quand elles sont normées ;
  • elles sont meilleures quand elles sont faciles d’apprentissage ;
  • elles sont meilleures quand elles sont plus riches ou précises ;
  • enfin, elles sont meilleures quand elles sont plus efficaces.

Ici, je vais rechercher ce que ces modèles impliquent afin de voir s’ils sont viables. Notez que je parlerai de langues au sens strict, c’est-à-dire de systèmes d’expression et de communication oraux, écrits et/ou signés, et non spécialisés. Les mathématiques, les langages de programmation ou la musique peuvent donner des pistes de réflexion intéressantes, mais dépassent le cadre linguistique de l’article.


1. Une langue est meilleure quand elle a des normes

On entend généralement par cette définition qu’une langue dont la forme est déterminée, voire figée de manière volontaire par une autorité linguistique est meilleure.

1.1 D’où ça vient ?

À la Renaissance, l’essor du sentiment national réclame du prestige : une nation doit briller aux yeux des autres états. L’Académie est alors fondée en 1635 sur l’impulsion de Richelieu afin d’unifier la langue de France et d’en propager une version exemplaire, respectable. Ça fonctionne : non seulement le français se hisse à une place primordiale en Europe (ses normes permettent de développer ce que l’Académie appelle le « rayonnement diplomatique » français), mais il s’illustre également vis-à-vis du peuple de France grâce aux auteurs qui relayent le mieux cette langue digne. Aux yeux des Français, ce sont des grands hommes (sans majuscule puisqu’il faudra attendre 1980 pour voir la première femme à l’Académie) et on a pris l’habitude de considérer « leur » français comme le « bon » français, vecteur du prestige de la nation.

Portrait de Richelieu
[…] Tout au long du XVIIe siècle, les membres de l’Académie, chacun dans sa spécialité, contribuèrent par leurs ouvrages à conférer un grand prestige européen à la langue définie par Vaugelas et la jeune Compagnie : Corneille, Boileau, La Fontaine, Racine, Bossuet…

Site de l’Académie
Logo de l'Académie française

Ce « bon français » fait partie de l’histoire, de l’éducation et de la société de France. On n’y adhère pas tous mais il est difficile d’y échapper, puisqu’on nous enseigne que la « bonne langue » est la langue contrôlée, patrimoniale, belle ; celle qui a réussi. Pour ne pas que cette réussite se perde, il faut que la langue soit conservatrice (la littérature constitue un « exemple à suivre » et à ne surtout pas détourner), tournée vers son « âge d’or » et réticente aux apports nouveaux.

On parle ici d’une vision prescriptiviste (opposée à une vision descriptiviste) qui s’applique particulièrement bien à la France mais qui est partagée par toutes les langues d’Europe, plus particulièrement celles qui sont bien établies et prestigieuses. Partant d’une telle vision, il n’y a qu’un pas pour extrapoler en désignant d’autres langues normées comme « bonnes » tandis que des langues hétérogènes (ou bien appliquant mal leurs règles) seront « plus mauvaises ».

1.2 Est-ce que ça marche ?

Se servir des normes pour mesurer la « qualité » d’une langue passe par plusieurs assomptions :

  • que toutes les langues ont des normes ;
  • qu’elles sont appliquées de manière égale et uniforme de l’une à l’autre ;
  • que toutes les langues sont régies par une autorité linguistique aux prérogatives similaires.

1.2.1 Le concept de norme

La norme est variable, même au sein d’une seule et même langue comme le français. Par exemple, l’Office québécois de la langue française et l’Académie sont deux organismes normateurs qui n’ont pas la même rigidité ni la même autorité. On a tendance à considérer l’OQLF comme plus souple et descriptiviste, mais sa position n’est pas forcément comparable à celle de l’Académie, car l’environnement linguistique est très différent. Ensuite, le corpus littéraire sur lequel on base la norme n’est pas aussi figé qu’on peut le croire : beaucoup de classiques d’aujourd’hui ont fait débat hier. Chaque écrivain a son style et ses « fautes » ; qu’elles finissent par être acceptées ou non, cela résulte d’une légitimation rétrospective, et arbitraire.

La méthode de prescription de l’Académie présente également des failles. Sur son site, elle prétend que son dictionnaire « [a] façonn[é] la langue telle que nous la connaissons aujourd’hui ». Pourtant les Immortels sont ou ont été des acteurs d’un français littéraire et élitiste, longtemps maintenu hors d’atteinte des classes populaires*, majoritaires et définissant par conséquent la langue bien davantage que sa forme « approuvée » par l’Académie.

* Aujourd’hui, l’éducation rend le français académique accessible à la majorité, mais ces circonstances sont récentes à l’échelle du français normé (l’Académie a été créée en 1635) et le taux d’alphabétisation reste fluctuant.

Même si l’on part du principe (guère réaliste) qu’une langue peut être figée, l’action des normes se limite donc nécessairement à la littérature et à certains registres formels (ce qu’on appelle l’acrolecte, par opposition au basilecte d’usage). Autrement dit, elles ne définiront qu’une petite partie de la langue. C’est ce que l’Académie veut dire en prétendant que son dictionnaire « [a] façonn[é] la langue telle que nous la connaissons aujourd’hui » : elle a pu valider ou dénoncer les innovations littéraires à mesure qu’elles sont apparues, mais elle ne « façonne » plus la langue qui est d’usage au quotidien depuis l’époque où elle a permis l’unification et le « rayonnement » du français.

Mème sur l'Académie française
J’aime beaucoup ce mème.

De plus, ces notions évoluent avec le temps. Si l’Académie et ses valeurs étaient encore les seuls vecteurs du « français conforme » au siècle passé, les références se sont multipliées depuis. Il y a aujourd’hui pratiquement autant de « bons français » que de groupes auxquels on s’adresse : le rap, la publicité et le journalisme sont des exemples de domaines qui ont développé leurs propres normes, nécessaires pour atteindre le groupe sociolinguistique visé.

Qu’à cela ne tienne : on peut accepter que la langue académique soit essentiellement théorique et qu’elle soit valide en tant que telle. Autrement dit, on doit pouvoir comparer les langues selon l’idéal qu’elles poursuivent, indépendamment de l’impact de cet idéal sur la réalité. Problème : la conceptualisation et l’application des normes n’étant pas les mêmes selon l’époque et l’endroit, on peut difficilement s’en servir pour comparer la qualité de différentes langues. Il faudrait que les normes soient communes à toutes les langues.

1.2.2 L’origine de la norme

Les normes du langage ne sont pas un concept homogène d’une langue à l’autre. Comme on l’a vu, les normes françaises sont conservatistes, mais les contre-exemples sont nombreux. Au Portugal par exemple, l’unité linguistique va réclamer des décisions progressistes. Le portugais européen, qui perdrait sur plusieurs plans à s’éloigner du portugais brésilien, est ainsi régulièrement « aligné » sur ce dernier, qui est moins normé et par conséquent plus prompt à évoluer.

De plus, les normes n’ont pas toujours une origine littéraire et/ou esthétique. Des langues telles que le sanskrit ou l’arabe classique sont très normées car leur « pureté » fut capitale dans les liturgies hindoue et musulmane. De manière générale, une langue liturgique est considérée comme supérieure par le culte qui en fait usage, au point qu’elle est souvent conservée précieusement (parfois autant dans la littérature que dans la liturgie) jusqu’à se séparer de la langue d’usage. Ce fut et c’est encore le cas du latin, du sanskrit ou du guèze par exemple. Une langue australienne, le damin, a même été conçue spécialement dans un but cérémoniel par le peuple lardil.

Le livre d'Enoch écrit en guèze
Le livre d’Enoch écrit en guèze.

En outre, la majeure partie des langues du monde ne peuvent pas se permettre d’énoncer des normes, ou bien les cultures auxquelles elles sont associées ne les considèrent pas comme une nécessité. La littérature roumaine a par exemple dû attendre le XIXe siècle pour connaître son essor, ce qui prive l’idiome d’un corpus datant de la Renaissance qui pourrait servir de repère « illustre ». Pour la même raison, les langues régionales européennes (rarement dotées d’une littérature propre) peuvent difficilement se construire de prestige. Le romani, langue traditionnelle des Roms, s’est mélangé aux langues avec lesquelles il est entré en contact, donnant lieu à une multitude de variations (tour à tour qualifiées de langues, langues mixtes, hybrides, dialectes, ou sabirs) qui échappent à toute unité linguistique et donc aux normes, au point qu’on met encore en doute la possibilité que la langue ait jamais existé de manière unifiée.

Cependant, la norme peut aussi avoir un but pratique dans le cas de langues peu prestigieuses. L’orthographe de l’irlandais et du breton, notamment, est la même pour l’ensemble de leurs dialectes respectifs. Si la norme du français vise à en créer une forme unique, on est ici devant une norme qui préserve les différentes formes de la langue : le fait d’avoir une orthographe commune facilite la préservation de ces idiomes sans avoir à en hiérarchiser les différents dialectes. La norme peut également servir au revivalisme : de plus en plus d’Irlandais apprennent leur langue historique, mais en tant que seconde langue (c’est ce qu’on appelle le néo-irlandais).

Carte des dialectes bretons
Les dialectes bretons avec, à l’est, la zone de locution du gallo.

Ces exemples montrent qu’il serait impossible d’avoir des normes communes à toutes les langues. De plus, il faudrait qu’on puisse rassembler une liste finie de telles normes, puis décider de critères pour juger de leur qualité. Or cela ne ferait que repousser le problème : ce serait quoi, un critère de qualité pour juger de la… qualité d’une norme ?

1.2.3 L’action de la norme

La « faute » est un concept qui existe dans beaucoup de langues, car elle répond aux conceptions humaines du beau et du laid. En revanche, le français figure dans une minorité de langues qui l’utilisent pour justifier d’un jugement lorsqu’un usager ne respecte pas une « règle ». Ce jugement engendre une hiérarchisation subjective de certaines personnes par rapport à d’autres. La norme est donc une discrimination de tout ce qui ne s’y conforme pas.

Tout comme on admire certaines personnes qui ont du talent pour utiliser la langue « comme il faut », on peut avoir tendance à déprécier (voire mépriser) ceux qui ne le font pas. À titre ponctuel, ce jugement de valeur est même institutionnalisé (à l’occasion d’examens par exemple). Des personnes atteintes de handicaps (dyslexie, dysorthographie ou autres troubles affectant l’apprentissage) vont alors se voir rabaisser et désavantager socialement. Cette forme de discrimination s’appelle le capacitisme. Bien qu’une langue n’a pas besoin d’être normée pour donner lieu à du capacitisme langagier, la norme valide et normalise ainsi le rejet et la pénalisation des personnes en difficulté.

La norme est aussi ennemie des dialectes. Un dialecte est une variante d’une langue qui est suffisamment distincte de toutes ses autres variantes pour être « à part », mais pas assez pour être considérée comme une langue indépendante. Un dialecte s’expose donc aux normes de la langue dont on a l’impression qu’il découle*. Dans cette définition, un dialecte est divergent par essence, et sera considéré comme un « ensemble de fautes » commises uniformément par un « sous-ensemble » de locuteurs. Cette fois-ci, on est dans une catégorie de discrimination appelée glottophobie : c’est la langue qui est l’objet du jugement, et ses locuteurs en souffrent indirectement. On peut évidemment y ajouter le sexisme si l’on se rappelle que les normateurs sont presqu’exclusivement des hommes.

* On a parfois le sentiment que l’occitan dérive du français, l’alsacien de l’allemand, le scots de l’anglais, etc. En réalité, l’occitan et le français dérivent tous les deux du latin, l’alsacien et l’allemand d’une vieille langue germanique, et le scots et l’anglais du moyen anglais. Présenter l’une comme la descendante de l’autre est une erreur.

La glottophobie est responsable de l’extinction en masse des langues régionales européennes au cours des derniers siècles. Rien qu’en France, elles ont été rassemblées sous les étiquettes de « patois » (au sens péjoratif), « mauvais français », « français dégénérés », « sous-langues ». Partout, elles ont été opprimées, souvent jusqu’au point de non-retour.

1.2.4 Conclusion sur la norme

Les normes sont tellement ancrées dans notre patrimoine langagier qu’on ne sait pas forcément que des conceptions différentes de la langue existent. En tant que gages de la pureté d’une langue, c’est logique qu’elles soient vues comme des repères de qualité. Il y a pourtant, comme on vient de le voir, plusieurs bonnes raisons de ne pas le faire.

En conséquence, s’il nous arrive par exemple de dire que le français est meilleur qu’une autre langue (ou vice-versa, d’ailleurs), c’est nécessairement :

  • sur la base des normes de notre propre langue (donc biaisé) ou
  • une opinion / une préférence (c’est valide, mais personnel) ou
  • une conclusion tirée d’une comparaison ciblée des deux langues (donc incomplet).

2. Une langue est meilleure quand elle est plus facile d’apprentissage

La facilité d’apprentissage est un critère qui vient facilement à l’idée pour juger de la qualité d’une langue. C’est une question de rapport qualité / coût et il est normal de rechercher la langue qui apporte le plus d’avantages pour un minimum d’efforts. C’est une problématique que j’ai déjà abordée à plusieurs reprises sur le blog et qui se révèle épineuse elle aussi.

Voir mes articles : Les langues les plus faciles pour un francophone, Les langues les plus difficiles pour un francophone et Comment mesurer la difficulté des langues ?

2.1 Est-ce que ça marche ?

La complexité d’une seconde langue (c’est-à-dire d’une langue qu’on apprend en-dehors de notre ou nos langue(s) maternelle(s)) est largement corrélée au degré de familiarité qu’elle présente. C’est-à-dire que, de manière générale, plus une langue fonctionne différemment des langues qu’on connaît déjà, plus elle sera complexe pour nous. Mais il s’agit d’un critère propre à l’individu, car l’exotisme d’une langue dépend des langues avec lesquelles on a été soi-même en contact. Il est donc relatif et ne constitue pas un facteur de la complexité de la langue dans l’absolu.

Graphique représentant la distance lexicale entre les langues d'Europe
Représenter la distance lexicale entre les langues européennes est une manière de mesurer la familiarité que leur vocabulaire présente avec notre langue maternelle (si elle y figure). Le lexique n’est bien sûr qu’un aspect parmi tant d’autres.

Si le problème est simplement le fait qu’on juge à partir de notre propre expérience, on est en droit de se dire que la science saura déterminer un repère absolu à notre place. Il suffit, en théorie, de comparer la difficulté d’acquisition de notre langue maternelle à la difficulté d’acquisition de la langue maternelle des autres.

Des études s’y essayent régulièrement mais leurs résultats sont souvent controversés et rapidement montés en épingle. Un bon exemple en est la phonologie du danois, qui fait régulièrement des gros titres du genre « les enfants danois peinent à apprendre leur propre langue ». Ironiquement, l’article est bien sourcé, pourtant l’étude citée conclut de manière beaucoup plus mesurée :

The current empirical evidence is still sparse and unsystematic. Research is required […] in order to provide a more nuanced understanding of the […] processability of Danish speech. […] Fully understanding the puzzle of Danish will require a […] crossdisciplinary effort […].

Les données empiriques actuelles sont rares et non probantes. Davantage de recherches sont nécessaires pour comprendre le traitement du danois oral de manière plus nuancée. Comprendre totalement le puzzle du danois requerra un effort pluridisciplinaire.

Trecca et al. (2021) (ma traduction)

Les allégations sur la difficulté des langues négligent en effet les principes qui sont au cœur de leur évolution. Ici, je veux surtout parler de deux forces qui agissent sur la langue naturellement (c’est-à-dire sans intervention humaine consciente) en s’opposant constamment : le besoin de l’émetteur (la personne qui parle ou écrit) de s’exprimer efficacement, et celui du récepteur (celui qui écoute ou lit) de comprendre correctement.

L’émetteur va rechercher la concision et la compacité : il va retirer le maximum de superflu et faire (involontairement) des élisions, des contractions et des omissions. Pour donner un seul exemple oral, il va préférer dire « chais pas » que « je ne sais pas ». Le récepteur va contrebalancer cette tendance à « simplifier » le langage, car il arrive un moment où la compréhension en pâtit. À l’oral, on peut compacter « chais pas » en « chpa » (en France) ou en « chpô » (au Canada), mais pas davantage sans devenir peu clair.

Quand la simplification devient problématique pour la compréhension, on a tendance à recomplexifier la langue. Par exemple, il fut un temps où l’on disait simplement « je ne sais » en français, mais « ne » étant un mot discret et élidé devant voyelle, on a ajouté « pas » pour bien montrer qu’on faisait une négation, même si on n’a pas « besoin » de deux négateurs à strictement parler. Ce cas particulier de « recomplexification » fait partie de ce qu’on appelle le cycle de Jespersen, mais d’autres cycles de ce genre existent.

Représentation du cycle de Jespersen
Le cycle de Jespersen, largement attesté dans les langues du monde, illustre comment un aspect précis d’une langue peut, sur une échelle de plusieurs siècles, favoriser tour à tour l’efficacité et la concision.

Au cours des millénaires, l’opposition de ces deux forces participe à optimiser les langues. À chaque instant de son histoire, toute langue est le produit de leur équilibre, et le danois n’est pas une exception. La phonologie danoise est effectivement riche et difficilement accessible aux apprenants étrangers, mais elle n’en est pas moins le résultat de ce processus naturel d’optimisation. En fait, on peut garantir que tout système linguistique naturel (c’est-à-dire vierge d’intervention humaine consciente) atteint un équilibre entre son potentiel d’expression et de compréhension.

We predict that the trade-off between biases toward accurate message transmission and lower resource cost should interact to promote the development of phonological systems that are both communicatively robust and efficient.

On déduit que le compromis entre la transmission adéquate d’un message et un coût réduit en ressources doit promouvoir le développement de systèmes phonologiques qui sont à la fois communicativement robustes et efficaces.

Hume et al. (2016) (ma traduction)

Cependant « optimisé » ne veut pas dire « parfait » : bien au contraire, cela implique un brassage permanent de l’ensemble des caractéristiques de la langue, ce qui la rend chaotique. C’est pourquoi les normateurs sont adeptes de l’intervention consciente afin d’y mettre de l’ordre.

C’est une tâche herculéenne. Tous les domaines de la langue (phonologie, syntaxe, morphologie, lexique, pragmatique…) sont instables, en évolution constante, et connaissent des variations selon les régions, l’âge du locuteur et de l’interlocuteur, leur classe sociale, leur niveau d’éducation, leur environnement, leurs choix en matière de registre de langue, leur état d’esprit, leurs expériences, leurs intentions, et les cadres infiniment variés où ils peuvent faire usage du langage écrit, parlé, signé, ou non-verbal. Une langue est un système fondamentalement anarchique ; par conséquent la norme, quand elle ne tend pas vers une nature totalitaire, est simplement dénuée de pragmatisme.

Quand on oppose deux langues, on peut avoir tendance à se concentrer sur une stratégie précise et à la considérer meilleure qu’une autre stratégie précise : « les langues à déclinaisons sont meilleures que les langues à prépositions » ; « il est mieux de placer l’adjectif avant le nom » ; « l’alphabet est le meilleur système d’écriture »… Ces affirmations demandent des études approfondies pour être vérifiées (ce qui est loin d’être souvent possible), et font l’objet de comparaisons très sélectives.

Malgré des conclusions valides et intéressantes, les études qui s’intéressent à la complexité des langues se heurtent donc toujours à ce chaos impossible à rationaliser de façon algorithmique, et les médias les relayent de manière trop parcellaire et orientée. En vérité, on ne peut pas rendre compte scientifiquement de la complexité d’une langue dans son ensemble. Cet obstacle rend d’ailleurs caduques beaucoup de questions similaires, comme « quelle est la langue la plus logique ? »

Drapeau de l'espéranto
Logo du toki pona

Si vous aviez pensé au toki pona créé par Sonja Lang comme réponse à notre problématique, le voilà malheureusement disqualifié, car cette langue brise volontairement l’équilibre entre expression et compréhension en mettant l’accent sur la facilité d’apprentissage. Avec un lexique de seulement 120 mots et une grammaire minimaliste, la langue permet d’exprimer une quantité de choses étonnante (je l’ai apprise dans le cadre de mes recherches), mais étant volontairement figée (ou presque), elle s’impose de grosses limitations. Quant à l’espéranto créé par Louis-Lazare Zamenhof, moins simple et plus complet que le toki pona, il a subi un processus de « naturalisation » qui a l’a adapté aux besoins réels de ses locuteurs, le faisant diverger de sa version d’origine.


3. Une langue est meilleure quand elle est plus précise

La précision d’une langue (on peut aussi parler de richesse) est un concept pertinent à étudier. Il a aussi une tendance chaotique, mais certaines comparaisons paraissent déjà plus raisonnables.

3.1 Qu’est-ce que ça veut dire ?

Une langue répond toujours aux besoins de ses usagers. Toutes les langues du monde occidental contemporain ont des termes pour « ordinateur » ou « taux de change », par exemple, car il est nécessaire que nous puissions désigner ces concepts. Ça ne sera pas le cas de certaines langues qui n’ont aucun moyen d’exprimer des choses qui nous paraissent essentielles, comme les chiffres au-delà de 5 (voire seulement 2). Leurs locuteurs n’en ont simplement pas besoin.

Il existe une forme « d’économie du langage » où « l’offre » (en vocabulaire, mais aussi en fonctionnalités grammaticales et syntaxiques par exemple) répond à la « demande » (en matière d’expression). En conséquence, les langues les plus utilisées tendent à être les plus riches et les plus précises, bien davantage en tout cas que les langues isolées dont je viens de parler. On peut donc plus ou moins classer les langues par ordre de richesse.

3.2 D’où ça vient ?

Puisqu’une langue s’adapte à son environnement, il est logique que les langues qui ont la plus grande aire d’influence soient aussi les plus riches. L’aire d’influence et le nombre de locuteurs sont deux choses différentes : le mandarin est la deuxième langue la plus parlée dans le monde en 2021 mais la langue est relativement confinée à la Chine et 82% de ses locuteurs l’ont comme langue maternelle. L’anglais est plus international, ne comptant que 33% de natifs parmi ses locuteurs.

Depuis qu’il est la langue internationale, l’anglais est presque toujours la première langue utilisée lors d’échanges internationaux et interculturels. C’est ce qu’on appelle une lingua franca. C’est aussi la première langue utilisée quand on doit communiquer dans le monde entier autour d’une grande gamme de secteurs « nouveaux », ce qui en fait une langue adaptée à un peu tout. Alors, n’est-elle pas meilleure ?

3.3 Est-ce que ça marche ?

3.3.1 La productivité des langues

Devant le besoin de communiquer, l’humain sait toujours s’y prendre. Même sans langue commune, voire privé d’un ou plusieurs sens, on sait se faire comprendre de ses semblables. Cela tient au fait que le langage est une des grandes forces dont l’évolution nous a dotés, et on se débrouille remarquablement bien avec.

Ainsi, à chaque fois qu’un peuple isolé a découvert la civilisation d’un colonisateur, les mots pour les objets et concepts importés ont eu tôt fait de se propager à travers la population, et ce même si ce peuple n’avait jamais connu une autre culture que la sienne. Pour exemple : l’ojibwé, une langue algonquienne qui fait preuve d’une grande inventivité dans ses néologismes.

« Ordinateur » donne mazinaabikiwebinigan (constitué de mazin-, « figuré », -aabik-, « quelque chose de minéral », -webin-, « agir sur », et -gan, suffixe pour former les noms).

« Téléphone » donne giigidowin, un homonyme de « discours » basé sur la racine giigido, « iel parle ».

« Comptable » donne asigibii’igewinini, plus ou moins « celui qui additionne ».

Embarcation traditionnelle ojibwé

Fabriquer un mot, c’est facile et les stratégies sont nombreuses : exposée à de nouveaux besoins, une langue développe rapidement et efficacement le vocabulaire nécessaire, même partant de rien. C’est pourquoi énormément de langues prennent des mots à d’autres (à l’anglais par exemple), l’emprunt étant une manière de récupérer ou « recycler » un outil langagier préexistant.

Les langues ont toutes la même productivité potentielle, c’est-à-dire que toutes ont les mêmes outils pour répondre à de nouveaux besoins langagiers s’ils se présentent. Ces outils sont dormants tant que les besoins sont stables. Si l’anglais est plus riche, c’est que les lingua franca sont les langues dont la productivité est la plus sollicitée. La question à poser ici est donc : comment l’anglais a-t-il acquis (et acquiert-il encore) cette aire d’influence ?

3.3.2 L’aire d’influence des langues occidentales et le soft power

L’Histoire nous enseigne que si des langues comme l’anglais, l’espagnol ou le français ont drastiquement étendu leur aire d’influence dans les siècles passés, c’est une conséquence directe d’idéologies impérialistes, nationalistes et suprémacistes. Le cadre n’est plus le même aujourd’hui et il faut se méfier des jugements anachroniques, cependant la colonisation qui a accompagné la politique d’expansion territoriale européenne est passée par des décennies d’oppression et d’exactions souvent violentes. Cette période est non seulement condamnable, en tout cas selon la morale actuelle (elle a d’ailleurs causé des tensions qui perdurent), mais elle est également responsable de l’extinction de multiples langues et cultures de par le monde. La place actuelle des « grandes langues » dans le monde est un triomphe persistant de ces persécutions.

Il est bien sûr impossible de refaire l’Histoire pour désigner une langue internationale dite « neutre » telle que l’espéranto (quoique l’appropriation d’une langue par un groupe donné rend déjà caduques les idées de neutralité et d’internationalisme). C’est surtout par intérêt historique qu’il est pertinent de se souvenir de ce à quoi l’anglais tient sa place. Cependant, une langue internationale est indispensable dans une société de plus en plus dépendante des échanges internationaux : il était inévitable que la globalisation vienne à désigner au moins une lingua franca mondiale. Autrement dit, la place actuelle de l’anglais est le résultat normal du sens de l’Histoire.

Aujourd’hui, c’est un autre genre d’influence mondiale que la langue anglaise exerce : le soft power. Le soft power anglophone a récemment été malmené par la présidence de Donald Trump, le Brexit britannique et la pandémie de covid-19, mais plusieurs pays ayant l’anglais pour langue officielle occupent toujours une place majeure.

Les 20 nations les plus influentes en 2021

Si les actions directes prises contre les peuples et les langues ont de moins en moins cours en Europe, la séduction culturelle et l’impact des médias peuvent avoir des conséquences semblables. On remarque la même mise en place d’une langue dont la connaissance constitue un marqueur de prestige à l’international, même si ça doit être au détriment des langues et cultures locales et que cela accentue les différences de classes.

Ce phénomène s’observe à toutes les échelles : l’adoption du portugais par les populations natives amazoniennes ou l’essor du français en Afrique sont, au moins pour partie, la conséquence d’une culture moderne supplantant une culture locale moins attractive. Le néo-irlandais « des jeunes », urbain et attrayant, s’est différencié de l’irlandais moribond d’un monde rural vieillissant : c’est l’exemple d’une langue transformée par la séduction culturelle. Les emprunts sont un domaine d’expression privilégié du soft power, et c’est pourquoi les anglicismes ont mauvaise presse en France (même s’il s’agit, pour le linguiste, d’une stratégie équivalente à d’autres pour créer des mots, et donc d’une évolution normale du langage).

3.3.3 Le retour du jugement de valeur

Jusqu’au siècle dernier, on voyait généralement dans les populations autochtones des peuples inférieurs, parlant des langues pauvres, qui ont été « sauvées » par la civilisation occidentale. Certaines convictions laissent des traces. Le terme de « patois », notamment, est devenu péjoratif car il désigne des langues locales que l’éducation française du siècle passé a abondamment dénigrées, les dénonçant comme du « mauvais français » *. Il s’agit de la continuité d’idéologies racistes considérant les minorités comme des déviances.

* Des linguistes tels qu’Henriette Walter proposent d’ailleurs la réappropriation non péjorative du terme « patois » ; elle rappelle que le français n’est qu’un patois qui a réussi à supplanter tous les autres.

Au cours de mes recherches, j’ai trouvé mention d’un livre de 1827 disant que la langue de Laponie a cinq mots pour la neige et sept pour une montagne, mais aucun pour « honnêteté », « vertu » et « conscience ». Les amalgames et le jugement ont suivi : les Lapons n’ont-ils pas de vertu, ne sont-ils pas honnêtes ? Est-ce que seuls la neige et les montagnes les intéressent ?

Panneau quadrilingue en Finlande
Ce panneau se situe à Inari, seule commune finlandaise avec quatre langues officielles (ici, dans l’ordre : le finnois, le same du nord, le same d’Inari et le same skolt).

3.3.4 Conclusion sur la précision / richesse de la langue

Plutôt que de qualifier les langues de riches ou pauvres, il serait plus juste de dire qu’elles sont adéquates. Le mandarin a de nombreux mots pour les liens familiaux car la famille est centrale dans la culture chinoise. Un peuple de pêcheurs aura un vocabulaire riche autour du poisson, effectuant des nuances qu’on ne comprendra pas forcément en tant que francophone. À l’inverse, ce peuple pourrait ne pas avoir de mot pour « taux de change ».

Toutes les langues tendent vers une égale adéquation vis-à-vis de ce à quoi on les destine, et le mot pour « taux de change » sera vite construit (dérivé, composé, emprunté…) s’il devient nécessaire. Les mots « honnêteté », « vertu » et « conscience » ne sont peut-être pas présents de manière synthétique dans la langue de Laponie mais ça ne veut pas dire que les concepts sont inexistants, incompris, ou impossibles à exprimer. Il est simplement plus adéquat pour le peuple sami de pouvoir parler en détails du paysage qui l’entoure. D’autre part, des concepts plus abstraits tels que l’honnêteté et la vertu n’ont pas besoin d’être désignés directement pour faire partie de la culture et être appliqués.

La richesse de la langue est donc corrélée à la richesse des besoins auxquels elle répond. Or, les langues qui ont le plus de besoins se sont imposées au détriment de la diversité culturelle et linguistique. Peut-on qualifier de « meilleures langues » les langues qui sont nécessairement les plus influentes ? À défaut d’avoir la réponse, je propose qu’on continue de chercher.


4. Une langue est meilleure quand elle est plus efficace

4.1 Qu’est-ce que ça veut dire ?

Une langue est l’une des formes, généralement verbales, que prend naturellement le langage humain. Le langage est un moyen de communication. Et ça, c’est intéressant, car si la communication est un domaine vaste, elle consiste aussi en un concept simple : la transmission d’informations. Selon la théorie de l’information, nous tenons là quelque chose de quantifiable. On peut postuler que plus une langue transmet d’informations vite, plus elle est efficace.

L’efficacité d’une langue en matière de transmission d’informations ne dépend pas seulement de la vitesse à laquelle on la parle. En français par exemple, le mot « du », dans « le chat du monsieur », contient les idées de possession (« de »), de définitude (« le ») et de genre (masculin) en une seule syllabe, soit la même quantité d’informations que « de la » dans « le chat de la dame », qui prend deux syllabes. Il faut donc utiliser d’autres stratégies de calcul et se mettre d’accord sur ce qu’on cherche à déterminer. Les études sont nombreuses à s’être prêtées à l’expérience.

4.2 D’où ça vient ?

En 1953 déjà, E. Colin Cherry, Morris Halle et Roman Jakobson cherchaient à déterminer la prévisibilité des phonèmes en russe. Leur méthode consistait à calculer le nombre de caractéristiques distinctives de chaque son, chaque caractéristique pouvant être exprimée par « est [x] » (1 en binaire) ou « n’est pas [x] » (0). Les chercheurs obtenaient ainsi un rendu en bits correspondant à la quantité d’informations transmises par la phonologie russe.

Représentation (en bits) des caractéristiques de la phonologie russe

De nombreuses études ont suivi par la suite, toutefois c’est une étude récente qui m’inspire ce chapitre (l’article entier, en fait). Publiée en 2019 et issue de l’Université de Lyon, elle se base à la fois sur le débit de parole (rendu en syllabes par seconde) et sur la densité d’informations (en bits par syllabe). Elle en déduit la vitesse de transmission de l’information (en bits par seconde) pour 17 langues de 9 familles linguistiques différentes.

Conclusion : ces langues sont parlées à une vitesse (SR, pour speech rate) variant de 4,3 à 9,1 syllabes par seconde en moyenne, pour une densité d’information (ID, information density) allant de 4,8 à 8 bits par syllabe en moyenne. Pour chaque langue, on peut donc déduire une vitesse de transmission différente (IR, information rate) : c’est la colonne de droite du tableau ci-dessous. Ce résultat très parlant, très médiatisé, est à l’origine d’une vague d’engouement pour le sujet de la langue la plus « efficace ».

4.3 Est-ce que ça marche ?

L’étude conclut que les langues tendent à avoir la même « efficacité » quelle que soit leur typologie. En moyenne, elles permettent la transmission de 39 bits d’information par seconde à l’oral. En revanche, différentes langues utilisent différentes stratégies : une langue peut être parlée vite (SR élevé) et être peu dense en information (ID bas), ou bien l’inverse (SR bas et ID élevé) – d’autres sont plus équilibrées.

Une langue à double avantage (SR et ID élevés) est défavorisée, d’une part, par nos capacités articulatoires (on peut difficilement produire plus de 9 syllabes par seconde, et les langues qui y parviennent ont une structure syllabique plus simple que la moyenne) et d’autre part par des pressions neurocognitives et auditives (limitant notre capacité de compréhension), voire sociales (qui conditionnent l’acceptabilité du langage oral).

Je pourrais m’en tenir à cette conclusion, mais l’étude donne malgré tout très envie d’extrapoler que certaines de ces 17 langues sont effectivement plus efficaces que d’autres : notamment le français et l’anglais. Selon cette étude en tout cas, leur IR se situe au-delà de 39 bits/s, autour de 45 bits/s.

À ce stade de votre lecture, vous sentez sûrement venir le « mais ». Ces langues sont peut-être plus efficaces… mais perdent en facilité d’énonciation et en fiabilité de compréhension. Pour compléter l’analyse, les chercheurs reconnaissent eux-mêmes qu’il faudrait mesurer les efforts d’expression et de compréhension, ou le degré de méprise potentielle qu’engendrent un bon compromis de SR et d’ID.

De plus, l’étude concerne un échantillon contrôlé de la langue orale, justement pour limiter les aléas du chaos langagier. Les sujets (les personnes soumises à l’étude) ont ainsi pris connaissance d’un texte au préalable. Des expériences incluant la pragmatique (les effets du contexte) ou tout simplement la langue écrite, par exemple, auraient donné des résultats différents. Une autre lacune que l’étude me paraît présenter concerne le non-verbal (qu’il s’agisse de gestes, d’expressions faciales ou d’intonations). Différentes langues comptent-elles plus ou moins dessus ?

Le chiffre de 39 bits/seconde est probablement proche d’un optimum entre l’efficacité de l’expression et l’efficacité de la compréhension dans les langues du monde. Il faut en revanche se rappeler que nous sommes là encore devant un équilibre que la langue atteint sans intervention humaine consciente, et qu’une étude ne peut suffire à rationaliser complètement comment ça marche, ni pourquoi d’apparentes contradictions surgissent. Pratiquement chaque étude (comme Milin et al. que je cite ci-dessous) conclut dans ce sens (ce dont on ne se rend pas forcément compte quand elles sont relayées avec un peu trop d’enthousiasme par les médias).

[It] is only a first step […]. We mention here only a few of the issues that should be considered for a more comprehensive model. […] To conclude, it is clear that the information theoretic measures that we have proposed and illustrated in this chapter capture only part of the multidimensional complexity of lexical processing.

C’est seulement un premier pas. Nous ne mentionnons ici que certaines des problématiques qui devraient être considérées dans un modèle plus complet. Pour conclure, il est clair que les mesures liées à la théorie de l’information que nous avons proposées dans ce chapitre ne capturent qu’une partie de la complexité multidimensionnelle du traitement des mots.

Milin et al. (2009) (ma traduction)
Le mot "ithkuil" en ithkuil
Le mot « ithkuil » en ithkuil.

À l’opposé du toki pona qui faisait primer la simplicité sur l’expression, il y a l’ithkuil, langue artificielle créée par John Quijada. Sa vocation est de maximaliser la logique, l’efficacité, le détail et la justesse de l’expression cognitive, tout en minimisant son ambiguïté, son imprécision, ses redondances, son caractère arbitraire et la polysémie. La langue est expérimentale et, de l’avis de son créateur lui-même, trop complexe pour être utilisée au quotidien.


5. Conclusion

J’ai fait mon possible pour aborder une diversité de points de vue dans cet article, pourtant deux notions revenaient presque malgré moi : le chaos et le jugement de valeur.

Nous utilisons pratiquement tous une langue chaque jour, et pour cette raison il est facile de croire qu’elle est en notre contrôle. De plus, faire croire qu’on la façonne peut être un atout, personnel (l’on se démarque si l’on maîtrise le verbe) ou international (un peuple ou une nation se démarque avec une langue de prestige). Pourtant c’est un contrôle partiel, instable, et rarement innocent. Établir des normes, c’est figer seulement la partie d’une langue qu’on a conscience d’utiliser, et c’est juger ceux qui ne la respectent pas. Estimer qu’une langue est particulièrement facile, précise ou efficace (ou tout l’inverse), c’est considérer qu’on est en mesure de lui appliquer des critères objectifs, bien qu’il s’agisse d’un domaine tentaculaire et fluctuant qu’on ne comprend pas toujours.

La langue nous a été léguée par des millions d’années de sélection naturelle car c’était un atout évolutif, dans un monde souvent hostile, que de pouvoir échanger avec nos semblables et apprendre d’eux. Si aujourd’hui l’atout est devenu avant tout social, les langues sont toujours « naturelles » car on n’y est pour rien si elles existent et on n’y est généralement pour rien non plus dans les formes qu’elles prennent. Même des langues comme l’espéranto se naturalisent. Ainsi, non seulement les critères qui nous servent à juger des langues sont superficiels, discriminatoires et n’ont rien à voir avec la vocation première du langage, mais ils y font obstacle. Si d’aucuns voient une perversion dans les modifications que subit la langue, il serait sans doute plus juste (quoiqu’un terme aussi fort soit lui aussi l’apanage du jugement de valeur) de qualifier les critères qu’on impose à la langue… de perversion du langage.

En somme, aucun critère objectif ne peut s’appliquer à une langue. En revanche, on peut baser son jugement sur le critère de notre choix si l’on reconnaît que c’est subjectif.

J’ai cependant une autre réponse à proposer, plus satisfaisante peut-être. Si l’on prend la langue pour ce qu’elle est (un outil nous servant à bénéficier de l’expérience de nos semblables), on se rend compte qu’on y arrive tous avec la même langue : celle que chacun d’entre nous maîtrise le mieux. Cela s’applique à toutes les langues (du français jusqu’au thaï en passant par la langue des signes inuit) et de manière presqu’indépendante de notre condition sociale, âge, niveau d’éducation, ou encore de nos origines, capacités ou expériences.

Est-ce que ça ne serait pas ça, finalement, la meilleure langue ?

📕


6. Sources

  1. De la fascination des Français pour le prescriptivisme linguistique, David Madore, 2017
  2. La norme linguistique, Édith Bédard et Jacques Maurais
  3. Le sentiment national, Universalis
  4. BSRS2011: Norms, Values, Language and Culture
  5. Continuités et discontinuités dans l’histoire du prescriptivisme français, Douglas A. Kibbee, 2010
  6. Académie françaises – Les missions
  7. How Many Words Do « Eskimos » Really Have for Snow?, Arika Okrent, 2013
  8. The Message Shapes Phonology, Kathleen Currie Hall, Elizabeth Hume, T. Florian Jaeger, Andrew Wedel, 2016
  9. Toward the logical description of languages in their phonemic aspect, E. Colin Cherry, Morris Halle, Roman Jakobson, 1953
  10. Paradigms bit by bit: an information-theoretic approach to the processing of paradigmatic structure in inflection and derivation, Petar Milin, Victor Kuperman, Aleksandar Kostic, R. Harald Baayen, 2009
  11. Information theoretic approaches to phonological structure: the case of Finnish vowel harmony, John Goldsmith, Jason Riggle, 2012
  12. Different languages, similar encoding efficiency: Comparable information rates across the human communicative niche, Christophe Coupé, Yoon Mi Oh, Dan Dediu, François Pellegrino, 2019
  13. The Ojibwe People’s Dictionary
  14. Danish as a Window Onto Language Processing and Learning, Fabio Trecca, Kristian Tylén, Anders Højen, Morten H. Christiansen, 2021
  15. Global Soft Power Index 2021: 15 Nations from MENA Feature, 2021
  16. Le serveur Discord de toki pona

Image de bannière : pikisuperstar, via Freepik

Merci à Siddhartha Burgundiae pour ses nombreux retours (et pour avoir attiré mon attention sur l’importance du soft power), à Arthur pour m’avoir permis d’aller à l’essentiel, et à Pata qui s’est assuré que le lecteur puisse me suivre ! Je n’aurais pas réussi à sortir le pavé de la mare sans leur aide. 🙏🏻

S’abonner
Notifier de
guest
4 Comments
Inline Feedbacks
Voir tous les commentaires

[…] → Voyez aussi mon article Quelle est (vraiment) la meilleure langue ? […]

[…] concepts qui ont été inventés pour servir l’élitisme. De mon côté, j’ai déjà décrit ici comment ils sont foncièrement discriminatoires (capacitistes et glottophobes […]

[…] En Europe (et particulièrement en France), l’acrolecte est généralement reconnu comme la langue qui répond le mieux aux critères déterminés par l’autorité linguistique (l’Académie en France), la plus « pure » et la plus respectueuse des règles, donc la « meilleure ». Par opposition, le basilecte, qui est fortement associé aux difficultés que rencontrent les classes défavorisées pour accéder à une éducation de qualité, est souvent perçu comme « vulgaire », « populaire » et donc « mauvais ». Cette définition pose évidemment un problème de jugement de valeur, mais ce n’est pas son seul défaut (voir à ce sujet mon article sur la meilleure langue). […]

[…] plus faciles” ou “les plus difficiles” par exemple. Mon article sur “la meilleure langue” tente également de débunker de telles idées préconçues en matière de […]

4
0
Et vous, vous en pensez quoi ?x
Retour en haut