Faire son diagramme vocalique avec Praat


Si vous vous intéressez à la phonétique, vous avez probablement déjà rencontré ce qu’on appelle un diagramme vocalique, aussi connu comme un triangle ou trapèze vocalique. Ce genre de diagramme permet de représenter graphiquement les voyelles qu’une personne utilise. Faire son propre diagramme vocalique nécessite quelques connaissances techniques, mais cela reste relativement accessible. Dans cet article, je vous propose de découvrir comment faire le vôtre.

Vous aurez besoin :

  • d’un enregistrement vocal (et donc d’un microphone de meilleure qualité possible si vous faites le diagramme de vos propres voyelles) ;
  • de Praat, un logiciel téléchargeable ici ;
  • de l’outil Formant Plot d’Adam Baker.
Le diagramme vocalique d'un anglophone
J’ai fait ce diagramme vocalique pour représenter l’accent nord-irlandais d’un ami anglophone.

Sommaire

  1. Contexte acoustique du diagramme vocalique
  2. L’enregistrement des voyelles
  3. Praat
  4. Compléments
  5. Pour aller plus loin

1. Contexte acoustique du diagramme vocalique

Une voyelle est un son qui est le plus souvent constitué de trois éléments : la position verticale de la langue (aperture), sa position horizontale (point d’articulation) et l’arrondissement des lèvres. Chacun des deux premiers est associé à un formant (F₁ et F₂), c’est-à-dire une fréquence qui ressort plus que les autres sur le spectre acoustique.

Le rapport des formants avec la position des voyelles sur un diagramme vocalique

Praat nous permet de visualiser ce spectre et de mettre en lumière les formants. La difficulté est donc de les identifier correctement sur le logiciel. Mais d’abord, assurons-nous de bien enregistrer nos voyelles.


2. L’enregistrement des voyelles

Dans cet article, je m’intéresse aux voyelles phonémiques. Autrement dit, aux voyelles qui peuvent être distinguées les unes des autres pour créer des distinctions de sens dans une langue donnée. Par exemple /a, i, u/ dont la distinction seule permet de distinguer les mots « sa, si, sou » en français (/sa, si, su/ en alphabet phonétique).

Le nombre de voyelles phonémiques varie selon les accents. Le français peut en avoir jusqu’à 16 mais je n’en ai que 14 car je ne distingue pas « patte » /pat/ de « pâte » /pɑt/, ni « brin » /bʁɛ̃/ de « brun » /bʁœ̃/. Dans tous les cas, on va enregistrer une liste de 16 mots avec quelques extras ; Praat nous montrera si une distinction n’est pas faite.

Vous pouvez vous enregistrer directement sur Praat, ou bien avec Audacity (PC) ou Vocaroo (en ligne) par exemple. Si le fichier n’est pas au format WAV, vous pouvez le convertir en ligne. Articulez naturellement, sans exagérer et en laissant une pause entre chaque mot. Par contre, n’hésitez pas à forcer un peu sur la longueur de vos voyelles. J’étais un peu court dans mon propre enregistrement et j’ai dû le refaire.

Dites, dé, dette, jeune, feutre, lutte, doute, dôme, botte, pâte, latte ; le chat ; je ferais, je ferai ; peinte, junte, tonde, tende.

Cette liste devrait fonctionner pour la plupart des francophones, mais il est possible qu’une particularité de votre accent fausse les résultats. Par exemple, même si ce n’est personnellement pas mon cas, les gens de ma région prononcent « jeune » avec la voyelle de « feutre ». Si c’est votre cas aussi, vous pouvez remplacer « jeune » par « fleur ». Il est difficile de prévoir tous les cas de ce genre, alors n’hésitez pas à procéder à vos propres ajustements (voyez les §Compléments pour plus de détails).

J’ai inclus « je ferai » et « je ferais » car la distinction É/È peut être très différente en fin de mot ou en syllabe ouverte. Quant au chat, il est là pour tester la voyelle de l’article « le ». On peut la retrouver dans « je ferai » notamment, mais étant très instable en français, trois échantillons ne seront pas de trop. N’hésitez d’ailleurs pas à travailler avec des enregistrements plus longs et des phrases complètes pour plus de précision. Cette liste représente l’extrait le plus petit avec lequel on puisse travailler, mais étant donné qu’on ne prononce jamais la même voyelle exactement pareil d’une fois à l’autre, plusieurs extraits permettront de réduire la marge d’erreur.


3. Praat

3.1 Afficher les formants

Une fois votre fichier dans Praat (via Open > Read from file si vous ne l’avez pas directement enregistré sur le logiciel), sélectionnez-le et faites View & Edit. Voici le mien.

Aperçu de Praat
Outre le fait que mes voyelles sont un peu trop courtes pour être aisément analysables, j’utilise le mot « bol » au lieu de « botte ». C’est une erreur car le son /l/ a tendance à beaucoup affecter les voyelles.

Vous aurez besoin de Ctrl+N pour zoomer sur la sélection, et de Ctrl+B pour remettre le zoom à zéro. Sélectionnez une région et appuyez sur Tab pour l’écouter. Une fois familiarisé·e avec ces contrôles, vous pouvez vous concentrer sur les mots individuellement (je les affiche par deux ici).

Aperçu de Praat

En écoutant le passage (qui dure une seconde et demi sur cette image), vous devriez être en mesure de voir quelle partie du spectrogramme représente la voyelle qui nous intéresse, et de distinguer les consonnes.

Aperçu de Praat

Les zones les plus denses du spectrogramme représentent les formants, que les lignes rouges mettent en lumière. Le plus bas est F ; plus sa fréquence est haute, plus la voyelle est ouverte (langue vers le bas) – il varie généralement entre 250 et 700 Hz. Le deuxième en partant du bas est F₂ ; plus sa fréquence est haute, plus la voyelle est antérieure (langue vers l’avant) – il varie généralement entre 550 et 2300 Hz. On peut ignorer F₃ et F₄ (les deux du haut) qui ne sont pas utiles pour une analyse superficielle des voyelles.

Mais il faut encore s’assurer qu’ils s’affichent bien. Ça peut être difficile à déterminer au début, mais on s’attend normalement à voir des formants droits, ou au moins lisses, comme ci-dessus. S’ils sont hachés, Praat est probablement mal ajusté à votre voix.

Aperçu de formants mal définis sur Praat

Pour remédier à ce genre de problème, rendez-vous dans Formant settings. Le Formant ceiling devrait être à 5 000 Hz, le Number of formants à 5, et la Window length à 0,02 s. Ces instructions indiquent à Praat d’afficher cinq formants sous 5 000 Hz et que les points soient espacés de 0,02 seconde. Essayez de régler le Formant ceiling entre 4 500 et 5 500 Hz jusqu’à obtenir des formants les plus lisses et lisibles possible. Sinon, mettez-le à 4 200 Hz et demandez 4 formants.

ℹ️ En théorie, on pourrait simplement demander 2 formants sous 2 500 Hz puisque c’est tout ce dont on a besoin, mais des formants parasites apparaissent parfois qu’il peut être important de pouvoir identifier (voir §Compléments à ce sujet).


3.2 Interpréter la valeur des formants

Une fois les formants bien affichés, on peut commencer à lire leurs valeurs. Faites d’abord attention de bien isoler la voyelle sur le spectrogramme. Ignorez les consonnes ainsi que les petites anomalies qu’on trouve parfois au début et à la fin des voyelles : on s’intéresse à la partie du formant qui est la plus régulière. Il ne reste alors plus qu’à extraire les valeurs respective de F₁ et F₂ pour chaque voyelle. On peut afficher une valeur en cliquant à l’endroit voulu sur le spectrogramme (la valeur s’affiche en rouge à gauche).

ℹ️ Si le formant est oblique ou légèrement irrégulier, on peut le moyenner, ce qui est en général facile à faire visuellement. Pour F₂ ci-dessus (le deuxième en partant du bas, je rappelle), vous pouvez me voir cliquer sur la valeur appromixativement moyenne du formant. Pour rappel, on ne prononce jamais la même voyelle exactement pareil d’une fois à l’autre, donc il n’est pas utile de vouloir être précis.

⚠️ Attention en revanche : si un formant présente une forme sigmoïde, vous vous trouvez probablement devant une diphtongue. À ce sujet, voir la section §Compléments.

Représentation d'une courbe sigmoïde
Une courbe sigmoïde.

3.3 Créer le diagramme vocalique

Une fois les valeurs de F₁ et F₂ extraites pour chaque voyelle, vous devriez avoir ce genre de tableau :

VOYELLEF₁F₂
dites2032405
dé3082323
dette4051844
jeune6271586
feutre3461446
lutte2761716
doute203782
dôme323677
botte4001071
pâte6241505
latte6871563
le chat4001539
ferais4981668
ferai2561914

L’étape suivante est la plus simple : ouvrez l’outil Formant Plot et entrez-y vos données. Elles doivent simplement être séparées d’une tabulation.

Les valeurs des formants pour mes voyelles
J’utilise les caractères de l’alphabet phonétique international pour nommer mes voyelles, mais vous pouvez choisir l’intitulé qui vous arrange le plus. J’utilise -e et pour É et È en fin de mot.

Et voilà !

Le diagramme vocalique de mes voyelles en français

Si vous voulez améliorer le look de votre diagramme, vous pouvez le télécharger au format SVG et l’importer dans Illustrator ou Inkscape pour le modifier à volonté. D’ailleurs, j’en profite pour retirer /ɑ/ (la voyelle de « pâte »), que je ne distingue pas de /a/ (celle de « latte »), et faire la moyenne des deux sur le diagramme.

ℹ️ Pourtant /a/ et /ɑ/ sont bien distincts sur le diagramme ? Oui et non : les distinctions sont plus faciles à percevoir dans les basses fréquences (en bas du diagramme, F₁ est haut). La même distance entre deux voyelles en haut du diagramme est donc plus significative qu’en bas. Quand à /œ/, elle est bien distinguée car, contrairement à /a/ et /ɑ/, elle est arrondie (voir §Arrondissement des lèvres).

Le diagramme vocalique de mes voyelles en français, adapté et mis en couleurs
Le diagramme vocalique de mes voyelles en français.

4. Compléments

F₁ et F₂ sont bien utiles, mais ils ne font pas tout. Il reste quelques aspects des voyelles à aborder pour faire des diagrammes complets.

4.1 Arrondissement des lèvres

Comme je le disais plus haut, l’arrondissement des lèvres est un ingrédient essentiel des voyelles. Même si celles de « dé » et « feutre », ou bien celles de « dites » et de « lutte » n’ont pas forcément les mêmes F₁ et F₂ (ce qu’on voit bien chez moi), ce qui les distingue avant tout est le fait que l’une n’est pas arrondie et l’autre si. Si l’arrondissement n’est malheureusement pas facilement lisible sur un spectrogramme, on peut le constater physiquement. Prononcez les mots devant un miroir pour vous en rendre compte par exemple.

Une voyelle peut être semi-arrondie ; par exemple ma voyelle de « botte », outre un F₁ et un F₂ plutôt différents de ceux de « dôme », est bien moins arrondie. Ma voyelle de « feutre » est très arrondie, au contraire de celle de « jeune ». Ce sont des nuances qu’on peut apprendre à reconnaître à l’oreille, à défaut de pouvoir voir la personne dont on étudie les voyelles.


4.2 Voyelles nasales

Vous avez pu remarquer que je n’ai pas parlé des quatre derniers mots enregistrés : « peinte, junte, tende, tonde ». La raison à ça, c’est que ces voyelles sont nasalisées, ce qui leur ajoute des fréquences et peut compliquer l’analyse. Par exemple, Praat me donne les formants suivants pour « junte ».

Les formants d'une voyelle nasale sur Praat

Soit F₁ ≈ 282 Hz et F₂ ≈ 1374 Hz. Or je sais que c’est impossible car cela en ferait une voyelle fermée (F₁ bas) alors que je sais, d’une part, que la voyelle /œ̃/ est censée être ouverte, et d’autre part que je la prononce effectivement très ouverte. En fait, la nasalisation intensifie le spectre dans les basses fréquences, ce qui fait croire à Praat que F₁ se situe vers 282 Hz. Sachant que c’est faux, on peut se rendre compte à l’œil nu qu’une autre fréquence est relativement intense au-dessus.

Les formants d'une voyelle nasale sur Praat

Si on consulte sa valeur, on trouve environ 674 Hz, soit effectivement la voyelle très ouverte à laquelle on s’attendait. C’est bien notre F₁. Le même genre de faux positif m’est arrivé avec /œ/, qui n’est pourtant pas nasalisée ; ayez donc toujours l’œil pour le formant parasite.

Pour ma voyelle de « tonde », c’était encore pire : F₁ était noyé dans les basses fréquences et il a fallu que je fasse beaucoup de comparaisons avec d’autres de mes voyelles pour découvrir qu’il se situait autour de 505 Hz (la fréquence sélectionnée ci-dessous).

Les formants d'une voyelle nasale sur Praat

Un autre cas limite concerne la voyelle <un> en français canadien. Elle peut être rhotacisée, c’est-à-dire prononcée avec un R à l’américaine. J’ai enregistré la différence entre un <un> français et un <un> canadien et on peut clairement voir les fréquences supplémentaires.

Les formants d'une voyelle nasale et rhotacisée sur Praat

Dans ce genre de cas, il est normal d’approximer. Mais à force de recoupements entre différentes voyelles, on est généralement capable de dégager les bonnes informations.

Le diagramme complet de mes voyelles en français
Mes voyelles françaises avec les nasales. J’inclus /œ̃/, la voyelle de <un>, qu’il peut m’arriver d’utiliser.

4.3 Diphtongues

Représentation d'une courbe sigmoïde
La courbe sigmoïde typique des diphtongues.

Le français de France, sauf cas exceptionnels, n’a pas de diphtongues (du moins pas au sens traditionnel). En revanche, c’est le cas du français américano-canadien. Ainsi, si un des formants est une courbe sigmoïde (voire les deux), il va falloir traiter le son différemment.

Cette courbe s’explique du fait qu’une diphtongue consiste en la transition, dans un même mouvement articulatoire, d’un son vocalique vers un autre. Pour extraire F₁ et F₂, il faudra donc prendre quatre valeurs au lieu de deux : le début et la fin de F₁, et le début et la fin de F₂ (le même moyennage approximatif peut être fait pour chacun que pour des voyelles simples). Comme les plus matheux d’entre vous l’auront deviné, cela correspondra à une droite plutôt qu’à un point sur le diagramme.

Par exemple, voici les diphtongues de how‘d et hoyed chez mon ami nord-irlandais, avec un joli F₂ sigmoïde.

Les formants de diphtongues sur Praat

Et voici les données pour l’ensemble de ses diphtongues :

VOYELLEDébut F₁Fin F₁Début F₂Fin F₂
hayed57128221102400
hoed4532961176887
how‘d72932210062176
hoyed5722828742268
hide75633512822241

Une fois organisées de manière à afficher tous les points sur Formant Plot, voici ce que ça donne (s représente start, et e représente end).

Des diphtongues sur un diagramme vocalique

Puis mises en forme sur Inkscape.

Des diphtongues sur un diagramme vocalique, mis en couleurs sur Inkscape

5. Pour aller plus loin

Vous pouvez vous servir de votre diagramme vocalique pour transcrire précisément les voyelles en alphabet phonétique international ; pour ça, cet autre article pourra vous être utile !

Les méthodes que je détaille dans cet article se veulent simples, mais le processus reste technique, et l’acoustique est capricieuse. N’hésitez pas à vous faire aider ; personnellement, je jette mon dévolu sur les serveurs Discord de linguistique, mais d’autres communautés en ligne comme r/linguistics peuvent vous aider à vous y retrouver. Vous pouvez également laisser un commentaire à cet article ; je vous y répondrai dès que possible et dans la mesure de mes compétences ! En attendant, merci de votre lecture. 🙂

S’abonner
Notifier de
guest
0 Comments
Inline Feedbacks
Voir tous les commentaires
0
Et vous, vous en pensez quoi ?x
Retour en haut