Le discours d’Emmanuel Valls

Je me suis posée une question en regardant la télé, mais pourquoi est-ce que je reconnais à peine la voix d’Emmanuel Valls lorsqu’il parle catalan ? Après son discours de candidature à la mairie de Barcelone, mardi soir, cette question existentielle m’a intrigué.
En réfléchissant un peu, je constate également qu’Emmanuel Macron a la voix qui grimpe dans les aigus quand il parle anglais. Tout ça me parait bizarre, se pourrait-il que nos hommes politiques aient un problème d’identité vocale ?

 

C’est plus simple que ça

L’explication se trouve du côté des fréquences hertziennes. Chaque langue a sa propre « bande passante ».

  • fréquences vocalesLe français utilise beaucoup de médiums (entre 1 000 et 2 000 hertz)
  • L’anglais au contraire se caractérise par ses fréquences aigues, entre 2 0 0 0 et 12 000 Hz
  • L’espagnol par sa bande passante étroite, entre 100 et 500 Hz, plutôt dans les graves.

Je comprends mieux pourquoi j’avais cette impression que Valls était doublé par un interprète à la voix de stentor.

Ces découvertes ont été mises en évidence par Alfred Tomatis (1920-2001), un ORL qui a inventé une méthode de rééducation de l’ouïe et de la voix. Pour ce médecin, la voix ne peut reproduire que ce que l’oreille entend.

A la naissance, les bébés ont quasiment l’oreille absolue, ouverte à toutes les fréquences, puis, petit à petit, l’ouïe se verrouille sur les fréquences de l’idiome maternel. Ces données permettent aussi d’éclairer les différences de maîtrise de langues étrangères d’un pays à l’autre.

 

L’articulation modifie le son

Bénéficiant du spectre le plus large, avec une bande passante allant de 125 à 8 000 Hz, les russophones sont ainsi capables d’entendre et de reconnaître des fréquences très graves comme très aiguës, ce qui les rend potentiellement doués pour les langues. A l’inverse, les Espagnols auront des difficultés à entendre les fréquences aiguës et seront plus en difficulté pour reproduire, par exemple, l’anglais.

Les langues ne diffèrent pas que par leur fréquence, mais aussi par leur intonation. Pour parler, on utilise en effet les articulations : mâchoire, langue, larynx, lèvres. Et chaque langue fait appel à une base articulatoire différente, ce qui explique les variations. Les étrangers disent que les Français font la moue quand ils parlent, car notre langue utilise plus la labialisation, c’est-à-dire la production de sons avec les lèvres.

« Les Américains, eux, utilisent beaucoup de phonèmes qui nécessitent d’articuler avec la langue vers l’avant. Par exemple pour le fameux think que les Français ont souvent du mal à prononcer. A ce moment-là, le larynx se positionne plus haut et le son devient plus aigu », explique Claire Pillot, maître de conférences en phonétique à la Sorbonne.

« Mais tout le monde ne ressent pas ce changement de voix en fonction de la langue parlée », ajoute-t-elle. A l’instar de Daniel Cohn-Bendit. « Que je parle français ou allemand, j’ai la même voix ! » dit-il. Pas faux.

 

Pourquoi ne reconnaît-on pas sa voix quand on l’entend?

C’est notre corps qui nous empêche de reconnaître notre voix sur des enregistrements. La raison est en effet purement anatomique : les sons extérieurs sont captés par les oreilles alors que ceux venant de l’intérieur sont aussi transmis par les os. Pour comprendre, il faut revenir sur la façon dont le son de la voix se forme. Le phénomène naît dans les poumons qui envoient un souffle passant à travers le larynx pour faire vibrer les cordes vocales, ce qui produit une onde sonore. Avant qu’on ne l’entende, celle-ci parcourt un long chemin dans les oreilles : elle s’engouffre dans le conduit auditif externe puis dans le tympan, qui vibre. Ces vibrations atteignent des structures appelées osselets, qui les transmettent à l’oreille interne où l’onde est convertie en signal nerveux. C’est ce dernier qui est transmis au cerveau par le nerf auditif.

Ce n’est pas tout. Lorsque l’on s’entend parler, la vibration sonore est non seulement transmise par la bouche de l’extérieur jusqu’aux tympans, mais aussi de « l’intérieur », par les os de la mâchoire et du crâne directement aux osselets puis à l’oreille interne. Ainsi, la voix que l’on entend est la combinaison des sons véhiculés par ces deux voies. En revanche, lorsque l’on écoute un enregistrement de sa propre voix, celui-ci n’est capté que par les tympans : il n’y a plus de transmission osseuse puisque le son provient uniquement de l’extérieur du corps. En outre, comme les os transmettent préférentiellement les fréquences acoustiques les plus graves, nous percevons notre propre voix enregistrée comme plus aiguë.