L’idée de cette rubrique est de vous proposer des concepts, glanés au cours de mes lectures ou forgés par moi pour diverses raisons, qui me semblent utiles à la compréhension du son et à l’analyse audio.
Aujourd’hui donc, je m’attacherai au concept de proxémique en son qui permet de parler d’intimité des voix, de sensations percues et de captation.
Comme le programme est un peu ambitieux, je vous propose de commencer sans plus d’introduction : les choses viendront d’elles même, si tout se passe comme je veux.
1. Le concept de proxémique :
La proxémique est un concept de sociologie originellement développé en 1963 par l’anthropologue Edward T. Hall pour rendre compte des changements comportementaux des sujets étudiés en fonction des distances des communications interpersonnelles (essentiellement non verbales). L’idée principale était de rendre compte des changements d’attitudes et des valeurs de communications en fonction de la distance. Il a ainsi mis sur place un diagramme qui permet de nommer et de représenter les différentes sphères d’intimité. C’est en l’occurrence qui a permis de développé l’idée que nous ne réagissons pas de la même manière aux stimulus suivant la distance à laquelle ils sont émis de nous.
Ce concept est très porteur et les références à ce travail sont nombreuses lorsqu’il s’agit de montrer l’influence que peut exercer une communication sur l’interlocuteur. On utilise, dans le langage courant, des expressions qui en sont issues (« tu rentres dans ma zone personnelle » ou encore « c’est ma bulle » proviennent de l’imagerie proxémique). J’en prends comme exemple rapide un extrait d’un livre particulièrement drôle à lire, qui traite tes techniques de manipulation les plus usuelles :
Bref, l’effet du toucher est aujourd’hui démontré sur le plan évaluatif, motivationnel, relationnel et même physiologique. Cet effet est, nous l’avons dit, troublant. D’Une part, il va à l’encontre des croyances bien établies concernant les distances à respecter dans les relations interpersonnelles. Sans doute a t’on quelque peu exagéré l’importance des règles de proxémies chères à Hall et aux tenants de la communication interculturelle… [1]
Ainsi donc, Edward T.Hall nous a dotés d’un vocabulaire précis pour parler du rapport d’intimité en communication. Ça vous fait une belle jambe. Moi aussi. L’été arrive, ça tombe bien! Et pourtant, y’a un gars, un peu perdu dans sa Finlande natale qui a fait une transposition tout à fait passionnante de la proxémique à l’analyse sonore au cinéma : Arnt Maaso.[2]
2. La proxémique appliquée à la voix.
Dans un brillant article [3], Arnt Masso propose une réduction judicieuse de l’approche de Halls pour l’appliquer plus efficacement à l’analyse d’objet audiovisuelle. Premièrement, il va faire l’économie de quelques niveaux d’intimités qui ne sont que très difficilement transposables au niveau de l’écoute.
During my work developing and adjusting the analytical tools presented here, I have simplified Edward T. Hall’s categories slightly. […] Hall used four zones divided into « near » and « far » regions. For the two closest regions ( the intimate and the personnal), such a level of detail seems unnecessarily inexpedient when dealing with sound, as our ears are poorer judges of spatial details in distance than vision […] [3] p 42
Voici les grandes lignes du résultat de ladite transposition.
En gros, histoire de vous évitez un peu de lecture, Masso fait correspondre à chaque niveau proxémique une intention d’émission, l’implication sur la prise de son et enfin la sensation d’écoute à la réception. Simple et efficace. Dans son travail, on se rend rapidement compte que les distances (exprimées en centimètres et en pouces) ne sont là que pour réifier les distances perçues et qu’il est finalement difficile, en cinéma, de faire des correspondances directes.
Si ce tableau me semble pertinent, il propose, dans un deuxième temps trois étapes d’analyse qu’il faut articuler avec cette taxinomie :
— a) La distance vocale (vocal distance) : il s’agit de la distance proxémique intentionnelle du locuteur. Ainsi une voix chuchotée se veut, le plus souvent, le l’ordre de l’intime (ECU). En gros, lorsqu’on parle on « porte sa voix » comme on dit au théâtre, c’est-à-dire qu’on module la puissance pour qu’elle « se rende » jusqu’à son interlocuteur. On souhaite qu’elle se « rende », mais pas qu’elle le dépasse : ainsi vous appuyez différemment votre voix si votre interlocuteur est au bout de la table ou au bout du couloir, et vous criez carrément s’il est à l’étage. Cette intention que vous avez, c’est la distance vocale.
— b) La distance de portée (earshot) : il s’agit de la portée, en distance de la voix… la puissance sonore si vous voulez. Le plus souvent distance vocale et distance de portée coïncident parce que vous êtes relativement maître de votre voix. Cependant, parce que nous parlons ici de voix médiatisée, c’est à dire possiblement retravaillée, manipulée, transformée, il est tout à fait possible que le lien logique qui lie la distance vocale et la distance de portée soit brisé (pour des raisons esthétiques ou simplement par problème technique). Ainsi, on peut donc artificiellement augmenter la portée d’une voix (en l’amplifiant) ou en réduire l’impact (baisser le volume, travail fréquentiel, etc.) Cette rupture mène à ce que Maaso appelle la « schizophonie » à la suite de Murray Schaeffer [4] c’est-à-dire à la rupture de l’adéquation « naturelle » entre l’intention et la perception de l’intimité de la voix.
— La perspective du microphone (microphone perspective) : C’est en fait la distance entre la source et le point de captation du son. Cet aspect est surtout réglé par la quantité de réverbération de salle. . Maaso nous met cependant en garde contre une sur interprétation de l’importance du dispositif technique :
This level encompasses the mise-en-scène of the voice by the technological apparatus and avoustical characterisitics important in judging the distance (such as the direct-to-reflected sound and timbre), with the noted exceptions of volume and intented earshot […] Whether a voice is recorded in a closetor a cathedral will affect the sound of a voice in important ways, influencing in particular our perception of distance. To simplify the discussion and tie the microphone perspective to a reference that is meaningful, for most of us, the descriptions [of this perspective] are ti be regarded as an ideal type, based on the king of reflections, reverberations, and absorbtion conditions typical for a living room. Likewise , though microphones may vary in spatial representation of a voice, the decription is an attempt to indicate the distance of a nondirection mike even though the particular voice in question may be recorded by a shotgun mike at two meters’ distance or a radio mike below the chin of a performer. The important point is that increasing the microphone distance will achieve a somewhat thinner sound, whereas the amount reflected sound to direct sound will increase. [3 ](P41-42)
Peut-être que le terme prête à confusion, car en réduisant la sensation d’éloignement de la captation à la question du positionnement du microphone on rate une grande partie des manipulations que l’on peut faire, une fois le son enregistrer, pour moduler cette sensation. On pensera au travail sur l’effet de proximité, d’adjonction de réverbération ou encore tout les transformations du point de captation que permettent les captations Sound Field, car la perspective du microphone n’est pas seulement tributaire de la position du microphone dans la salle (c’est pour cela que je vous disais que le terme n’est optimum) on peut penser aux artefacts liés à la prise de son (effet de proximité, détimbrement, variation de timbre, etc.) qui change donc l’espace perçu.
3. À quoi ça sert la proxémique?
Bien maintenant que le concept est un peu plus clair, il faut le poser la question. Essentiellement, il faut articuler ce concept avec cette belle idée de la profondeur du son que développe Michel Chion.
[Et on se rend compte que] l’image de cinéma en fait est plate alors que le son de cinéma, même sur un unique haut-parleur, comporte une profondeur réelle, tandis qu’à l’inverse l’image, elle a une surface en largeur et en hauteur, alors que le son émane d’un point unique et immatériel. [5]
Ainsi donc si le son travaille sur la profondeur, la proxémique nous offre un vocabulaire clair et universel pour parler de cette sensation de profondeur. Si, pour le moment, elle n’offre pas encore d’outils analytiques puissants (qui reposeraient sur une base psychoacoustique et/ou sémiologique par exemple), elle a tout de même l’immense avantage de faire le pont difficile entre la réalité physique (en temps que source de captation), l’intention et la représentation que construit un individu de l’ensemble. Elle englobe, sans les nommer, des aspects acoustiques, psychoacoustiques, intentionnels, technologiques, perceptifs et des considérations psychologiques ainsi que des préoccupations de l’ordre du jeu et du rendu. Ainsi en partant de la sensation perçue (où que vous voulez faire percevoir si vous êtes concepteur) vous avez ici un appareillage conceptuel pour organiser le rapport entre intention, captation et réception.
Il faut cependant probablement ouvrir un peu le champ d’analyse et ne pas cantonner cette approche à la voix médiatisée uniquement. Il me semble important de considérer aussi tous les sons qui organisent une composition, car soit ils sont émis avec une intention particulière (comme des sons instrumentaux, des bruits particuliers du corps [claquement de doigts, pas, etc.]) et relèvent bien de l’intention médiatisée, soit ils sont des substrats passifs (bruits d’environnements, ambiances, parasites, artefacts) qui sont très utiles pour saisir les causes de l’intention et la contextualiser (voix criée pour couvrir un bruit d’ambiance, pas feutrés pour ne pas éveiller le dormeur qui ronfle, etc.). Cette ouverture du champ d’application n’est pas contre nature.
La proxémique aménagée par Maaso articule le visuel et le sonore au cinéma [au lieu d’organiser des distances avec des messages communicationnels]. En fait, pour être précis, Masso articule le sonore en fonction du visuel, car la sensation de proximité, d’intimité se compare aux distances « objectives » que fournit le visuel. La vue offre une référence spatiale sur laquelle les concepts s’appuient.
Nous troquons ici simplement un référent pour un autre, de sorte que nous sommes maintenant capables d’utiliser la proxémique dans n’importe quelle configuration : les sons ambiants ayant tout ou partie de la tâche de donner la référence spatiale à l’objet d’étude fonctionnent de la même manière que l’oeil qui assigne une distance au locuteur. L’ouverture de l’appareillage conceptuel fourni par l’approche proxémique nous donne donc des outils de taxinomie, mais aussi un vocabulaire universel utile pour décoder les intentions, et ce, dans tous les domaines qui touchent au son.
4. Intermède musical :
Ainsi dans cet exemple [6] il apparaît clairement que le claquement rythmique de doigt n’appartient pas à la même perspective de microphone que la voix [il est nettement plus éloigné, détimbré, il sonne plus fin]. De cette articulation naissent plusieurs choses.
— 1) La voix de Janis Joplin prend une intimité particulière. Elle semble d’autant plus proche que le claquement de doigts semble éloigné. Il fonctionne ici comme un référent spatial en créant deux distances : un proche du point de captation (c’est ici que la voix de Janis est localisée) et un plus lointain, sous le microphone et derrière lui (où les doigts, qu’on imagine être ceux de la chanteuse, claquent). Ainsi comme le montrait Michel Chion, les sons s’organisent pour travailler la profondeur du champ audio et permettre de créer une sensation d’espace particulière.
— 2) La dualité dans cette perspective de microphone atteste de la véracité du moment de captation. Il apparaît comme un moment de temps véritable, sans artifices ni manipulation, arraché à même le studio. Le claquement détimbré, les plausives laissées là sans traitement, la qualité générale de l’enregistrement laissent croire qu’une seule prise a été faite, sans arrêt ni reprises et auréolent la performance de véracité, de virtuosité. Cet enregistrement convoque un peu la chanteuse auprès de nous sans intermédiaire technique. Si vous n’en n’êtes pas convaincu directement, écoutez le morceau qui suit sur l’album (morceau qui a un traitement nettement plus classique). La sensation d’intimité de la voix n’est pas la même du tout : la compression plus nette et les instruments plus proches reculent la chanteuse dans l’espace créé par les sons et par le fait même nous la rend moins présente.
[7]
Si les concepts d’analyse issus de la proxémique sont porteurs, c’est probablement avec celui de la schizophonie que la discipline se déploie véritablement et permet de décoder des sensations d’étrangeté, des stylisations particulières de la prise de son ou, tout du monde, du rendu sonore de l’espace vocal car la rupture avec les formes naturelles sont souvent sous l’objet des analyses. Ainsi, une suramplification des voix sur scène, un rapport de puissance étrange dans un film ou le travail d’esthétique musicale vont trouver un vocabulaire saillant et universel avec cette approche. Je vous demande de me croire sur parole pour le moment, mais je proposerai rapidement des analyses de films qui exploiteront ce concept.
5.Concluons, car il est temps.
Le concept de proxémique, récemment adapté à l’analyse du son, s’avère particulièrement intéressant pour faire l’articulation entre les intentions de l’émetteur, les intentions de la captation et la sensation reçue. C’est un fait relativement rare, car cela permet, il me semble, de sortir d’une posture trop positiviste en matière d’observation et d’analyse de compositions sonores. En effet, la proxémique aide à naviguer entre les subjectivités et présuppose une construction constante de la sensation d’intimité au sein de l’esprit du récepteur.
Je pense cependant qu’il faut ouvrir son champ d’études à tous les sons et dépasser la seule voix médiatisée. Il s’agit en tout cas d’une approche conceptuelle particulièrement enthousiasmante dont il va falloir suivre les développements dans les prochaines années!
[1] Joule, Robert-Vincent et Beauvois, Jean-Léon, 2002, Petit traité de manipulation à l’usage des honnêtes gens, Presse Universitaire de Grenoble, p 148
[2] http://www.hf.uio.no/imk/english/people/aca/arntm/index.html
[3] Maaso, Arnt, 2008, The proxemics of the mediated voice, In Beck, J. and Grajeda, T., 2008, Lowering the Boom, Critical Studies in Film Sound, University Press of Illinois, Urbana and Chicago
[4] Schaeffer ,Murray, 1977, The Tuning of the World, New York
[5] Chion, Michel, 1985, Le son au cinéma, Éditions de L’Étoile Cahiers du Cinéma, Paris.
[6] Joplin Janis, 1977, Mercedes Benz in Pearl.
[7] Joplin Janis, 1977, Me and Bobby McGee in Pearl.