L’image a des yeux

  • The picture has eyes

DOI : 10.54563/demeter.1691

Abstracts

En s’intéressant à l’oculométrie – l’enregistrement, la mesure et l’étude des déplacements de l’œil –, les études cinématographiques accordent au spectateur et à son regard une place inédite médiatisée par un dispositif d’enregistrement et de visualisation de données. Cet article explore les rapports possibles entre les mesures oculométriques et l’analyse de séquences filmiques en privilégiant des exemples qui déplacent cette rencontre en dehors du primat de la continuité narrative et de la synchronie attentionnelle. Ainsi, la tentative de faire dialoguer deux modèles épistémologiques permet peut-être d’interroger les distinctions entre un cinéma narratif et un cinéma expérimental davantage porté sur les formes plastiques.

By looking at eye-tracking – the recording, measuring and study of eye movements –, cinematographic studies grant an unprecedented place to the body of the spectator, one that is mediated by data recording and visualization. This article explores the possible relationships between eye-tracking measurements and film sequence analysis by focusing on exemples that move this encounter away from narrative continuity and attentional synchrony. By doing so, this attempted dialog between two epistemological models may help us to question the distinctions between narrative cinema and an experimental cinema more concerned with plastic forms.

Outline

Text

Introduction

En s’intéressant à l’oculométrie – l’enregistrement, la mesure et l’étude des déplacements de l’œil –, les études cinématographiques accordent au spectateur et à son regard une place inédite. Ce spectateur est déjà étudié sous diverses formes : il fait l’objet d’études sociologiques ; il est indissociable du dispositif de projection en salle qui constitue le cinéma ; les cinéastes intègrent parfois sa figure dans leur récit et en fond des personnages à part entière dans leur mise en scène. L’oculométrie rend désormais possible d’insérer dans l’image cinématographique, sous la forme de ronds colorés (une couleur différente par sujet), les mouvements oculaires qui nous renseignent sur la façon dont nous regardons un film, en faisant surtout ressortir deux éléments : les fixations, c’est-à-dire les points où la fovéa – la partie de l’œil où se trouve la plus grande concentration de cellules photoréceptrices – s’est fixée ; les saccades de plus ou moins grande amplitude qui permettent à l’œil de passer d’un endroit à un autre1. Au croisement entre cinéma et psychologie de la perception, l’image cinématographique ne s’appréhende plus seule, mais à l’aune du corps du spectateur, ou plutôt d’une partie de ce corps médiatisée par un dispositif d’enregistrement et de visualisation des données.

Oculométrie et cinéma : une image amputée ?

Mesurer et intégrer dans un extrait de film les mouvements saccadiques du regard, les fixations et leur durée, modifie l’image cinématographique avec laquelle travaille l’analyse de film. Rappelons que la donnée fondamentale de l’oculométrie réside dans les saccades qui parcourent l’environnement pour se focaliser, selon des fixations plus ou moins longues, sur certains traits. Ce fonctionnement par sauts et fixations est déterminé par la structure de l’œil. Étant donné que les cellules photoréceptrices se concentrent au centre de l’œil, dans la fovéa, cette dernière doit se fixer successivement sur les différentes parties d’un objet pour les voir avec précision et en couleur. La vision périphérique ou parafovéale est quant à elle : « dédiée à la perception des fréquences spatiales basses et du mouvement2. » Les psychologues de la perception distinguent deux « stratégies » ou « comportements visuels » : les « fixations ambiantes » ou « traitement préattentif » et les « fixations focales » ou « traitement attentif »3. Les premières se caractérisent par de « longues amplitudes saccadiques associées à de courtes durées de fixation », et les secondes « par de courtes amplitudes saccadiques et de longues durées de fixation »4. Les « fixations ambiantes » correspondraient aux « quatre ou cinq premières fixations » qui se livrent à une inspection rapide et globale de l’image, tandis que les fixations focales permettent « un balayage localisé et soutenu sur certaines régions précises5 ». L’hypothèse selon laquelle « ces deux systèmes se succèdent lors de la perception », au sens où « au stade préattentif les objets sont localisés dans le champ visuel et sont ensuite sélectionnés et traités au stade attentif »6, vaut pour des scènes visuelles dites « naturelles », c’est-à-dire qui ne relèvent pas du domaine artistique. L’article de Thierry Baccino, Brice Follet et Olivier Le Meur sur la vision ambiante et focale présente par exemple plusieurs photographies dont les auteurs ne sont pas cités : des paysages rocheux, un phare, un désert, une rue bordée d’arbres. Le projet « Oculométrie et perception des images : nouveaux enjeux esthétiques7 », en se situant à la croisée de la psychologie de la perception, de l’histoire de l’art et des études cinématographiques, souhaite justement interroger la façon dont les comportements visuels interagissent avec l’intention d’un metteur en scène qui compose son cadre selon des lignes de force, des contrastes lumineux, chromatiques ou de netteté, des mouvements de caméra. Il ne s’agit pas de postuler que le travail sur l’image réalisé par un cinéaste peut finalement se réduire à des principes de psychologie de la perception, mais bien plutôt de montrer que les possibilités plastiques du cinéma offrent un vaste champ d’expérimentation autour de ces stratégies visuelles.

Ce rapide rappel du fonctionnement de l’oculométrie souhaite également préciser que son objet d’étude, ces saccades et points de fixation, n’est pas celui avec lequel fonctionne l’analyse de séquence : une image en mouvement qui agence entre eux des blocs d’espace et de durée. Pour reprendre une définition proposée par Jacques Aumont et Michel Marie, l’analyse suppose de revoir un film, de choisir une ou plusieurs de ses séquences, afin d’en « dépasser la réception (sensorielle et intellectuelle), pour le saisir dans ses ressorts sémiotiques, esthétiques et idéels8. » Or, à première vue, cette confrontation avec les mesures oculométriques semble perdre des éléments de l’image cinématographique. Qu’advient-il, par exemple, de ce qui ne fait pas l’objet d’une fixation ? Faut-il en déduire que ces éléments ne sont pas du tout vus ? Ce serait ne pas tenir compte de la vision périphérique, puisque le champ visuel ne se limite pas à ce qui est perçu par la fovéa. Pour autant, peut-on mesurer cette vision parafovéale, laquelle ne fonctionne pas par mouvements pour se fixer sur un point vu avec un haut degré de précision mais, à partir d’un point, perçoit la périphérie ? Si certains éléments que l’analyse de film estime importants ne font pas l’objet d’une fixation, ceci implique-t-il qu’ils sont mal situés ? Que faire également de ce qui, dans l’image, ne relève pas d’un point précis ? Par exemple, si une fixation sur un objet ou un personnage nous assure que ces éléments sont perçus et dans quel ordre, une fixation sur une surface colorée peut-elle nous indiquer que la couleur est perçue ?

Une autre difficulté se situe au niveau du raccord. Ce dernier, selon la façon dont il respecte ou perturbe plus ou moins la continuité temporelle et la cohérence spatiale d’une scène, mobilisera différentes fonctions expressives. L’enjeu s’avère tout à fait différent du point de vue de l’oculométrie, comme l’expose très clairement Tim Smith : « les spectateurs ont tendance à ramener leur regard au centre de l’écran juste après une coupe, sans tenir compte du contenu9. » Une coupe et un raccord semblent donc avoir pour unique fonction de reconduire les regards vers le centre de l’image. Autrement dit, ce qui dans l’image cinématographique peut prendre des formes multiples et présenter une certaine ambiguïté, devient avec l’oculométrie une fonction de ponctuation uniforme, une manière de synchroniser les regards des spectateurs au centre de l’image. Cette question du montage et de son statut dans le cadre des mesures oculométriques nous conduit par extension vers celle du hors champ. Gilles Deleuze écrivait dans L’Image‑mouvement que le plan cinématographique s’articule autour de deux pôles : celui du cadrage comme ensemble avec des parties ; celui du montage comme tout qui change et dont fait partie le hors champ :

Le cadrage est l’art de choisir les parties de toutes sortes qui entrent dans un ensemble. Cet ensemble est un système clos, relativement et artificiellement clos. […] il détermine un hors-champ, soit sous la forme d’un ensemble plus vaste qui le prolonge, soit sous la forme d’un tout qui l’intègre10.

Il semblerait que l’oculométrie nous fasse perdre cette double articulation en se concentrant sur le plan comme cadrage, un « système clos […] considéré par rapport aux données qu’il communique aux spectateurs11. » Il paraît en effet difficile de dire quelque chose du lien qu’entretient le hors champ avec le cadre à partir de la façon dont un regard se déplace dans l’image. Un cadre n’est pas simplement un « système clos », il fait partie d’un ensemble et s’analyse selon les différentes manières dont il peut être relié à d’autres espaces non visibles. Divers degrés de tension résultent de ce lien entre le cadre et ce qui l’entoure. Si l’on veut trouver un terrain d’échange entre l’oculométrie et le cinéma, il faudrait cependant mettre de côté tout ce qui, dans l’analyse de film, relève globalement du rapport entre visible et invisible – en l’occurrence le hors-champ et le montage12.

Une rencontre à construire

Pour autant, les questions que soulève le dialogue possible entre les études cinématographiques et l’oculométrie ne signifient certainement pas que la rencontre entre les deux disciplines soit vouée à l’échec. Que montrent les travaux existants ? Les études déjà réalisées, notamment celles de David Bordwell et Tim Smith13, partent d’un présupposé fort qui place au centre des films la continuité narrative : « Le cinéaste doit diriger notre attention vers les éléments qui nous permettent à tout moment de réagir au drame qui se joue14. » Bordwell et Smith considèrent les mesures oculométriques comme le moyen de confirmer ces règles de continuité narrative et de prévalence de la narration, laissant de côté tout un aspect du cinéma de fiction qui relève tout autant d’un travail formel que d’une ligne narrative, et plus encore le cinéma expérimental. Selon cette perspective, le dialogue entre les deux disciplines permet avant tout de vérifier à un niveau empirique les intuitions de l’analyste qui, sans savoir exactement comment se comporte le regard du spectateur, avance des hypothèses sur la manière dont un cinéaste construit sa scène afin de diriger l’attention. Tim Smith choisit ainsi de tester l’analyse d’une scène de There Will Be Blood (Paul Thomas Anderson, 2007) par David Bordwell. Il s’agit d’un dialogue filmé en plan séquence où trois personnages au premier plan sont penchés sur une carte15. Bordwell émet l’hypothèse que le plan séquence allié à ce cadrage fixe, qui met en avant les expressions des acteurs et les mouvements de leurs mains, permettent de diriger l’attention de manière tout aussi efficace qu’un montage rapide ou l’usage de gros plans. Les mesures réalisées par Tim Smith confirment que la mise en scène choisie par Paul Thomas Anderson concentre les regards sur les mêmes points : les visages des interlocuteurs et les mouvements de leurs mains. Le cinéaste, sans recourir au montage ou à des échelles de plan focalisées sur un détail, parvient à produire ce que Smith appelle une « synchronie attentionnelle », à s’assurer qu’une grande partie des spectateurs regarde au même endroit au même moment :

La dynamique du dialogue concentre les regards sur le visage de celui qui parle, puis vers celui qui écoute pour évaluer sa réponse. […] Les mouvements brusques, par exemple un personnage qui lève la main, attirent involontairement le regard vers la source du mouvement. […] Ces événements audiovisuels produisent un haut degré de synchronie attentionnelle et des moments où le cinéaste sait ce que la majorité des spectateurs regarde16.

Si cette étude pose des jalons importants en combinant analyse de film et oculométrie, elle a également tendance à trop mettre la narration au centre (il n’est d’ailleurs pas anodin d’avoir choisi une scène de dialogue), et à concevoir les rapports entre les deux disciplines comme une entreprise de vérification, une validation de l’analyse par des mesures empiriques. Au-delà de cette validation empirique, le dialogue entre les études cinématographiques et la psychologie de la perception doit permettre de confronter les « stratégies visuelles » d’exploration d’une image aux choix de mise en scène d’un cinéaste. Afin d’explorer plus avant la façon dont la mesure oculométrique peut, aux côtés de l’analyse de film, éclairer l’intention qui préside au cadrage et au montage d’une séquence, nous aborderons trois cas dont la particularité est de faire appel à des principes plastiques forts : le split-screen chez Brian De Palma (Passion, 2012 ; Sœurs de sang, 1973 ; Snake Eyes, 1998) ; le travelling comme filature des personnages dans Elephant (Gus Van Sant, 2003) ; les mouvements d’appareil programmés et automatisés de La Région centrale (Michael Snow, 1971) qui filment un désert sans aucune présence humaine, que ce soit devant ou derrière la caméra. Les exemples de mesures qui suivent ne se focalisent donc pas uniquement autour de la narration et cherchent plutôt à en explorer les différents degrés. Les séquences choisies présentent un enjeu d’autant plus intéressant qu’elles rendent difficile de prévoir quelle zone va privilégier le regard.

Le split-screen, dérouter le regard

Pour un « styliste visuel17 » comme Brian De Palma, mettre en scène des personnages qui se manipulent les uns les autres implique de ne pas faire de cette manipulation un simple thème mais d’en imprégner sa mise en scène ; un souci dont témoignent les split-screen de Passion, Sœurs de sang ou encore Snake Eyes (la liste n’est bien entendu pas exhaustive). Le recours fréquent aux écrans partagés prouve également que le cinéaste ne craint pas d’associer le genre du thriller et ses exigences narratives à des formes plastiques complexes. La séquence choisie dans Passion intervient justement à un tournant essentiel de l’intrigue, le meurtre de Christine par Isabelle. Pourtant, De Palma choisit de compliquer la mise en scène et la tâche du spectateur en optant pour un split-screen intermittent, durant lequel l’écran se scinde en deux puis retrouve sa forme initiale par une série de volets coulissants. L’attention est donc distribuée sur deux écrans et deux lignes d’action : la maison de Christine ; le ballet où est censée se trouver Isabelle. La musique de ce ballet, Prélude à l’après-midi d’un faune de Claude Debussy, recouvre par moments le dialogue entre les personnages présents chez Christine, faisant ainsi communiquer ces deux lieux séparés. Au lieu de diriger l’attention sur un point central, De Palma préfère créer un conflit perceptif pour le spectateur. Les données de l’oculométrie combinées à l’analyse des plans permettent de détailler ce conflit et ses différents degrés, lesquels sont plus ou moins forts selon la configuration qu’utilise le réalisateur. 1) Un des deux écrans offre un plan séquence tandis que l’autre écran a recours à une coupe. Dans ce cas de figure, l’articulation entre les deux écrans repose sur un contraste, le plan séquence étant moins directif pour le regard que la coupe. Plus le plan dure, plus la fréquence des saccades baisse et plus la synchronie entre les regards des différents spectateurs diminue. En revanche, la coupe mobilise les regards et les recentre. Ce contraste entre plan séquence et coupe peut encore être accentué par un changement d’échelle de plan ou un changement d’axe. 2) Les deux écrans présentent un plan séquence, défaisant ainsi un peu plus la synchronie des regards. 3) Une coupe survient au même moment sur les deux écrans, créant un conflit pour l’attention du spectateur qui se trouve confronté à deux centres possibles.

Deux mesures sont disponibles pour cette séquence, un groupe de trois personnes formées à l’analyse de séquence et un autre groupe de trois personnes qui n’y sont pas formées. Les mesures révèlent que les comportements visuels de ces deux groupes diffèrent sur certains points. De manière générale, le regard des personnes non formées à l’analyse a tendance à se porter sur les mêmes zones et surtout à rester au centre de l’image sans tenir compte de son redoublement par l’écran divisé, c’est-à-dire de part et d’autre de la ligne du split-screen. Le regard des personnes formées à l’analyse est moins synchronisé, il se porte moins sur les mêmes points et explore davantage la totalité de l’image. L’effort qu’implique le split-screen pour le spectateur et la différence d’étendue du champ visuel entre les deux groupes apparaissent surtout lorsque De Palma étire son image au maximum : d’un côté la discussion entre Christine et Dirk ; de l’autre les mouvements du ballet, en particulier du danseur en bas à gauche de l’image (Fig. 1). Dans le groupe des personnes formées à l’analyse, une coupe et un changement d’axe introduisant une contreplongée a mobilisé les regards, alors que cet effet de concentration est moins perceptible dans l’autre groupe. La contreplongée n’est pas porteuse d’un enjeu narratif particulier, mais ce déséquilibre dans le cadre crée une tension et donne à voir un nouvel élément du décor, le pommeau de douche, qui pourrait évoquer le meurtre de Marion Crane sous la douche dans Psychose. Les stratégies visuelles des deux groupes partagent un point commun : les regards se concentrent sur le mouvement de la danseuse, plutôt que sur la partie droite du split-screen, où la caméra effectue un panoramique sur une rue sombre et vide de Berlin. De la même manière, pour les deux groupes, lorsque De Palma réintroduit le split-screen par un volet coulissant partant de la droite du cadre après avoir montré le ballet en plein écran, le mouvement de la danseuse guide les regards vers la droite, anticipant le volet.

Figure 1

Figure 1
Figure 1

Brian de Palma, Passion, 2012.

Qu’est-ce que ces mesures oculométriques peuvent apporter à l’analyse de séquence ? Elles mettent ici en évidence que le cinéaste, selon le montage, la composition du cadre, les échelles de plans choisis, peut inciter le regard à ne pas suivre nécessairement la ligne narrative, et ce quand bien même l’extrait présente un point crucial de l’intrigue. La séquence se compose autour de trois éléments : le mouvement de Christine qui éconduit le personnage masculin, Dirk, puis retourne chez elle ; les mouvements des danseurs ; l’immobilité du regard d’Isabelle. Les yeux d’Isabelle sont le seul élément montré en très gros plan, l’échelle de plan la moins directive, celle qui regroupe le moins les regards des différents spectateurs. Sur cette image, l’attention ne se fixe pas en un point précis et aucun mouvement dans le cadre n’offre d’accroche. Le reste de l’extrait utilise plutôt des plans moyens où le mouvement des personnages, de la caméra ou encore les coupes permettent éventuellement de guider les regards, parfois de les recentrer. À travers ces mesures, il apparaît de manière plus concrète que De Palma fait de ce gros plan sur les yeux d’Isabelle un cache, ce plan étant trop peu directif et n’indiquant rien du lieu où elle se trouve. Introduit par un volet et non une coupe, cette image est moins vue pour ce qu’elle représente que comme une surface qui vient en masquer une autre. Elle déroute le regard alors que si cet extrait comporte un enjeu narratif important (où se trouve-t-elle, que regarde-t-elle), il se situe là.

Là où d’autres split-screen de De Palma partagent l’écran entre deux images qui entretiennent toutes deux un lien direct avec l’intrigue (un homme en train d’être assassiné et une journaliste qui assiste au meurtre dans Sœurs de sang, par exemple), ici le ballet semble ne concerner l’événement que de manière indirecte. L’analyse de séquence pourrait ainsi laisser penser que les regards se concentreraient surtout du côté droit du cadre, sur les gestes de Christine qui raccompagne ses invités, échange avec Dirk, puis rentre chez elle et prend une douche. Or les mesures montrent clairement que ce n’est pas le cas. Les mouvements et déplacements des danseurs sur la scène éclairée jouent le rôle d’un appât pour le regard, le guident. Cette danse redouble l’alibi d’Isabelle (qui prétendra être restée à l’opéra le soir du meurtre), mais vaut aussi comme l’équivalent de son trajet depuis l’opéra vers la maison de Christine, un trajet qui ne nous est pas montré comme tel mais suggéré. En s’articulant autour de deux lieux et deux lignes d’action, cette séquence tend donc à dérouter le regard des spectateurs, au sens où elle l’invite à se porter vers des éléments qui ne sont pas directement liés au meurtre à venir.

Faire mine d’affoler l’œil

Les usages du split-screen chez De Palma sont variés et ne tendent pas tous à décentrer le regard jusqu’à le conduire sur une fausse piste. Aux vues des mesures réalisées sur un extrait de Sœurs de sang et de Snake Eyes mesures qui regroupent cette fois trois personnes formées à l’analyse de film –, il s’agit plutôt, dans ces deux films, de distribuer l’attention entre les deux centres que produit le split-screen. Dans Sœurs de Sang, l’écran partagé intervient lors du meurtre de Philip Woode auquel assiste, par sa fenêtre située de l’autre côté de la cour, la journaliste Grace Collier. Les regards se répartissent nettement entre les deux centres des cadres que sépare le split-screen : Philip Woode agonisant, puis Danielle Breton d’un côté ; Grace Collier de l’autre. Les faux raccords regard reliant les deux parties de l’écran organisent les déplacements oculaires. Ainsi, Grace Collier au téléphone avec la police qui regarde hors champ vers la droite semble observer Danielle Breton étendue sur le sol de sa salle de bain. Pour focaliser l’attention, De Palma use de surcadrages, enserrant les personnages entre les murs d’un couloir, dans le cadre d’une fenêtre ou l’embrasure d’une porte. Le meurtre et la présence d’un témoin incitent à explorer les images à la recherche d’indices sur l’identité du meurtrier, d’où les fixations de courte durée et les saccades très rapides. De Palma s’emploie d’abord à contrarier cette quête visuelle en proposant des informations qui ne sont pas directement liées au meurtre (les articles de journaux écrits par Grace d’abord vus à l’arrière plan puis montrés en gros plan), en réduisant l’espace ou encore en se servant de Danielle, debout au premier plan, pour masquer la scène du crime en profondeur de champ. Une fois Danielle sortie du cadre, cette image est celle qui suscite le plus de fixations focales (des durées de fixation plus longues et des saccades d’amplitude plus courte) sur le lit défait, les traînées de sang par terre, les cartons sous la table (Fig. 2.).

Figure 2

Figure 2
Figure 2

Brian de Palma, Sœurs de sang, 1973.

Un autre exemple éclaire la façon dont le split-screen, tout en jouant de la saturation, n’en renonce pas moins à diriger l’attention. L’extrait de Snake Eyes qui a fait l’objet de mesures oculométriques montre une nouvelle version du meurtre du secrétaire à la Défense, cette fois ci selon le point de vue de Julia Costello. Comme dans Sœurs de Sang, l’écran partagé sert à proposer deux centres symétriques au spectateur, tout en facilitant la circulation du regard de l’un vers l’autre malgré la multiplication d’informations. Le côté droit de l’écran est occupé par un dialogue entre Julia Costello et le secrétaire à la Défense que l’on entend pendant toute la scène (Fig. 3).

Figure 3

Figure 3

Brian de Palma, Snake Eyes, 1998.

Sur cette partie du split‑screen les fixations se concentrent sur les bouches des personnages, tandis que le son continu du dialogue semble libérer le regard pour explorer l’autre partie de l’image qui enchaîne différents points de vue : celui du commanditaire de l’assassinat, de l’inspecteur Rick Santoro, du boxeur Lincoln Tyler et de l’assassin. Les nombreuses coupes permettent de ramener les regards vers le centre du cadre, lequel constitue ici le pivot de la mise en scène choisie par De Palma. Quelle que soit l’échelle de plan, l’élément principal se trouve situé au centre : le visage en gros plan de Kevin Dunne avec ses jumelles ; Julia Costello et le secrétaire à la Défense vus à travers ces dernières et surcadrés par les cordes du ring ; Rick Santoro au bord du ring ; la gâchette et le canon du fusil. La discussion d’un côté et les cadres composés autour du centre de l’autre forcent les différents spectateurs à effectuer des mouvements oculaires similaires, notamment à privilégier les fixations focales sans passer par un stade préliminaire de fixations ambiantes pour explorer l’image. Ainsi, pour affoler le regard sans le perdre, De Palma sature l’image d’informations, la dédouble, multiplie les points de vue sur un même événement, mais il utilise aussi de manière systématique une zone délimitée de l’écran, son centre, vers lequel l’œil tend spontanément.

Elephant et La Région centrale : vers une désynchronisation des regards ?

Elephant et La Région centrale proposent un autre enjeu à l’oculométrie. Dans Elephant, qui retrace les dernières heures avant la fusillade dans le lycée de Columbine, les enjeux narratifs sont toujours présents, mais rendus plus diffus par la composition formelle. Cette dernière s’attache à suivre les parcours de différents personnages à travers un lycée en se concentrant sur leur dos et nuque, plutôt que sur leur visage. Si le regard a tendance à se fixer sur les mains et les bouches pour suivre une narration, dès lors quelle stratégie visuelle adopter face aux travellings filature de Gus Van Sant ? De même, contrairement aux exemples choisis chez De Palma, la longueur des plans aussi bien dans Elephant que dans La Région centrale est cette fois susceptible de défaire la « synchronie attentionnelle » et de révéler d’autres manières de regarder.

La séquence d’Elephant commence par suivre Nathan en extérieur avant de s’arrêter et de le laisser s’éloigner vers le bâtiment du lycée dans la profondeur de champ. Lorsque nous retrouvons le personnage à l’intérieur des couloirs du lycée, un travelling l’accompagne de dos tout en modifiant le degré de flou qui se dépose sur l’arrière-plan, tantôt complètement brouillé, tantôt peuplé de silhouettes bien distinctes. Durant toute la scène, le mouvement du personnage semble fonctionner à la fois comme point d’équilibre vers lequel convergent régulièrement les regards, mais aussi comme moteur de dispersion, son déplacement pouvant être l’objet d’une vision périphérique (Fig. 4).

Figure 4

Figure 4
Figure 4
Figure 4

Gus van Sant, Elephant, 2003.

La durée du premier plan en extérieur (un peu plus d’une minute à partir du moment où Nathan enfile son sweat-shirt et commence à marcher) et l’absence de coupe donnent lieu à des fixations plus longues qui ne se focalisent pas uniquement sur le personnage en mouvement, mais explorent la totalité de l’image, depuis les éléments végétaux jusqu’à l’architecture du bâtiment et les lycéens assis dans la profondeur de champ. Plus Nathan s’éloigne de la caméra, moins il concentre les regards qui se portent alors plutôt sur la porte vers laquelle il se dirige. Les mesures soulignent aussi le rôle du son dans le parcours du regard. Ainsi, les plans où la profondeur de champ est floue n’impliquent pas pour autant que le spectateur se désintéresse de cette partie de l’image ; au contraire, les portes, les murs, les casiers, les silhouettes brouillées à l’arrière plan font l’objet de fixations. Comment expliquer cet attrait pour le flou, alors que le dos et la nuque de Nathan sont nets ? Si le champ visuel est confus, en revanche certains sons diégétiques (une chorale, une porte qui s’ouvre) pointent très nettement à travers la musique extradiégétique et interpellent les regards.

Entraîné par le double mouvement de Nathan et de la caméra, l’attention ne reste pas focalisée sur le centre et ne cherche pas seulement la présence ou les déplacements d’autres personnages. Il lui arrive aussi de suivre une composition plastique mêlant les couleurs, la lumière et le son. Par exemple, lorsque Nathan monte les escaliers et passe devant de grandes fenêtres nimbées d’un halo blanc tandis que retentissent les chants de la chorale, les regards vont de la croix blanche imprimée au dos de son sweat-shirt aux vitres. Ce trajet visuel ne repère pas des informations directement liées aux enjeux narratifs, mais fait plutôt ressortir l’écho religieux que Gus Van Sant confère à ce bref instant.

La Région centrale de Michael Snow achève de dissiper la narration et de disperser le centre du cadre, ce dernier ne constituant plus le pivot autour duquel se compose l’image. Pour filmer les paysages d’une région montagneuse et désertique du Québec, le cinéaste a mis au point une « structure métallique composée d’un pied et de deux bras ; sur l’un d’eux est ficelée une caméra 16 mm Ariflex18 » tandis que le bras jumeau « sert de contrepoids » (Fig. 5). Les mouvements continus et arbitraires de la caméra ont été programmés par ordinateur ; ils ne dépendent pas du mouvement d’un personnage, ni d’une situation narrative, ni du regard du cinéaste. Les mesures oculométriques permettent de préciser en quoi la façon de regarder change dès lors que la narration n’est plus un élément immédiat de l’image.

Figure 5

Figure 5
Figure 5

Michael Snow, La région centrale, 1971.

Une conséquence en découle d’emblée : c’est dans cet extrait que la synchronie des mouvements oculaires est la plus faible, au sens où les spectateurs ne regardent pas au même endroit au même moment et adoptent des comportements visuels plus variés. Dans les autres extraits la durée des fixations était plus ou moins la même pour les différents spectateurs, ici les fixations de certains sujets sont très rapides tandis que d’autres durent beaucoup plus longtemps. Toutefois, il ne faudrait pas en conclure que le cinéma expérimental laisse toute liberté à l’œil, là où le cinéma narratif le guide. En effet les points fixés se recoupent, en particulier ceux dont le caractère saillant est le plus marqué, que ce soit en termes de contours ou de contrastes lumineux. La ligne de crête que dessinent les rochers, certains cailloux aux teintes plus clairs que la terre, ou encore les contours des nuages sont des éléments qui attirent l’attention des trois spectateurs à des moments différents. De manière générale, l’œil s’attarde davantage sur le sol où il semble trouver plus de points d’accroche, et quand il explore le ciel ce sont les nuages qu’il privilégie. Cette plus grande attention portée au sol va de pair avec des fixations focales, tandis que le ciel est plutôt vu selon des fixations ambiantes. La façon dont les cailloux sont regardés, par des saccades de courte amplitude, évoque quant à elle la recherche d’indices à laquelle se livraient les regards dans l’extrait de Sœurs de sang, quand bien même la charge narrative de ces deux séquences est tout à fait différente.

Les divers mouvements de la caméra, balayage du sol, panoramique latéral, rotation, ne contraignent pas le regard de la même manière. Le balayage vers le haut du cadre, qui se concentre sur les aspérités du sol, donne lieu à des saccades très rapides, tandis que le panoramique latéral ralentit le rythme des mouvements oculaires et en vient peu à peu à concentrer les regards sur la droite de l’image, là où le paysage entre dans le cadre. Le mouvement de rotation qui intervient ensuite disperse les saccades et points de fixation, là où le panoramique latéral avait tendance, dans sa durée, à les regrouper sur la droite de l’image. Malgré l’effet de la rotation qui inverse les rapports entre ciel et terre, les regards se portent en majeure partie sur le sol ou la ligne d’horizon, comme s’ils privilégiaient la partie de l’image qui permet des fixations focales plutôt qu’ambiantes.

Conclusion

Les mesures oculométriques soulignent l’impact des choix de mise en scène sur les comportements visuels des spectateurs. Nous ne regardons pas de la même manière un gros plan sur des yeux, un split-screen qui multiplie les points de vue sur une même action, le dos d’un personnage sur un fond flou, ou un paysage qui se partage entre un sol rocheux et un ciel parsemé de nuages blancs. L’analyse des mouvements oculaires ne réduit pas l’image cinématographique à un ensemble quantitatif, mais permet de préciser l’intention du metteur en scène, la façon dont il fait coïncider ou entrer en conflit la ligne narrative et la composition plastique de l’image, par exemple. Ces mesures ont également un intérêt immédiat pour l’analyste, car voir les points de fixation permet parfois de souligner l’importance de certains éléments et d’en tirer des hypothèses : l’impact d’une échelle de plan ; la fugitive connotation religieuse d’un cadre. Enfin, par-delà les différences supposées entre cinéma narratif et cinéma expérimental, l’étude du déplacement des yeux révèle une proximité dans les comportements visuels adoptés par les spectateurs. Ainsi, face à La Région centrale qui ne construit pas d’attentes narratives, le regard n’erre pas pour autant avec une plus grande liberté, comme pouvait le supposer David Bordwell : « si nous n’avons pas d’attentes narratives, comme quand nous regardons un film lyrique d’avant-garde de Stan Brakhage ou Nathaniel Dorsky, nous laissons peut-être nos yeux parcourir les images plus librement19. » Les mesures réalisées à partir de Sisters et La Région centrale tendent à indiquer que ces distinctions entre film narratif et non narratif sont à nuancer, puisque les fixations sur une série de cailloux éparpillés au sol évoquent celles qui cherchent des indices sur une scène de crime. Même si les modèles épistémologiques diffèrent, loin d’être en rupture avec l’analyse de film et de ne proposer qu’une validation de ses hypothèses par les données de la psychologie de la perception, l’oculométrie peut ouvrir un champ d’expérimentation pour la description des images, de leur charge narrative et plastique.

Bibliography

Aumont Jacques, Montage, « la seule invention du cinéma », Paris, Vrin, 2015.

Aumont Jacques et Michel Marie, L’Analyse des films, Paris, Armand Colin, (2004) 2015.

Baccino Thierry, Brice Follet et Olivier Le Meur, « La vision ambiante et focale dans l’observation de scènes visuelles », dans À perte de vue. Les nouveaux paradigmes du visuel, Daniel Dubuisson et Sophie Raux (éds), Dijon, Les Presses du réel, 2015.

Bordwell David, « Hands (and faces) across the table) », David Bordwell’s website on cinema, 13 février 2008. URL: http://www.davidbordwell.net/blog/2008/02/13/hands-and-faces-across-the-table/ [consulté le 27 novembre 2015].

Bordwell David, « The Eye’s Mind », David Bordwell’s website on cinema, 6 février 2011. URL: http://www.davidbordwell.net/blog/2011/02/06/the-eyes-mind/ [consulté le 12 décembre 2024].

Bordwell David, « Watching you watch THERE WILL BE BLOOD », David Bordwell’s website on cinema, 18 octobre 2011. URL: http://www.davidbordwell.net/blog/2011/02/14/watching-you-watch-there-will-be-blood [consulté le 11 décembre 2024].

Bordwell David et Kristin Thompson, L’Art du film, une introduction, Bruxelles, De Boeck, 2014.

Coello Yann, « Le rôle de l’action dans la perception visuelle », dans À perte de vue. Les nouveaux paradigmes du visuel, Daniel Dubuisson et Sophie Raux (éds), Dijon, Les Presses du réel, 2015.

Deleuze Gilles, L’Image-mouvement. Cinéma 1, Paris, Minuit, 1983.

Gallot Clémentine et Thomas Napolitano, « Entretien avec Brian De Palma », Objectif cinéma, 17 avril 2002. URL: http://www.objectif-cinema.com/interviews/142a.php [consulté le 12 décembre 2024].

Loppinot Stefani (de), La Région centrale de Michael Snow, Crisnée, Yellow Now, 2010.

Smith Tim, « Attentional Theory of Cinematic Continuity », Projections: The Journal for Movies and the Mind, 6 (1), 2012, p. 12. DOI: https://doi.org/10.3167/proj.2012.060102 [consulté le 12 décembre 2024].

Tim Smith, “Watching you watch movies: Using Eye Tracking to Inform Cognitive Film Theory”, in Psychocinematics: Exploring Cognition at the Movies, Arthur P. Shimamura (ed.), Oxford, Oxford University Press, 2013.

Notes

1 Selon les cas, les mesures peuvent donner à voir le temps que dure une fixation sur un point de l’image en laissant grossir le rond. Les mesures dont nous disposons ici ne fournissent pas le « scanpath », le trajet du regard représenté sous forme de lignes. Il ne s’agit pas non plus de « heatmaps », où les zones les plus regardées de l’image apparaissent en rouge et les autres en jaune, bleu ou vert, selon le nombre de fixations qu’elles ont suscitées. Return to text

2 Yann Coello, « Le rôle de l’action dans la perception visuelle », dans À perte de vue. Les nouveaux paradigmes du visuel, Daniel Dubuisson et Sophie Raux (éds), Dijon, Les Presses du réel, 2015, p. 281. Return to text

3 Thierry Baccino, Brice Follet et Olivier Le Meur, « La vision ambiante et focale dans l’observation de scènes visuelles », dans À perte de vue. Les nouveaux paradigmes du visuel, Daniel Dubuisson et Sophie Raux (éds), Dijon, Les Presses du réel, 2015, p. 258. Dans le même article, p. 260, les auteurs parlent de « stratégie d’inspection ». Return to text

4 Ibid., p. 260. Return to text

5 Yann Coello, « Le rôle de l’action dans la perception visuelle », op. cit., p. 281. Return to text

6 Thierry Baccino, Brice Follet et Olivier Le Meur, « La vision ambiante et focale dans l’observation de scènes visuelles », op. cit., p. 258. Return to text

7 Pour plus d’information sur le projet, voir : https://www.canal-u.tv/chaines/iap/oculometrie-et-perception-des-images-nouveaux-enjeux-esthetiques. Return to text

8 Jacques Aumont et Michel Marie, L’Analyse des films, Paris, Armand Colin, (2004) 2015, p. 21. Return to text

9 Tim Smith, “Watching you watch movies: Using Eye Tracking to Inform Cognitive Film Theory”, in Psychocinematics: Exploring Cognition at the Movies, Arthur P. Shimamura (ed.), Oxford, Oxford University Press, 2013, p. 193. Return to text

10 Gilles Deleuze, L’Image-mouvement. Cinéma 1, Paris, Minuit, 1983, p. 31-32. Return to text

11 Ibid., p. 31-32. Return to text

12 Dans Montage, « la seule invention du cinéma », Jacques Aumont rappelle que « le montage est l’outil mental qui gère cette donnée essentielle : le rapport entre le visible et l’invisible ». Jacques Aumont, Montage, « la seule invention du cinéma », Paris, Vrin, 2015, p. 33. Return to text

13 David Bordwell, historien du cinéma, et Tim Smith, chercheur en cognition visuelle, ont confronté des analyses de séquence et des mesures oculométriques, étudiant la façon dont nous regardons un film et suivons son intrigue selon les choix de mise en scène du réalisateur. Return to text

14 David Bordwell, « Hands (and faces) across the table) », David Bordwell’s website on cinema, 13 février 2008. URL: http://www.davidbordwell.net/blog/2008/02/13/hands-and-faces-across-the-table/ [consulté le 27 novembre 2015]. Return to text

15 David Bordwell et Kristin Thompson, L’Art du film, une introduction, Bruxelles, De Boeck, 2014, p. 141. Voir également l’analyse de Bordwell, « Hands (and faces) across the table) », op. cit. ; et les mesures de Tim Smith effectuées à partir des conclusions de cette analyse : David Bordwell, « Watching you watch THERE WILL BE BLOOD », David Bordwell’s website on cinema, 18 octobre 2011. URL: http://www.davidbordwell.net/blog/2011/02/14/watching-you-watch-there-will-be-blood [consulté le 11 décembre 2024]. Return to text

16 Tim Smith, « Attentional Theory of Cinematic Continuity », Projections: The Journal for Movies and the Mind, 6 (1), 2012, p. 12. DOI: https://doi.org/10.3167/proj.2012.060102 [consulté le 12 décembre 2024]. Return to text

17 Clémentine Gallot et Thomas Napolitano, « Entretien avec Brian De Palma », Objectif cinéma, 17 avril 2002. URL: http://www.objectif-cinema.com/interviews/142a.php [consulté le 12 décembre 2024]. Return to text

18 Stefani de Loppinot, La Région centrale de Michael Snow, Crisnée, Yellow Now, 2010, p.10. Return to text

19 David Bordwell, « The Eye’s Mind », David Bordwell’s website on cinema, 6 février 2011. URL: http://www.davidbordwell.net/blog/2011/02/06/the-eyes-mind/ [consulté le 12 décembre 2024]. Return to text

Illustrations

References

Electronic reference

Elsa BOYER, « L’image a des yeux », Déméter [Online], Hors-série | 2024, Online since 29 janvier 2025, connection on 06 février 2025. URL : https://www.peren-revues.fr/demeter/1691

Author

Elsa BOYER

Elsa Boyer est écrivaine, théoricienne et traductrice. Elle a publié un essai intitulé Le conflit des perceptions (2015, Musica Falsa) sur la technologie, les jeux vidéo et la phénoménologie. Un autre essai sur Alan Turing, l’intelligence artificielle et les questions de genre est paru aux éditions Pérégrines (Turing, 2023, Pérégrines). Elle a fait paraître huit récits aux éditions P.O.L et MF qui interrogent, chacun à leur manière, notre environnement médiatique et numérique contemporain, la façon dont il façonne nos perceptions et nos affects. Elle enseigne la théorie des médias, les humanités numériques et les questions d’écriture contemporaine à l’École nationale supérieure des arts décoratifs de Paris.

Copyright

CC-BY-NC