Introduction
La procédure scientifique du nom d’oculométrie est supposée apporter des connaissances sur des objets esthétiques, tout en produisant lui-même des figurations diagrammatiques formellement intéressantes. Mes propres rencontres avec les recherches empiriques sur l’expérience esthétique des images datent du milieu des années 2000, à l’Université Libre de Berlin, où on avait développé un vaste programme de recherche sur les émotions1, dans le cadre duquel on a par exemple mené des expériences à l’aide des logiciels permettant de réaliser des analyses de films, tout en développant une représentation statistique de l’objet en question (comme on le verra, avec des points de saccade). Quelques années plus tard, j’ai assisté à Paris à une conférence de Raphael Rosenberg, historien de l’art à l’Université de Vienne, qui dirige avec un collègue psychologue un laboratoire oculométrique, dont je vais m’inspirer principalement pour émettre quelques hypothèses et remarques concernant l’application de cet outil à l’expérience esthétique des images en mouvement. L’idée de base de l’équipe de Rosenberg est que, en histoire de l’art, on suppose des points communs spécifiques à certains groupes, dus aux qualités des observateurs, partagés sur le plan géographique, historique ou social. Grâce à l’oculométrie, les chercheurs ont analysé des différences culturelles dans la perception des œuvres d’art, entre des japonais·es et autrichien·nes. Leur hypothèse implique la prévision de l’effet de la socialisation visuelle spécifique des probants quand ceux-ci regardent un tableau. Selon les documents publiés sur le site de ce programme de recherche, l’étude a d’abord eu lieu en laboratoire, puis, dans un second temps, au musée, dans le contexte original des œuvres, grâce à une collaboration avec le Kunsthistorisches Museum2. L’équipe autour de Rosenberg a développé un logiciel spécifique, nommé « Eye-Trace », avec lequel elle mesure surtout, en sus des paramètres oculométriques habituels (soit durée de fixation, longueur de saccades et Heat Maps), les structures des sautes de regard répétées, pour prouver une corrélation entre le mouvement des yeux et la composition de l’œuvre d’art. Par ailleurs, le même chercheur mène un projet sur la temporalité du regard, également inspiré par une approche issue des sciences cognitives, supposant qu’une extension temporelle, expérience prolongée d’une expérience perceptive d’une durée « agréable », serait un indicateur constitutif pour différencier l’expérience esthétique et l’expérience visuelle commune. Il est évident que si ce type d’hypothèse peut s’appliquer à des tableaux classiques, il ne peut pas valoir pour des œuvres d’art conceptuels ou minimalistes, et encore moins pour l’objet-film, structurant par sa nature même la temporalité du regard.
Pour tout chercheur en cinéma désireux d’appliquer ces méthodes dans son champ, la question qui se pose face aux études de Raphael Rosenberg est la suivante : comment l’oculométrie peut-elle nous renseigner sur la spécificité culturelle d’un spectateur de cinéma ? Ou encore : que nous dit l’oculométrie sur la composition et le rythme des plans ? N’étant pas experte de ces outils et instruments et ne m’appuyant que sur quelques séries de mesures oculométriques, faites à ma demande, je ne peux répondre à la première de ces questions : je ne dispose ni de l’expérience ni du corpus ni des moyens pour pouvoir le faire. Mais je vais tenter d’avancer des hypothèses portant sur la corrélation entre la composition des plans et les mesures oculométriques, à partir des expériences faites dans le cadre du projet de Nathalie Delbard et Dork Zabunyan : par exemple, voir comment établir un rapport entre ce qu’on peut appeler, en termes esthétiques, du rythme, et des mouvements oculaires de fixation.
Une difficulté première tient au fait que les mesures ne concernent pas la vision des images fixes, mais des moments prélevés sur des images habitées par un triple mouvement : interne aux plans (mouvements des objets et personnages), au niveau du cadrage (mouvement de caméra) et entre les plans (mouvement du montage). Ayant posé ces prémisses et les difficultés qui en découlent, je vais tenter maintenant de décrire simplement mes observations, à partir des expériences en laboratoire pratiquées selon mes choix.
Pour saisir ce que l’oculométrie peut nous révéler sur la spécificité de l’expérience cinématographique, j’avais choisi deux exemples particulièrement denses en termes de mouvement et de montage. Mon interrogation portait sur la corrélation entre le rythme du film, la composition plastique des plans et les mouvements oculaires. En elle-même, la définition du rythme est déjà une question complexe, difficile à poser en termes scientifiques, car elle ne peut se résumer à la durée des plans. J’ai néanmoins essayé d’évaluer cette question en fonction de la spécificité d’un genre ou d’un type de film, en prenant en compte les mouvements de fixation, de poursuite lente ou encore les mouvements saccadiques3.
Premier exemple : Amores Perros et la question du point de vue
Amores Perros (Amours chiennes) d’Alejandro González Iñárritu est un film mexicain (2000)4. Il déploie une forme de récit dite « film choral », c’est-à-dire un mode d’énonciation qui ne dépend pas d’un personnage principal, mais de plusieurs personnages, impliquant ainsi des lignes narratives parallèles. Ce type de film américain, dans lequel certains voient un genre, se caractérise donc par un nombre relativement important de personnages qui s’entrecroisent, sans qu’aucun d’eux ne semble plus important que l’autre5.
Pour mieux situer la scène analysée, précisons que le film fait converger autour d’un accident de la circulation dans Mexico City. Les destinées des trois héros sont ainsi fatalement mises en relation : Octavio, un jeune homme sans vergogne, Valéria, un mannequin connu, et El Chivo (« Le Cabri »), un ancien militant politique devenu clochard. Chacune de ces vies implique une relation amoureuse ou affective complexe. Dans Amores Perros, les figures et « amours » des chiens correspondent aux vies mouvementées de personnages.
La scène de l’accident reviendra trois fois, ouvrant chaque fois un des trois épisodes du film. Quand il y a reprise, la scène ne sera jamais répétée à l’identique. La première occurrence de l’accident survient au début du film, mais j’ai choisi, à cause de son rythme singulier, la troisième occurrence, centrée sur le personnage El Chivo. On y voit comment le vieux clochard El Chivo, entouré par des chiens, assiste à l’accident de manière furtive, mais cependant active. Sa double marginalité, sur le plan social comme sur le plan de l’action, lui ouvre des points de vue spécifiques et une opportunité pour dérober de l’argent à la faveur de la confusion du moment.
Tout en m’intéressant à la mise en scène dans ce film de fiction contemporain, j’ai choisi cette troisième scène de l’accident parce qu’elle est montée d’une manière plus ou moins classique, de façon relativement rapide. Son rythme et sa logique narrative s’organisent autour du point de vue d’El Chivo. Le but était d’analyser la fonction du regard chez le témoin d’un accident de voiture, devenant à son tour le personnage principal de l’épisode, ceci afin d’intégrer dans l’analyse une spéculation portant sur le regard du spectateur, grâce aux mesures oculométriques.
Soulignons d’abord que le sujet testé ne se trouve pas dans la même situation que le spectateur « idéal » de cinéma voyant cette séquence dans l’ordre du récit. Celui-ci aura déjà vu deux fois des variantes de cette scène-pivot et s’intéressera donc davantage à la différenciation du regard et à la focalisation relative sur le troisième personnage. Dans ce contexte, le point de vue constitue une sorte de code herméneutique : suivant la logique du récit, on assiste ici à un moment où le spectateur connaît les histoires des deux personnages impliqués dans l’accident (Octavio et Valéria) et découvre celle du troisième (El Chivo).
Si je me suis d’abord intéressée au plan dit subjectif, également appelé « point de vue », montrant successivement le personnage qui regarde et l’objet regardé, il faut préciser ce que cela implique. La question de la figuration du point de vue a été théorisée par beaucoup de chercheurs, et en relation avec des films assez différents. David Bordwell a montré comment cette configuration a traversé l’histoire du cinéma, de Griffith et Lubitsch à Hitchcock6. Edward Branigan, un chercheur proche de Bordwell, devenu partisan des approches cognitivistes, a ainsi établi une taxinomie des figures de montages produisant, au sein du cinéma classique, des plans subjectifs ou des points de vue7. Branigan souligne à quel point un cinéaste peut manipuler ou varier la création d’une construction narrative fondée sur le point de vue ou « POV ».
S’il s’agit ici de repérer des stratégies de construction d’attention du spectateur, relayées par le regard, il ne faut pourtant pas confondre les questions narratologiques de la construction du point de vue au cinéma ou encore la notion de focalisation narrative avec les débats sur l’empathie, la variabilité de l’attention et l’expérience esthétique au cinéma8. La participation empathique peut se réaliser indépendamment du contenu visuel des plans ou des points de vue d’un personnage. Ainsi, Richard Allen montre-t-il dans son livre sur l’illusion cinématographique, à quel point, même dans la vie réelle, le spectateur peut imaginer, de manière empathique, le point de vue d’un Autre sans forcément le voir, et indépendamment de sa propre perspective de perception réelle9. C’est plutôt un autre aspect de l’empathie, un mode non-narratif, dépassant la pure représentation de l’action, qui m’intéresse ici : une sorte d’empathie haptique liée aux gestes et à un certain type de vision ou d’apparition et non pas forcément à un point de vue au sens strict du terme ou à l’identification avec un personnage.
Si on prend la scène que j’ai fait examiner, on constate d’abord qu’il s’agit ici d’un régime de montage plutôt classique, mais très accéléré et rythmé. Aucun monologue ne permet d’attribuer un point de vue interne10 au clochard. En revanche, des continuités sont mises en place par ce qu’on appelle eye line matches11 ou points de vue, et donc une sorte de focalisation externe, si on veut décrire la scène en termes narratologiques. On peut en outre repérer des moments que les théoriciens cités appellent perception shots (ou plans de perception), et qu’on peut attribuer, par leur statut (de fixité, de durée par exemple) et par leur composition, en tout cas en partie, au personnage du El Chivo. Mais ce n’est pas forcément l’aspect le plus intéressant. J’ai plutôt été sollicitée ici par le fait de mieux comprendre, par les mesures oculométriques, la fonction de certains plans que j’appellerais « conducteurs » : le mannequin blessé criant derrière la vitre ou le plan rapproché du clochard en plan fixe, le jeune homme ensanglanté et secouru, montré en plan subjectif, ou encore les plans rapprochés du clochard, puis les plans énigmatiques qu’on pourrait appeler « figuraux »12 du chien blessé. Je voulais savoir si ces plans se distinguent, au niveau des saccades et du suivi, des autres plans (montrant par exemple la foule ou les gestes des pompiers). Un élément auquel je me suis aussi intéressée était de voir si un même cadrage, repris, change au fil de la séquence de niveau de perception.
Avant de procéder à mon commentaire des mesures oculométriques, je précise que je ne rejoins pas les théories avancées par certains cognitivistes s’appuyant sur un savoir scientifique pour expliquer la perception des films. De manière générale, les théoriciens cognitivistes supposent qu’un spectateur change de toute façon de niveaux d’attention et focalise au fur et à mesure, ce qui est fort probable. L’immersion dans la fiction ne serait pas de la même intensité tout au long de la vision du film et le spectateur glisserait entre des moments de participation fictionnelle, de participation esthétique et des moments soi-disant « réflexifs »13. La participation littéraire, selon des études empiriques, serait de la même manière épisodique14. Sans rentrer dans le détail de cette distinction entre attention « fictionnelle » et « esthétique », telle qu’elle est par exemple proposée par Torben Kragh Grodal15, j’ajoute simplement qu’elle est en soi discutable et semble présenter une mise à plat du vieux problème brechtien de la distanciation. L’articulation entre attention, perception et imagination devrait être comprise d’une manière nuancée, comme une affaire de degrés et non pas selon un schéma exclusif.
La séquence choisie présente un genre bien établi de juxtaposition de plans montrant un accident routier. Des effets de soustraction fonctionnent comme une sorte de focalisation, parce qu’on a déjà vu l’accident deux fois, lié chaque fois à un personnage différent. Si le spectateur de cinéma, contrairement au probant de l’expérience oculométrique, voit la scène pour la troisième fois et décode certaines constellations narratives, il la regarde différemment. Il aura vu la première séquence en montage alterné, focalisé sur la femme ; puis, au bout de 50 minutes, à partir d’un combat de chiens, une poursuite entre jeunes qui se termine par l’accident ; puis la séquence que j’ai choisie, impliquant le clochard et son point de vue. La pratique de la reprise sous une forme différenciée vise aussi à montrer qu’on ne voit jamais deux fois le même film. Ajoutons à cela que le cinéma est un médium et un art tributaire du temps : le temps comme expérience (concernant la durée de la représentation) et comme époque (concernant le contexte historique ou social de la vision). Ainsi, si on veut étudier les réactions d’un probant, il faudrait aussi connaître sa culture du cinéma. Ce ne fut pas mon cas. Je vais donc essayer de commenter brièvement les résultats oculométriques, sans connaître ces paramètres.
Figures 1 à 5
Images d’Amores Perros avec les mesures oculométriques.
Devant les résultats des mesures oculométriques de la séquence de Amores Perros, j’ai pu faire deux observations qui m’ont semblé remarquables. On peut voir d’une part que les mouvements saccadiques les plus forts ont lieu au moment où le personnage principal de cette scène, le clochard, ouvre une voiture accidentée. C’est là un moment où le spectateur ne sait pas encore très bien ce qui se passe et où on voit le clochard de dos, pénétrant à l’intérieur de la voiture pour prendre l’argent d’une des victimes. Le son accentue la confusion et l’excitation. D’autre part, le spectateur est saisi dans une logique de montage qui ne lui laisse plus beaucoup de liberté. Les plans sont très courts et les regards restent fixés sur les corps en action. Des moments d’intensification se constituent à travers les plans « conducteurs », par exemple la femme criant au secours derrière la vitre. Le regard du sujet testé suit exactement la trajectoire dessinée par la mise en scène et le montage : ainsi, le panoramique en caméra portée est fidèlement tracé par les modèles graphiques des statistiques. Il s’agit donc d’une sorte de logique intensifiée du cinéma d’action, avec des moments de saccades à l’intérieur des plans dotés d’une dimension plus haptique, affichant de l’affect. Cet effet déplace l’attention, de la construction matérielle des corps dans le temps et l’espace, et du figuratif qui renvoie à la représentation (et donc à la narration), vers ce qu’on a appelé le figural16 : quelque chose de non assimilable à la représentation, la dépassant. Si on peut toucher, dans ce contexte, à ce qui se dessine sur le plan de la matérialité corporelle transmise par la forme sensible, le figural, ici, surgit littéralement comme une sorte de tâche, liée à la figuration du sang des corps accidentés, sous forme d’image frappante. Cette apparition du figural ne correspond donc pas à un moment de contemplation ou de fixation, à ce que Roland Barthes a pu nommer le punctum. Elle surgit dans et par le mouvement.
Deuxième exemple : un film dit d’avant-garde, problèmes de défiguration
Je vais, comme deuxième exemple, envisager un tout autre type de cinéma qu’on peut nommer, avec Jean-François Lyotard, « a-cinéma ». De nouvelles configurations se situant au sein de la pratique du found footage ont tendance à mener vers des questions de dispositifs d’affects, que Jean-François Lyotard avait nommé « pulsionnels ». Cela implique de mesurer l’écart, la défiguration, la déformation, le trouble plutôt que la plénitude d’un plan, sa figuration ou sa forme. Je me limite à ne convoquer qu’un exemple provenant du cinéma d’avant-garde ou expérimental, entretenant une relation plus ou moins explicite tant avec le cinéma des premiers temps qu’avec le cinéma classique. Partant d’une œuvre de Peter Tscherkassky, j’ai essayé de cerner la complexité de leurs re-configurations, qui, me semble‑t‑il, pointent de manière relativement explicite le problème de l’analyse, dans la mesure où il s’agit d’un type de cinéma qui tend à échapper à la nomination, à l’identification des figures et au reconnaissable, tout en affichant des effets de répétition et de retour.
Ainsi, mon intention était de problématiser de manière encore plus radicale la mesure du « regard sur le regard », le premier étant réel et empirique – oculométrique –, le second imaginaire et figuré – cinématographique –, en m’intéressant à un film d’avant-garde. Ce film de found footage propose, par sa technique même, le remploi d’un film post-classique. Je l’ai déjà commenté dans un autre contexte, d’un point de vue purement esthétique17 ; l’analyse présente s’inspire largement de ce travail en essayant de le lier avec les résultats des mesures des mouvements oculaires.
S’il y a reprise dans les films de Peter Tscherkassky, le critère de la création artistique n’est pas la similitude iconique avec l’« original », mais au contraire la forme de la transposition et de la recombinaison. Ce processus de transformation et de mélange peut se décrire par le terme de « ressemblance déformée », que Sigrid Weigel dégage dans son étude sur l’influence freudienne chez Benjamin, comme le principe d’une pensée en images analogue aux mécanismes du rêve18. La forme radicale et complexe de la déformation chez Tscherkassky peut à son tour être pensée à l’aide de l’idée benjaminienne d’espaces d’images corrélatifs et opposés, entre reproduction et imagination, où la décomposition comme « suite infinie de transitions19 », comme apparition intermittente, vient recouvrir et dissoudre la composition originale.
Le film de Peter Tscherkassky, L’Arrivée (1999), retravaille en noir et blanc un court extrait du mélodrame Mayerling (1968) de Terence Young, en se concentrant sur une scène de chemin de fer. L’« arrivée » chez Tscherkassky se révèle incertaine. Comme si l’image cherchait sa place dans la surface de projection de l’écran, elle entre d’abord par la droite dans le champ vide, elle hésite, se réfléchit, se dédouble, brouille ses limites, avant de trouver enfin sa place et de laisser l’événement – l’arrivée du train – se déployer dans l’espace de représentation. La pellicule perforée apparaît à cet endroit comme le support visible de l’image, qui subit le même sort que les wagons, les bâtiments et les personnes, précipités pêle‑mêle les uns contre les autres sous le choc de l’accident20.
Après avoir défait toutes les coutures, laissé le champ déborder du cadre, attaqué la perforation et l’émulsion jusqu’à déformer totalement le support dans une vertigineuse pulsation de diagonales, le cinéaste laisse un train s’échapper de ces flots catastrophiques et de ce train descendre une dame. D’un point de vue mythologique, il ne s’agit naturellement pas, dans la citation iconographique de Lumière par Terence Hill reprise par Tscherkassky, d’une descendante de Madame Lumière, mais – nous sommes dans un film de fiction postclassique – d’une star féminine : Catherine Deneuve. Et là où le film Lumière disposait encore deux points de fuite ou deux événements dans le champ visuel, le film narratif classique n’organise plus l’image qu’autour d’un centre unique : à l’apparition stupéfiante s’est substituée l’attente d’une star, le gros plan ne cadre plus la locomotive, comme au début du xxe siècle, c’est le visage féminin qui est devenu image.
Si L’Arrivée, pastiche des frères Lumière passé au filtre d’un film de fiction, a été fabriqué en cinémascope, ce n’est nullement pour conférer une nouvelle sublimité au modèle historique. La fidélité à ce format basé sur la compression anamorphique témoigne d’une historicité qui ne tient pas seulement aux qualités formelles du matériau d’origine, mais aussi au lien entre le dispositif filmique et la matérialité, qui demande à être traité différemment aujourd’hui, après la révolution numérique. Voir ce film en laboratoire, devant un écran numérique relativement petit, présuppose donc une expérience bien différente. Le dispositif de mesure place le sujet testé devant un écran qui ne dépasse pas la taille d’un écran de télévision et dans une salle éclairée, ce qui crée une expérience très différente de celle du cinéma, avec sa salle obscure et les dimensions ici prévues pour le CinémaScope.
Figures 6 à 8
Images de L’Arrivée avec les mesures oculométriques.
Devant la série des mesures oculométriques effectuées face à ce film, deux choses frappent à la première vue. D’abord un centrement relativement constant du regard, malgré les « événements » plastiques et la densité de la composition. Même au début, quand il n’y a pas grand chose à voir au centre et que l’image, en tant qu’événement, rentre par les bords, le regard demeure centré. Dans ce cas, il faudrait peut-être tenir compte du fait que le probant n’a pas vu le film original projeté dans une salle obscure, sur pellicule et en cinémascope. Dans une salle de cinéma, il le regarderait forcément autrement, tout comme le fait le probant de Raphael Rosenberg qui va voir les tableaux au musée.
Le second point frappant est le fait qu’on peut observer des mouvements de saccade sitôt que l’image d’origine relativement « classique » est repérable, c’est-à-dire aux moments dans lesquels domine une composition stable et centrée. Par exemple, le film de Tscherkassky épouse plus ou moins la représentation conventionnelle du film d’origine de Young, quand le train rentre en gare : à ce moment-là, l’œil va osciller entre le train et le quai afin de parcourir les composantes d’une vision perspectiviste. Quand Catherine Deneuve sort du train, l’œil va suivre son mouvement.
Par ailleurs, on peut constater un nombre étonnant de mouvements de fixation, malgré – ou à cause de ? – la grande complexité plastique et le grand nombre de mouvements dans l’image. Dans le même esprit, on peut également s’étonner du fait que les mesures relèvent peu de mouvements lisses. Mais pour pouvoir émettre des interprétations même spéculatives, on devrait savoir si le probant a l’habitude de voir des films expérimentaux ou d’avant-garde. On devrait aussi savoir sur quel écran il a vu le film et dans quelles conditions.
Conclusion
Pour conclure de manière succincte sur les mesures oculométriques confrontées à la vision d’un film dit « expérimental », soulignons trois points. D’abord, celles-ci ne permettent assurément pas de faire la distinction recherchée par les cognitivistes sur les degrés d’attention pour distinguer entre expérience de fiction, expérience esthétique ou encore moments de réflexivité. Cela n’a pour le cinéma d’avant-garde que peu d’intérêt (malgré les tentatives, par James Peterson par exemple, d’analyser des films de Bruce Conner selon des critères cognitivistes qui permettraient d’isoler des logiques formelles). Ensuite, les mesures oculométriques ne permettent probablement pas une investigation portant sur les spécificités culturelles des probants, à cause de la singularité formelles des films. Elles peuvent éventuellement relever les réactions de l’œil devant l’excès d’une image décomposée, délestée de coordonnées spatiales et saturée de mouvement : un œil paradoxalement saisi, fixé, par l’acinéma lyotardien.
D’une manière générale, je verrais dans ce type de lien, entre sciences et esthétique, une parenté, d’un côté avec les approches gestaltistes sur la perception (depuis Rudolf Arnheim) ou encore le champ de la psychologie expérimentale (depuis Wilhelm Wundt et Hugo Münsterberg), et de l’autre avec des approches sociologiques des dispositifs artistiques, telles qu’elles ont été proposées par Pierre Francastel et Michael Baxandall. Mais on peut aussi y voir à l’œuvre l’intérêt pour un renouvèlement des études des formes et de l’analyse esthétique, telle qu’elle a été pratiquée depuis Heinrich Wölfflin.
Si on veut étudier le cinéma, ou plutôt l’expérience d’un film, en appliquant les méthodes de Rosenberg, on rencontre donc une série de problèmes, dus à la différence entre cinéma et peinture. Premièrement, le spectateur d’un film ne peut pas choisir la durée de la perception d’un plan, elle est par définition limitée et s’inscrit dans une logique préfigurée de montage. Deuxièmement, il ne s’agit que rarement d’une image fixe, mais d’une image en mouvement, recadrée, ou impliquant des mouvements d’objets et de figures dans le plan. Ainsi peut-on décrire le problème de l’analyse oculométrique de l’objet film avec les approches phénoménologiques des années 1950 : comme Albert Michotte l’établit dans sa théorie du spectateur, les changements de décor se produisent dans la vie naturelle autrement qu’au cinéma, où la perception est marquée par des changements de plans et des « apparitions » soudaines. La forme dominante de la perspective subjective dans la réalité correspond à ce que Michotte appelle l’« effet-écran21 », c’est-à-dire le recouvrement ou le dévoilement progressif des objets22. Au cinéma, en revanche, nous sommes confrontés à des changements de plans et à de soudaines variations dans l’intensité de l’éclairage : l’image apparaît et disparaît tout à coup dans sa totalité, elle ne se trouve pas simplement « découverte23 ». Il faudrait pouvoir rendre compte, en ce sens, du dispositif de la vision d’un film, exposé dans une situation de laboratoire. Et surtout, il faudrait pouvoir tenir compte du fait que le cinéma est un art d’apparitions et de disparitions.