1. Introduction
Les textes scientifiques, qu’il s’agisse d’articles de revue, de mémoires ou de thèses, recourent à une grande diversité de lexiques préfabriqués (Wray, 2002 ; Tutin, 2018), parmi lesquels on peut distinguer des connecteurs (dans un premier temps, en d’autres termes), des collocations lexicales (jouer un rôle, présent article) ou des locutions (point de vue, mettre en lumière). On y observe aussi des phrases stéréotypées à fonction discursive ou rhétorique (nous avons vu que…, nous l’avons vu, comme on l’a vu pour le rappel d’un élément déjà mentionné), relevant de ce que Tutin et Kraif (2016), puis Ji (2022), appellent des « routines sémantico-rhétoriques »1. Il s’agit des séquences, récurrentes dans un genre spécifique et sémantiquement prédictibles, qui autorisent des variations à la fois syntagmatiques et paradigmatiques sur le plan énonciatif. Représentant des façons de dire spécifiques, ces expressions servent non seulement à assurer la fluidité du discours, mais également à construire l’identité discursive de l’auteur au sein de sa communauté scientifique, à travers l’emploi d’un langage codé. Elles contribuent ainsi, par leur fréquence, à caractériser le genre scientifique écrit, en mettant en avant ses spécificités structurelles, rhétoriques, énonciatives ou interactionnelles2.
Les premières études sur les routines sémantico-rhétoriques se sont plutôt concentrées sur les écrits scientifiques (Tutin, 2018 ; Wang, 2022 ; Ji, 2022), particulièrement pour l’application didactique de l’écrit universitaire (Yan, Tutin & Tran, 2018). Toutefois, cette routinisation se manifeste également dans l’oral scientifique, où l’on observe des routines exprimant un ensemble de fonctions discursives et rhétoriques comme l’annonce de l’objectif de la présentation (nous allons vous présenter ...), l’appui sur des savoirs partagés (on sait que …) ou le rappel (comme je vous l’ai dit …). Par ailleurs, au-delà de ces constructions phrastiques, qui peuvent être réalisées de plusieurs façons sur le plan lexical, on peut aussi identifier un autre type d’énoncé polylexical, si vous voulez, dont le figement morphosyntaxique est plus marqué. Celui-ci se rapproche d’un « marqueur discursif propositionnel » (Andersen, 2007) ou bien d’une « phrase préfabriquée des interactions » au sens de Tutin (2019), fréquents dans la langue parlée, exprimant certaines fonctions dans le contexte d’interactions. Ce sont ces deux types de formules préconstruites qui nous intéressent en particulier, en raison de leur rôle discursif et interactionnel au sein du discours. Leur étude s’inscrit dans le cadre de la recherche de la phraséologie du discours scientifique oral.
Cet article a pour objectif de présenter une ressource phraséologique portant sur les formules de prise en compte de l’allocutaire dans l’oral scientifique (Lee, 2024), ainsi que de réfléchir à quelques pistes pour son application didactique. Dans une première partie, nous définirons les formules discursives et proposerons un bref état de l’art sur la phraséologie scientifique orale. Dans une seconde partie, nous présenterons notre corpus de discours scientifique oral en français, ainsi que la typologie fonctionnelle de formules que nous en avons dégagée. Enfin, certaines pistes seront étayées par l’examen d’outils numériques existant dans des thématiques voisines, parmi lesquelles nous explorerons particulièrement la simplification des étiquettes de formules.
2. Phraséologie et discours scientifiques écrits et oraux
2.1. Formules discursives : des marqueurs discursifs aux routines discursives
Afin de mener une étude phraséologique dans un contexte marqué par un foisonnement de terminologies et de notions émergentes (Legallois & Tutin, 2013, pp. 3-4), il est essentiel de choisir un objet adapté aux questions de recherche et d’en définir les contours. Ayant pour objectif de mettre en lumière les routines linguistiques propres à l’oral scientifique en français, faits linguistiques relativement moins explorés que leurs équivalents écrits (Jacques & Tutin, 2018 ; Luodonpää-Manni, Grossmann & Tutin, 2022), nous proposons d’étudier une catégorie que nous désignons par les « formules discursives »3 (Lee, 2024). Cette catégorie regroupe deux types de constructions polylexicales, hétérogènes en termes de degré de préfabrication, mais qui ont pour point commun de remplir certaines fonctions discursives, rhétoriques et/ou pragmatiques dans le contexte. Précisons que notre étude se limite aux routines intégrant un prédicat de sens plein (par ex. dire, vouloir, savoir) qui nous paraît jouer un rôle essentiel dans l’actualisation de leur valeur, en excluant la copule être et la locution il y a.
|
Formules discursives |
Définition |
Exemples |
|
Type 1 |
Suites de mots complètes et peu variables sur le plan morpho-syntaxique, très souvent parenthétiques, qui peuvent apparaître dans un grand nombre de genres oraux avec certaines fonctions |
on va dire, si vous voulez, vous savez, vous voyez, … |
|
Type 2 |
Patrons lexico-sémantico-syntaxiques, qui intègrent à la fois des éléments fixes et variables sur le plan paradigmatique, ainsi que des éléments obligatoires et/ou facultatifs sur le plan syntagmatique, qui permettent différentes réalisations sur le plan énonciatif, et qui remplissent certaines fonctions caractérisant un genre spécifique |
[(comme) + Sujet locuteur de référence + (le|en) + Prédicat de communication + (de|sur) + (Syntagme nominal|complétive que) + (Marqueur temporel)] : on en a parlé ce matin, comme le disait la présentatrice précédente, … |
Tableau 1. Définition et exemples des deux types de la catégorie de formules discursives
Le premier type se rapproche de la notion de marqueurs discursifs propositionnels d’Andersen (2007) : il est généralement invariable et apparaît dans une position parenthétique. Si ce type de formules peut aussi être observé dans d’autres contextes d’interactions orales, les fonctions du type 2, plus souples du point de vue du figement, sont, quant à elles, étroitement liées aux enjeux discursifs ou rhétoriques du genre scientifique, tels que le guidage du lecteur (Ji, 2022). Ce second type se rapproche ainsi de la notion de routines sémantico-rhétoriques (Section 1), qui a été principalement explorée à l’aide de l’extraction automatique des Arbres Lexico-syntaxiques Récurrents4 (Tutin & Kraif, 2016), dans le cadre de l’analyse phraséologique des genres scientifiques écrits. Tout comme les routines, ce type de formules comporte certains éléments facultatifs (par ex. le subordonnant comme, le marqueur temporel), et des éléments susceptibles de varier selon le contexte énonciatif : par exemple, un prédicat de communication comme dire et parler, ou encore l’élément correspondant au locuteur de référence (on / la présentatrice de référence) (voir les exemples dans le Tableau 1). Nous pensons qu’étudier ces deux types de constructions nous permet une description riche et complète de la phraséologie pragmatique de l’oral scientifique.
Un autre critère définitoire des formules discursives réside dans leur récurrence significative au sein d’un corpus. Ce critère d’ordre quantitatif a déjà été retenu pour la définition d’autres phraséologismes, tels que les motifs (Longrée & Mellet, 2013), les routines (Ji, 2022), ou bien les « lexical bundles » en anglais (Biber & Barbieri, 2007). L’interprétation de la significativité de la fréquence peut toutefois varier d’une étude à l’autre. Dans notre cas, bien que le corpus mobilisé soit de taille modeste (Section 3.1), nous avons retenu un seuil de fréquence de 3 occurrences pour l’ensemble du corpus. Ce choix repose sur le fait que les patrons de routines présentent souvent une certaine longueur, composée d’au moins trois éléments lexicaux5.
2.2. Discours scientifique et genre de la communication scientifique orale
L’objectif principal d’un discours scientifique6 est de communiquer les savoirs acquis au cours de la recherche, en respectant les procédures préétablies par la « communauté discursive » (Swales, 1990) de chaque discipline. Relevant des langues de spécialité, la langue du discours scientifique a déjà fait l’objet de nombreux travaux en linguistique française, sous différents angles (Kocourek, 1991 ; Fløttum, Dahl & Kinn, 2006 ; Hatier, 2016 ; Jacques, 2017, entre autres). Plus particulièrement, la plupart des études lexicographiques se sont d’abord intéressées aux genres écrits. L’attention portée à la dimension lexicographique de l’oral est plutôt récente, même dans le domaine de l’English for Academic Purposes (EAP), où l’oral a suscité l’intérêt des chercheurs plus tôt qu’en contexte francophone, notamment pour les genres pédagogiques tels que les cours magistraux ou les travaux dirigés (Dang, Coxhead & Webb, 2017 ; Li, Xu & Zhang, 2024). En ce qui concerne le Français sur Objectifs Universitaires, la facette orale du discours scientifique que les étudiants doivent maîtriser reste aussi encore peu explorée, à l’exception d’une étude récente de Tran, Masset-Martin et Mangiante (2023).
Le genre des communications scientifiques orales peut être considéré comme représentatif de l’oral scientifique, dans la mesure où il constitue l’un des principaux moyens par lesquels un chercheur présente régulièrement son travail (Carter-Thomas & Jacques, 2017), au même titre que l’article dans la modalité écrite. Ce genre se distingue par plusieurs traits discursifs, parmi lesquels une production du discours organisée, mais généralement spontanée (Jacques, 2017), une interactivité immédiate entre le locuteur et l’allocutaire (Rinck, Fløttum & Poudat, 2017), et une communication à dominante multimodale, entre autres. On peut donc supposer que ces caractéristiques ont un effet plus ou moins important sur la manière dont le locuteur construit son discours à l’oral et sur les expressions déjà toutes faites qu’il utilise, contrairement à l’écrit. Par exemple, certaines routines syntaxiques sont propres à l’oral, quasi absentes à l’écrit, telles que les pseudo-clivées ce qui/que - P c’est X, les structures en il y a, et celles en si + pronom personnel (si on veut être précis), d’après Carter-Thomas et Jacques (2022). La prédominance de celles-ci est, selon les autrices, liée à la nécessité de hiérarchiser de nombreuses informations ou de capter l’attention de l’auditoire à l’oral. Siepmann (2023) a souligné, quant à lui, la variété de fonctions méta-discursives qu’un même verbe remplit à l’oral : par ex. le verbe dire pour le rappel (ce qui a été dit), pour l’appui sur des connaissances conventionnelles (on a souvent dit que…) ou pour la reformulation (on va dire).
3. Élaboration d’une ressource phraséologique de l’oral scientifique en français
3.1. Le CComSciO, corpus de discours scientifique oral en français
Parmi les corpus oraux en français, les genres académiques ou scientifiques sont relativement rares, hormis quelques corpus comme le corpus ESLO (Baude & Dugua, 2016), qui intègre un module des conférences universitaires, ou le corpus issu du projet EIIDA7 (Carter-Thomas & Jacques, 2017). Ce dernier inclut des présentations scientifiques orales de format standard (en moyenne 27 minutes), collectées selon des langues et des disciplines dans une perspective de mise en évidence des particularités discursives propres à chaque langue et discipline, que nous considérons comme relevant du genre des communications scientifiques orales. Une partie de ces données - 15 communications en langue française en linguistique - a été intégrée à notre corpus, dans une démarche de constitution d’un corpus équilibré par disciplines8.
Notre corpus d’étude, le CComSciO (Corpus de Communications Scientifiques Orales), réunit 60 communications dans trois disciplines des sciences humaines et sociales (SHS), que sont la linguistique, les sciences de l’information et de la communication, ainsi que la didactique des langues. Nous nous intéressons ici particulièrement à la phraséologie du discours scientifique en SHS, à l’instar d’autres travaux (Yan, 2017 ; Jacques & Tutin, 2018 ; Ji, 2022), en supposant que les discours scientifiques dans ce domaine se distinguent de ceux en sciences dites dures (Jacques, 2017), y compris à l’oral. Chaque discipline comprend 20 présentations, issues de différents colloques ou journées d’études, d’une durée de 15 à 42 minutes, ce qui représente un corpus total d’environ 26 heures, soit 262 824 mots9.
Pour l’élaboration du CComSciO, nous avons adopté la transcription orthographique standard, proposé par le groupe VALIBEL (Bachy, Dister, Francard, Geron, Giroul, Hambye, Simon & Wilmet, 2007), puis la segmentation par les constructions verbales, suivant le guide du corpus Gold d’ORFEO, rédigé par A. Valli et J. Deulofeu. Intégré au logiciel ELAN avec un alignement entre le son et le texte10, le CComSciO est consultable à l’heure actuelle sur le Lexicoscope 2.0 (Kraif & Diwersy, 2012), outil d’exploration de corpus numérique11. Sa diffusion sur d’autres plateformes numériques comme ORTOLANG est aussi en préparation pour le rendre accessible à l’ensemble de la communauté scientifique.
3.2. Typologie des formules de prise en compte de l’allocutaire à l’oral scientifique
L’étude de la phraséologie du genre scientifique ou académique dans une approche didactique vise généralement à établir une typologie fonctionnelle pour les expressions à maîtriser. Parmi plusieurs typologies déjà élaborées, deux ont particulièrement nourri notre réflexion pour la classification des formules de prise en compte de l’allocutaire à l’oral : celle du métadiscours académique écrit et oral d’Ädel (2010) en anglais, et celle des routines de guidage du lecteur, développée par Ji (2022) à propos des articles en français. Dans son modèle, Ädel (2010) a souligné des fonctions spécifiques à l’oral telles que la gestion de la compréhension (You know what I mean? ‘Vous voyez ce que je veux dire’) et de la discipline de l’auditoire (Can I get your attention please? ‘Puis-je avoir votre attention’), qui relève d’une prise en compte explicite de la présence de ce dernier lors de la production orale. Ji (2022), quant à elle, a proposé une typologie fonctionnelle des routines, fondée sur le corpus TermITH-Transdisciplinaire (Hatier, Augustyn, Yan, Tran, Tutin & Jacques, 2016), en combinant les modèles d’Hyland (2005) et d’Ädel (2006). Dans cette typologie, le guidage du lecteur a été considéré comme un moyen essentiel d’assurer une lecture efficace et exacte du contenu et de la structure de l’article. Son modèle distingue trois dimensions : (a) structuration textuelle, (b) métalinguistique, et (c) topicalisation. Notre observable étant proche de celui de Ji (2022), nous avons adapté le cadre de sa typologie à la nôtre, tout en cherchant à élargir le concept de guidage du lecteur à celui de prise en compte de l’auditoire, pour mieux rendre compte des dynamiques interactionnelles inhérentes à l’oral scientifique.
La typologie des formules de prise en compte de l’allocutaire dans le CComSciO a été élaborée en plusieurs étapes. Après la constitution du corpus (Section 3.1), les formules candidates ont été repérées à la fois manuellement et à l’aide de requêtes dans l’outil AnaText, en partant des lemmes verbaux servant de pivot aux formules étudiées. Puis, l’annotation fonctionnelle a été faite en trois phases : (a) pré-annotation manuelle de l’ensemble des formules candidates, ce qui a donné lieu à une pré-typologie, (b) trois sessions d’annotation collaborative sur une partie du corpus pour affiner celle-ci, et (c) annotation finale de l’ensemble du corpus sur la base de notre typologie définitive. En parallèle, sur l’ensemble des formules candidates, nous avons identifié cinq propriétés linguistiques : (1) structure syntaxique, (2) lexique et (3) classe sémantique12 du prédicat, et (4) réalisation lexicale et (5) rôle énonciatif du sujet (locuteur, allocutaire, ou les deux, etc.). Les formules ont ensuite été regroupées manuellement selon leur fonction principale ainsi que leur patron lexico-sémantico-syntaxique, puis sélectionnées selon des critères de fréquence et de dispersion (pour 3 occurrences au total, au moins 1 sur chacune des trois disciplines).13
Dans cette typologie, nous proposons trois dimensions : (a) métalinguistique et méta-énonciative, (b) structuration discursive, et (c) interactionnelle. Chacune inclut plusieurs sous-catégories fonctionnelles ou fonctions spécifiques, pour un total de 23 fonctions avec 49 types de formules différents, comme le montre le tableau suivant. Parmi ces 49 types de formules, si la plupart correspondent à des patrons grammaticaux, deux constituent des formules figées, sans variations morphologiques et lexicales : on va dire et si vous voulez.
|
Dimensions |
Fonctions |
Exemples14 |
Nbre occ. |
|||||||
|
Métalinguistique et métaénonciative |
Reformulation |
ça veut dire que… |
26 |
|||||||
|
Réparation |
ça veut pas dire que… |
5 |
||||||||
|
Précision terminologique |
Dénomination |
N° 1 |
X qu’on a appelé Y |
69 |
79 |
|||||
|
N° 2 |
on appelle Y |
10 |
||||||||
|
Emprunt terminologique |
je reprends une expression à… |
14 |
||||||||
|
Choix terminologique |
j’utilise… |
11 |
||||||||
|
Approximation méta-énonciative |
N° 1 |
on va dire |
30 |
37 |
||||||
|
N° 2 |
… qu’on peut dire… |
7 |
||||||||
|
Sous-total |
172 |
|||||||||
|
Structuration discursive |
Introduction /Conclusion de la présentation |
Annonce du plan |
N° 1 |
dans un premier temps je vais montrer… |
52 |
68 |
||||
|
N° 2 |
on va commencer par… |
16 |
||||||||
|
Annonce de l’objectif/l’objet |
N° 1 |
je vais vous présenter… |
34 |
81 |
||||||
|
N° 2 |
nous cherchons à proposer… |
31 |
||||||||
|
N° 3 |
ce qu’on va vous présenter aujourd’hui |
16 |
||||||||
|
Clôture/conclusion |
je vais conclure |
30 |
||||||||
|
Renvoi discursif |
Renvoi interdiscursif |
Renvoi à la littérature |
N° 1 |
je cite |
17 |
31 |
||||
|
N° 2 |
je vous renvoie au… |
14 |
||||||||
|
Renvoi à d’autres communications |
N° 1 |
on en a parlé ce matin |
44* |
73 |
||||||
|
N° 2 |
ce que disait XXX en introduction |
10* |
||||||||
|
N° 3 |
ça a été dit tout à l’heure |
7 |
||||||||
|
N° 4 |
On en a entendu parler ce matin de… |
7 |
||||||||
|
N° 5 |
ce qu’on a vu… |
5 |
||||||||
|
Renvoi intradiscursif |
Rappel |
N° 1 |
comme je l’ai dit |
117 |
235 |
|||||
|
N° 2 |
… dont je vous parlais avant |
72 |
||||||||
|
N° 3 |
comme on a vu |
27 |
||||||||
|
N° 4 |
je rappelle que… |
10* |
||||||||
|
N° 5 |
… qu’on a vu précédemment |
9 |
||||||||
|
Anticipation |
N° 1 |
vous allez voir |
81 |
172 |
||||||
|
N° 2 |
je le dirai tout à l’heure |
42 |
||||||||
|
N° 3 |
j’y reviendrai |
35 |
||||||||
|
N° 4 |
… dont on va vous parler |
14 |
||||||||
|
Changement du cadre discursif |
Transition |
je vais aller à… |
42 |
|||||||
|
Reprise |
je vais revenir sur… |
10 |
||||||||
|
Passage de tour de parole |
je passerai la parole à… |
10 |
||||||||
|
Contextualisation discursive |
Limitation des thèmes abordés |
N° 1 |
je vais pas rentrer dans le détail |
54 |
83 |
|||||
|
N° 2 |
je passe là-dessus |
29 |
||||||||
|
Organisation du support de la présentation |
N° 1 |
je vous ai mis un exemple |
30 |
37 |
||||||
|
N° 2 |
le tableau que je vous ai mis ici |
7 |
||||||||
|
Sous-total |
872 |
|||||||||
|
Interactionnelle |
Mise en valeur |
N° 1 |
ce qui nous intéresse c’est que… |
29 |
65 |
|||||
|
N° 2 |
je rappelle… |
17 |
||||||||
|
N° 3 |
ce qu’on voit c’est… |
16 |
||||||||
|
N° 4 |
… sur lequel j’insiste |
3 |
||||||||
|
Co-constat |
N° 1 |
vous le voyez ici |
369 |
384 |
||||||
|
N° 2 |
… que vous avez sous les yeux |
15 |
||||||||
|
Appui sur des connaissances partagées |
N° 1 |
vous savez que… |
67 |
92 |
||||||
|
N° 2 |
… que vous connaissez |
25 |
||||||||
|
Engagement méta-énonciatif de l’allocutaire |
N° 1 |
si vous voulez |
40 |
48 |
||||||
|
N° 2 |
vous allez me dire |
8 |
||||||||
|
Gestion de la compréhension de l’allocutaire |
N° 1 |
vous voyez (…) |
37 |
52 |
||||||
|
N° 2 |
vous l’avez compris |
15 |
||||||||
|
Sous-total |
641 |
|||||||||
|
Total |
1685 |
|||||||||
Tableau 2. Typologie des formules de prise en compte de l’allocutaire dans l’oral scientifique (Lee, 2024).
Les formules métalinguistiques et méta-énonciatives ont pour fonction d’expliciter le contenu et l’acte d’énonciation, pour éviter d’éventuelles difficultés liées au lexique ou à la formulation. Le locuteur peut ainsi reformuler ce qui a été dit, le corriger ou clarifier l’emploi des termes en précisant le processus de dénomination, ou en justifiant un emprunt ou un choix de termes. Les formules de structuration discursive visent, quant à elles, à structurer la présentation d’une façon compréhensible, de l’introduction à la conclusion, en assurant la cohésion et la fluidité de l’énonciation à travers les cadres distincts. Les formules de renvoi y sont prédominantes, traduisant une préoccupation d’établir des connexions entre les éléments discursifs avec ceux d’autres discours, ou dans le cadre du discours en question, et de signaler un changement dans le fil énonciatif. Les formules interactionnelles reflètent, quant à elles, la dynamique directe et immédiate des interactions entre le locuteur et l’auditoire. Elles permettent ainsi de mettre en lumière certains éléments essentiels ou de renforcer le lien phatique, en s’appuyant sur des processus cognitifs comme le constat, la mobilisation des connaissances ou la vérification de la compréhension. Fondée sur un corpus de taille modeste, cette typologie reste ouverte à des ajustements selon les données ou le type de sous-genres scientifiques oraux analysés. Pour plus de détails, voir Lee (2024).
4. Un bref examen des ressources didactiques numériques déjà existantes
La typologie phraséologique développée pour le français scientifique parlé présente un intérêt à deux niveaux. D’une part, elle permet de mettre en évidence les spécificités linguistiques du genre des communications scientifiques orales, à travers leur comparaison avec celles d’autres genres, qu’ils relèvent du discours scientifique écrit (Siepmann, 2023 ; Lee, 2024) ou d’autres registres oraux (par ex. celui d’entretiens semi-directifs chez Lee (2022)). D’autre part, elle contribue à la conception de ressources pédagogiques en Français sur Objectifs Universitaires (désormais, FOU), visant à aider les étudiants à maîtriser ces formules en vue de la réalisation d’une présentation plus interactive. C’est dans cette deuxième perspective que nous proposons un aperçu de quelques outils numériques, regroupés en trois catégories. Nous commencerons par des ressources de l’EAP, puis nous examinerons trois plateformes dédiées à la consultation de corpus d’écrits scientifiques français. Enfin, nous finirons par examiner trois outils élaborés pour l’apprentissage du FLE à partir des corpus oraux. Le choix des ressources s’est fondé sur leur reconnaissance, afin d’analyser des outils déjà bien identifiés dans le domaine.
4.1. Ressources lexicographiques de l’anglais académique
Parmi les nombreuses ressources lexicographiques et phraséologiques élaborées en EAP, trois nous semblent particulièrement pertinentes à examiner : le Louvain English Academic Purposes Dictionary (Granger & Paquot, 2010), l’Academic Formulas List (Simpson-Vlach & Ellis, 2010), et l’Academic Phrasebank (Davis & Morley, 2018)15. Voici un tableau synthétique de ces trois plateformes :
|
Louvain English Academic Purposes Dictionary16 |
Academic Formulas List17 |
Academic phrasebank18 |
|
|
Entrées proposées |
1) par mots 2) par fonctions 3) par traductions |
Listes simples |
1) par fonctions 2) par parties textuelles |
|
Modalités couvertes |
Écrit |
Écrit et oral |
Écrit |
|
Particularités pédagogiques |
Présentation d’erreurs typiques, conseils pour l’usage, exercices |
Pas de visée pédagogique explicite |
Explications détaillées sur chaque fonction |
Tableau 3. Récapitulatif des trois ressources lexicographiques de l’anglais académique
Ces travaux ont en commun de proposer, chacun à leur manière, une forme de classification fonctionnelle des expressions, bien que celle de l’Academic Formulas List (désormais, AFL) ne soit pas explicitement présentée sur le site. Malgré son caractère un peu sommaire, le site de l’AFL nous permet d’observer les effets de la modalité sur l’utilisation des formules : certaines fonctions (par ex. le rappel) se réalisent différemment à l’écrit (as shown in ‘comme il a été montré dans’) et à l’oral (come back to ‘revenons à’), et on y retrouve des traits typiques du langage parlé dans les formules orales comme des formes réduites (wanna, we’re) ou la répétition d’interjections (no no no no).
D’un point de vue pédagogique, le Louvain English Academic Purposes Dictionary (désormais, LEAD) se distingue des autres, en proposant des commentaires à destination des utilisateurs, comme on le voit dans la figure ci-dessous, sur un emploi erroné, accompagné de sa correction (à gauche), sur une expression typiquement utilisée par les apprenants, jugée moins naturelle par des chercheurs experts (à droite), ou encore sur des conseils pratiques à travers la rubrique Tip.
Figure 1. Exemples de commentaires concernant l’usage du lexique sur le LEAD
Le LEAD présente également des exercices pour certaines fonctions principales : textes à trous, QCM à deux choix lexicaux, sémantiquement proches, ou distinctions entre formules similaires (par ex. on the contrary VS on the other hand). Ces activités visent à accompagner à la fois l’auto-apprentissage des apprenants et la préparation pédagogique des enseignants pour le cours.
Contrairement au LEAD et à l’AFL, l’Academic phrasebank porte sur des schémas phrastiques typiques, directement réutilisables par les utilisateurs, et présente une classification selon les parties textuelles (introduction, méthodologie, références, conclusion, etc.), où les expressions apparaissent fréquemment. Par exemple, la figure ci-dessous illustre des exemples de phrases visant à signaler une lacune dans la littérature, typiquement utilisées dans l’introduction. Les éléments variables (X ou Y) sont à adapter selon le contexte du rédacteur.
Figure 2. Exemple de phrases proposées par l’Academic Phrasebank
4.2. Outils élaborés à partir d’un corpus d’écrits scientifiques en français
Concernant la phraséologie des écrits scientifiques en français, trois outils numériques peuvent être particulièrement examinés : l’ARTES (Aide à la rédaction de textes scientifiques) (Pecman & Kübler, 2011), ScienQuest (Falaise, Tutin & Kraif, 2011), et la base LST (Lexique Scientifique Transdisciplinaire) SHS (Li, 2024) (voir le Tableau 4). Ces outils offrent, à l’instar des ressources anglo-saxonnes évoquées, une entrée onomasiologique, bien que cela soit moins développé chez ScienQuest19.
|
ARTES20 |
ScienQuest21 |
Base LST SHS22 |
|
|
Entrées proposées |
1) par mots 2) par fonctions 3) par traductions |
1) par mots 2) par catégories sémantiques |
1) par mots 2) par fonctions 3) par traductions |
|
Particularités pédagogiques |
Contextualisation des résultats à l’aide des corpus |
||
|
Navigation complexe, peu d’exemples |
Ergonomie simple |
Interface intuitive, diverses fonctionnalités |
|
Tableau 4. Récapitulatif des trois outils de corpus d’écrits scientifiques en français
Les interfaces ARTES et ScienQuest permettent particulièrement d’affiner la recherche : celle de ScienQuest propose à l’utilisateur notamment de choisir une discipline, un sous-genre (HDR, article, thèse, etc.) et une partie textuelle (introduction, développement, conclusion, résumé, etc.), qui l’intéressent en particulier. En ce qui concerne l’ergonomie, la plateforme ARTES est marquée par un processus de recherche relativement complexe, comme l’a déjà mentionné Li (2024, p. 103), et par un nombre d’exemples limité. En revanche, l’interface ScienQuest nous semble plus simple à utiliser grâce à un système de cases à cocher sans menu déroulant.
Concernant la base LST SHS, élaborée en lien avec le projet ANR TermITH (2012-2016) et les travaux récents sur les routines (Ji, 2022 ; Wang, 2022), il s’agit d’un outil numérique visant à l’auto-apprentissage du lexique et de la phraséologie scientifique. Plusieurs aspects de cette base méritent d’être soulignés sur le plan pédagogique. D’abord, les étiquettes fonctionnelles de l’accès onomasiologique ont été simplifiées à partir de tests réalisés auprès d’étudiants (Li, 2024, pp. 129-135), ce qui les rend plus accessibles. Par exemple, l’étiquette « pour définir la structure du texte » (LST SHS) paraît plus intuitive qu’« organiser son discours » (ARTES), ou encore « renvoyer aux travaux des autres » (LST SHS) plus facile que « renvois méta-textuels » (ScienQuest). Le site se distingue aussi par sa clarté : chaque fonction s’accompagne d’une formule prototypique (en italique à droite), ses sous-valeurs sont consultables avec un exemple sans changer de page, et un simple clic sur le symbole de point d’interrogation permet d’afficher une définition plus précise (Figure 3).
Figure 3. Exemple de la présentation des fonctions dans l’accès onomasiologique sur la base LST SHS
Parmi les fonctions complémentaires, on note la possibilité de visualiser des articles annotés avec les éléments du LST, offrant ainsi un aperçu global de l’utilité de ces lexiques en contexte. Un module e-learning interactif, encore en développement, proposera également une mise en situation virtuelle, où l’utilisateur acquiert des expressions pour aider d’autres personnages à rédiger leur mémoire.
4.3. Ressources didactiques du français parlé en FLE
Le dernier ensemble de ressources examinées concerne les interfaces didactiques d’exploration de corpus oraux, déjà connus dans le domaine du FLE : FLORALE (Français langue orale pour le FLE) (Surcouf & Ausoni, 2018), CORAIL (Corpus Oraux Apprenant Interaction Linguistique) (Ravazzolo & Etienne, 2019), et INTERFARE (Interagir plus facilement en réunion) (Ravazzolo, Etienne & André, 2023). Elles se distinguent particulièrement des ressources précédentes (Sections 4.1 et 4.2) par les exigences en termes d’organisation qu’implique la représentation numérique des données orales. Par exemple, chez FLORALE, l’usager a une possibilité d’élargir le contexte des occurrences à l’aide des flèches rouges (Figure 4), d’écouter la bande sonore et d’en ralentir la lecture.
Figure 4. Exemple des résultats de recherche sur la plateforme FLORALE
Nous pouvons récapituler les caractéristiques principales de ces trois plateformes, comme suit :
|
FLORALE23 |
CORAIL24 |
INTERFARE25 |
|
|
Registres |
Émissions de radio |
Divers types d’interactions |
Interactions en réunion |
|
Entrées proposées |
1) par catégories linguistiques 2) par notions linguistiques 3) par fonctions (en partie) |
1) par situations 2) par actes de langage 3) par expressions |
1) par étapes-clés (rubriques) 2) par expressions |
|
Particularités pédagogiques |
Données audio et transcription et usage de métalangage facile |
||
|
Contextualisation des résultats de corpus |
Vidéos, explication des séquences d’interaction |
Explication détaillée sur chaque étape-clé |
|
Tableau 5. Récapitulatif des trois ressources didactiques du français parlé en FLE
L’accès onomasiologique est aussi dominant au sein des outils numériques du français parlé. Par exemple, dans CORAIL, pour l’entrée « Comment dire ? Comment faire ? », les extraits du corpus sont organisés par actes de langage (remercier, refuser, plaisanter, inviter, etc.). Cette approche onomasiologique est également adoptée, bien que partiellement, par FLORALE : les formules méta-discursives, présentées dans le cadre de la catégorie « Outils de conversation », sont classées selon leur fonction (préciser ce qu’on dit, réfléchir à sa manière de dire, nuancer ce qu’on dit, etc.). D’une façon proche, mais distincte, l’interface INTERFARE propose un accès par étapes-clés que l’on retrouve généralement dans les interactions en réunion : participer activement à la réunion et mettre en œuvre les décisions prises (Figure 5).
Figure 5. Page d’accueil des rubriques de la plateforme INTERFARE
Par ailleurs, il nous semble important de souligner que les trois plateformes du FLE intègrent toutes des éléments phraséologiques, dont certains apparaissent aussi dans notre ressource de phraséologie scientifique orale, comme des marqueurs discursifs vous savez, vous voyez, on va dire de FLORALE26.
5. Un exemple de présentation des fonctions et de simplification des étiquettes de notre ressource
Parmi les différentes pistes soulevées lors de l’examen des outils numériques sur la langue du discours scientifique ou sur l’oral en FLE27, celle de la formulation des étiquettes fonctionnelles s’avère particulièrement déterminante, puisque la plupart des ressources repose sur une entrée onomasiologique. En effet, la lisibilité des fonctions influence l’accessibilité et l’appropriation de la ressource par les usagers non spécialistes de la linguistique, en particulier les apprenants. La base LST SHS (Li, 2024) a déjà fait, comme on l’a vu plus haut, le choix d’une simplification métalinguistique fondée sur des tests utilisateurs, afin de rendre les étiquettes plus intuitives. Par conséquent, nous proposons dans cette section de réfléchir à la façon dont les étiquettes de notre typologie des formules de prise en compte de l’allocutaire pourraient être transposées dans la conception d’un futur outil pédagogique du français scientifique oral.
Pour cela, nous avons d’abord reformulé le concept de la prise en compte de l’allocutaire, à l’instar de l’interface INTERFARE, sous la forme d’une question clé, « Comment rendre sa présentation orale plus interactive ? ». Dans un second temps, nous avons simplifié les intitulés de nos trois dimensions fonctionnelles, qui constitueront les points d’entrée de cette ressource : « expliquer et préciser ce qu’on dit » pour la dimension métalinguistique et méta-énonciative, « guider son auditoire dans l’organisation de la structure » pour la dimension structurelle, et « faire une présentation vivante et dynamique » pour la dimension interactionnelle, comme dans la figure suivante.
Figure 6. Réalisation possible des trois axes dans une interface d’accueil de notre ressource
L’usage d’émojis comme appui visuel symbolique nous semble particulièrement utile dans cette interface afin de soutenir l’appropriation intuitive des enjeux de chaque catégorie (Lin & Luo, 2024) : par ex. ceux qui évoquent l’acte de parler sur le langage et de commenter la langue employée, pour la dimension métalinguistique et méta-énonciative, ceux qui sont liés au repère ou à l’orientation dans la structure, pour la dimension de structuration, enfin, ceux qui renvoient à l’interaction orale immédiate, pour la dimension interactionnelle28.
Enfin, il est possible de reformuler chaque fonction de notre typologie dans une version moins technique. Pour ce faire, nous nous sommes appuyée sur les étiquettes proposées dans la base LST SHS (Li, 2024), qui intègre la typologie de Ji (2022). Comme on l’a déjà vu (Section 3.2), cette dernière partage plusieurs fonctions spécifiques, notamment celles des dimensions métalinguistiques et structurelles, avec notre typologie.
|
Catégories |
Fonctions |
Étiquettes simplifiées |
|
Expliquer et préciser ce qu’on dit |
Reformulation |
Dire autrement ce qu’on vient de dire |
|
Réparation |
Corriger un malentendu possible |
|
|
Dénomination |
Appeler un phénomène par une expression |
|
|
Emprunt terminologique |
Préciser sa reprise d’un terme d’un autre |
|
|
Choix terminologique |
Préciser son choix d’un terme |
|
|
Approximation méta-énonciative |
Nuancer l’utilisation d’une expression |
|
|
Guider son auditoire dans l’organisation de la structure |
Annonce du plan |
Présenter le plan de sa présentation |
|
Annonce de l’objectif/l’objet |
Dire l’objectif ou l’objet de sa présentation |
|
|
Clôture/conclusion |
Conclure sa présentation |
|
|
Renvoi à la littérature |
Renvoyer à des travaux précédents |
|
|
Renvoi à d’autres communications |
Rappeler une autre présentation orale |
|
|
Rappel |
Dire qu’on en a déjà parlé |
|
|
Anticipation |
Dire qu’on en parlera plus tard |
|
|
Transition |
Passer à un autre élément |
|
|
Reprise |
Revenir sur un point précédent |
|
|
Passage de tour de parole |
Donner la parole à son co-présentateur |
|
|
Limitation des thèmes abordés |
Préciser ce dont on ne va pas parler |
|
|
Organisation du support de la présentation |
Expliquer ce qu’on a mis sur le support |
|
|
Faire une présentation vivante et dynamique |
Mise en valeur |
Mettre en lumière un élément important |
|
Co-constat |
Inviter les gens à constater quelque chose |
|
|
Appui sur des connaissances partagées |
Faire appel à ce que le public sait déjà |
|
|
Engagement méta-énonciatif de l’allocutaire |
Imaginer ce que va dire le public |
|
|
Gestion de la compréhension de l’allocutaire |
Vérifier que le public suit sa présentation |
Tableau 6. Notre typologie fonctionnelle des formules avec des étiquettes simplifiées
Si une évaluation empirique demeure nécessaire afin d’apprécier la pertinence réelle de cette proposition d’étiquettes, cette étape préliminaire constitue néanmoins un jalon utile en amont d’une possible mise en œuvre didactique de notre ressource phraséologique.
6. En guise de conclusion
À l’issue de l’examen d’un sous-ensemble d’outils linguistiques numériques à visée didactique, plusieurs pistes ont été identifiées pour guider la conception d’une plateforme dédiée à notre ressource de phraséologie orale dans le contexte de l’enseignement et de l’apprentissage du FOU. Tout d’abord, une approche onomasiologique semble pertinente, voire primordiale, afin de sensibiliser les usagers à la diversité des stratégies de prise en compte de l’allocutaire dans la réalisation d’une communication scientifique orale. Dans cette optique, nous avons proposé une première reformulation simplifiée des étiquettes fonctionnelles de notre typologie en vue de faciliter l’appropriation par des apprenants non spécialistes, peu habitués au métalangage technique.
Par ailleurs, il serait intéressant de segmenter le CComSciO en différentes parties structurelles de la présentation scientifique orale, à l’instar de l’Academic phrasebank et de ScienQuest, afin d’associer certaines fonctions identifiées à chaque partie, dans une logique d’accompagnement progressif de la construction du discours scientifique oral. L’ergonomie de l’interface constitue un autre axe de réflexion essentiel : un outil d’exploration efficace devrait permettre une navigation fluide, en minimisant les efforts de recherche de la part des utilisateurs. En complément de la ressource brute, il serait également souhaitable de proposer des aides à l’interprétation (explications contextuelles, paraphrases) et des supports pédagogiques prêts à l’emploi, facilitant une intégration directe en classe ou en auto-formation des apprenants. Enfin, certaines fonctionnalités propres à la nature orale du corpus devraient être envisagées, telles que la manipulation fine des extraits sonores, la transcription interactive (par ex. sous forme de dictée), ou encore l’accès à des informations prosodiques.
L’utilisation des formules routinisées se révèle aussi riche dans l’oral scientifique que dans les écrits scientifiques. S’il est désormais établi « un rapport non négligeable entre l’enseignement du lexique (la phraséologie scientifique) et la rédaction d’écrits universitaires » (Cavalla, 2008, p. 149), il semble légitime de postuler un lien similaire entre la maîtrise des formules de prise en compte de l’auditoire et la capacité à produire une présentation orale plus interactive. Dans cette optique, cet article entend contribuer à poser les fondements d’une « phraséodidactique » (González-Rey, 2019) du français parlé scientifique, encore peu explorée dans l’enseignement et l’apprentissage du FOU.






