1. Introduction*
La polysémie régulière, qui désigne les alternances de sens récurrentes au sein de classes lexicales (Apresjan, 1974), a fait l’objet d’un nombre important de travaux théoriques. Ces derniers se sont concentrés essentiellement sur deux grandes questions : (i) celle de savoir quel type de représentation linguistique adopter pour les mots présentant des alternances de sens régulières et (ii) celle de savoir comment décrire ces alternances de sens et leur récurrence dans le lexique (pour un aperçu général, voir entre autres Ravin & Leacock, 2000 ; Falkum & Vicente, 2015 ; Dölling, 2020)1. Plus récemment, des études empiriques s’appuyant sur des données linguistiques primaires (données comportementales, corpus textuels) et/ou secondaires (jugements, ressources lexicales) ont produit des résultats susceptibles d’apporter des éclairages nouveaux sur ces questions théoriques, en mettant notamment en lumière le caractère hétérogène et fondamentalement graduel du phénomène observé. L’objectif de cette introduction du numéro spécial sera de présenter, parmi ces études, celles qui cherchent à mesurer la variation des polysémies observées en termes de régularité ou qui s’intéressent aux facteurs explicatifs de cette variation.
1.1. Définitions préliminaires
Avant de nous intéresser à la polysémie régulière proprement dite, rappelons la définition communément admise de la polysémie et des deux notions qui lui sont complémentaires, l’homonymie d’une part, la monosémie d’autre part. On dit d’un mot qu’il est polysémique s’il a plusieurs sens distincts mais liés entre eux (Bréal, 1904 ; Kleiber, 1999 ; entre autres). C’est le cas par exemple du nom bureau, qui peut dénoter un ‘meuble’ ou une ‘pièce’, ces deux sens étant unis par un lien clair : le meuble et la pièce sont dédiés à la même activité, à savoir le travail. La condition de sens distincts trace une première frontière entre polysémie et monosémie, qui caractérise les mots dotés d’un sens unique2. La condition de l’existence d’un lien entre les différents sens du mot polysémique dessine une seconde frontière avec l’homonymie, qui implique des sens distincts mais sans relation entre eux. Si d’un point de vue définitionnel les frontières entre homonymie, polysémie et monosémie sont nettes, l’évaluation de ces conditions peut s’avérer difficile, lorsque le consensus est faible sur l’existence d’un lien entre les sens d’un mot (ex. jalousie ‘sentiment’ / ‘persienne’), ou lorsque le caractère distinct des sens n’apparaît pas clairement (ex. amour ‘sentiment amoureux’ / ‘amitié’). Les frontières entre les catégories étant poreuses, il a été proposé de voir la polysémie comme occupant une place centrale le long d’un continuum entre homonymie et monosémie (Tuggy, 1993 ; Victorri & Fuchs, 1996 ; entre autres).
Une polysémie est dite régulière si l’on observe au moins deux mots dans la langue qui présentent une même extension de sens (Apresjan, 1974), elle est irrégulière dans le cas contraire. Par exemple, la polysémie du nom bureau évoquée plus haut est régulière dans le lexique du français puisqu’on trouve au moins un autre nom présentant la même alternance entre un meuble et un lieu (ex. bibliothèque, bar). À l’inverse, la polysémie du nom mètre, qui unit les sens ‘unité de mesure’ (ex. deux mètres cinquante) et ‘instrument de mesure’ (ex. prête-moi ton mètre) est irrégulière, puisqu’il n’existe a priori pas d’autre nom en français contemporain qui présente la même alternance de sens. La frontière entre polysémie régulière et polysémie irrégulière dépend toutefois crucialement de deux paramètres : le grain sémantique choisi pour décrire l’alternance sémantique, d’une part, et l’étendue du lexique considéré, d’autre part. Le lien métonymique irrégulier entre les deux sens du nom mètre pourrait ainsi être considéré comme régulier si l’on généralise le sens source à celui de ‘quantité’ – le nom mesure relèverait alors du lien décrit (ex. deux mesures d’eau / lots de mesures en étain) – ou si l’on étend l’évaluation au lexique spécialisé ou diachroniquement marqué – le lien s’appliquerait alors également aux noms toise (ex. deux toises plus bas / une toise en bois) et litre (ex. deux litres de lait / un litre en bois).
L’existence de polysémies de faible régularité n’a que peu attiré l’attention des auteurs (Pethö, 2007 ; Brocher et al., 2018), qui se sont intéressés principalement aux polysémies clairement régulières et aux polysémies systématiques. Les premières concernent une proportion notable des effectifs d’une classe lexicale, sans toutefois les concerner tous. C’est le cas par exemple de la polysémie “action > objet résultant de cette action” qui est régulière (ex. traduction, construction, sculpture) mais qui ne concerne qu’une partie des noms d’action (par ex. le nom réparation n’a pas de sens d’objet résultant). Les polysémies systématiques, quant à elles, s’appliquent à l’ensemble d’une classe lexicale donnée, fut-elle très restreinte (Apresjan, 1974). Les noms de contenants (ex. seau, fourchette, sachet), par exemple, peuvent systématiquement s’employer pour désigner une quantité mesurée par ce contenant (deux seaux d’eau, trois fourchettes de riz, dix sachets de cocaïne). Là encore, le grain adopté pour décrire les conditions sémantiques d’une extension de sens peut jouer sur l’évaluation de sa régularité : plus le grain est fin, plus la proportion des noms polysémiques au sein d’une classe est importante, jusqu’à arriver théoriquement à une systématicité, ce qui soulève la question de l’existence ou non d’une différence de nature entre une polysémie régulière non systématique et une polysémie régulière systématique.
Terminons ces remarques préliminaires par une précision concernant le périmètre de notre objet d’étude. Le phénomène de la polysémie systématique, au sens où elle est définie ci-dessus, est souvent confondu avec celui de la monosémie complexe. Ce phénomène, décrit dans la littérature sous les termes de facettes (Cruse, 1995), de types pointés (Pustejovsky, 1995), voire de polysémie inhérente ou logique (Copestake & Briscoe, 1995 ; Frisson, 2015), désigne des unités qui dénotent des référents complexes, et dont les différents aspects les font relever de classes sémantiques distinctes mais liées entre elles, les faisant ressembler en cela à des cas de polysémie. L’exemple classique est celui des noms de documents (livre, catalogue, magazine, etc.), qui désignent des contenus informationnels sur supports et relèvent donc de la classe sémantique des objets informationnels et de celle des objets physiques. Le trait principal qui distingue polysémie systématique et monosémie complexe a été largement décrit dans la littérature : les sens concernés par une polysémie régulière sont mutuellement exclusifs en contexte, au contraire des facettes des monosèmes complexes, ce que révèle en particulier le test de la coprédication (Zwicky & Sadock, 1975 ; Cruse, 1986 ; Godard & Jayez, 1996 ; Asher, 2011 ; Moldovan, 2021 ; en autres). Comme d’autres avant nous (par ex. Dölling, 2020), nous prendrons soin ici de bien distinguer ces deux phénomènes pour nous concentrer sur la seule polysémie régulière3 dont le spectre s’étend donc de la polysémie minimalement régulière à la polysémie systématiquement régulière.
1.2. La polysémie régulière, un phénomène graduel
Pourquoi chercher à évaluer précisément le degré de régularité d’une polysémie ? On peut penser tout d’abord que la représentativité effective d’une polysémie dans la langue a une incidence sur l’acquisition des sens produits par cette polysémie. Des études montrent un avantage de la polysémie par rapport à l’homonymie sur cette question : les enfants acquièrent plus facilement un sens nouveau d’un mot existant quand il est lié à l’un des sens établis de ce mot que quand il ne l’est pas (Srinivasan et al., 2019) et le stockage d’un sens nouvellement acquis entre moins en compétition avec un autre sens existant lorsque ceux-ci sont sémantiquement liés (Rodd et al., 2012 ; Maciejewski et al., 2020). On peut donc faire l’hypothèse que plus le sens nouvellement créé est lié de manière régulière au sens existant (et donc plus souvent on a été confronté à ce type de polysémie), plus l’acquisition en est facilitée et moins est forte la compétition4 entre le sens nouvellement intégré au lexique mental et le sens stocké de plus longue date. La caractérisation précise du degré de régularité des types de polysémie pourrait ainsi faire avancer notre connaissance de la structuration du lexique mental et de la représentation des mots à sens multiples. Elle pourrait également permettre, d’un point de vue typologique, une comparaison plus fine entre les langues. Certaines polysémies régulières s’observent dans différentes langues, avec des effectifs (i.e. l’ensemble des mots présentant cette polysémie) plus ou moins comparables, comme l’ont montré de nombreuses études de cas, par exemple celles portant sur la métaphore “animal > personne” (Talebinejad & Dastjerdi, 2005 ; Rodriguez, 2009 ; entre autres). Des études à plus large spectre, menées à partir de ressources multilingues (Peters, 2003) ou de questionnaires soumis à des locuteurs de différentes langues (Srinivasan & Rabagliati, 2015) laissent par ailleurs entrevoir l’existence d’un lien entre régularité d’une polysémie et récurrence de cette polysémie à travers les langues (voir infra, section 3).
L’hypothèse d’une corrélation entre régularité d’une polysémie et facilité d’acquisition d’une part et tendance à l’universalité d’autre part implique, pour être vérifiée, qu’on soit à même d’évaluer précisément le degré de régularité d’une polysémie donnée, ce qui soulève un certain nombre de questions aussi bien théoriques que pratiques (Barque et al., 2018). Dans la suite de la présentation, nous nous intéresserons tout d’abord aux études qui ont cherché à évaluer le degré de régularité d’une polysémie en calculant ses effectifs dans la langue (section 2). Nous nous pencherons ensuite sur les sources de la polysémie régulière en évoquant des travaux qui décrivent de potentiels facteurs explicatifs des degrés de régularité des polysémies observées, parmi lesquels la figure sur laquelle repose l’extension de sens (métonymie / métaphore), le degré de connectivité entre les sens en jeu, et enfin la construction morphologique des mots ayant ces sens (section 3). Nous terminerons en présentant les quatre contributions de ce numéro spécial consacré aux approches empiriques de la polysémie régulière (section 4).
2. L’évaluation de la régularité d’une polysémie
Le calcul du degré de régularité d’un patron de polysémie implique a minima l’évaluation de deux paramètres importants : i) la proportion des mots polysémiques relevant de ce patron par rapport à l’ensemble des mots susceptibles d’en relever et ii) la fréquence de ces mots polysémiques et la prise en compte de la distribution de leur sens (Lombard et al., à paraître). Plus un patron a produit dans la langue de mots polysémiques par rapport à son potentiel génératif, plus il est régulier et il l’est d’autant plus que les mots qui en relèvent sont d’un usage fréquent et que les mots polysémiques qu’il a produits ont des sens équilibrés, autrement dit, de fréquence équivalente. On peut penser en effet que ces derniers sont de meilleurs représentants de la polysémie en question, en comparaison de ceux qui ont un sens source ou un sens cible rare. Si l’on prend l’exemple de la polysémie “action > objet résultant de cette action”, les noms comme construction ou traduction devraient ainsi avoir plus de poids dans le calcul de la régularité de ce patron que des noms comme assemblage, dont le sens d’action est a priori beaucoup plus fréquent que le sens d’objet résultant. Dans la suite de cette section, nous commencerons par rendre compte d’études portant sur l’évaluation des effectifs des patrons de polysémie à partir des données disponibles dans les ressources lexicales (section 2.1) puis nous aborderons les quelques études s’intéressant à la modélisation de la polysémie régulière en corpus (section 2.2).
2.1. Évaluation de la régularité d’une polysémie à partir de lexiques
À la suite de l’étude de Buitelaar (1998) qui a le premier exploité la ressource lexicale de l’anglais WordNet (Miller et al., 1990) pour en extraire des classes de mots présentant des alternances de sens similaires, plusieurs études ont proposé d’identifier des polysémies régulières en exploitant les chaînes d’hyperonymes dans des ressources hiérarchiquement structurées (Buitelaar, 2000 ; Peters, 2006 ; Barque & Chaumartin, 2008 ; entre autres). Il résulte de ces travaux des inventaires de patrons de polysémie et des classes de mots instanciant ces patrons pour différentes langues. L’exploitation de WordNet donne accès pour l’anglais à un ensemble important de données, mais dont on ne peut évaluer la précision, celles-ci n’ayant pas fait l’objet d’une validation manuelle complète. L’étude de Buitelaar (2000) mentionne par exemple 1341 clusters de sens représentant potentiellement des extensions de sens régulières pour 3336 noms. Concernant le français, deux ressources lexicales hiérarchisées5, complémentaires du point de vue de leur couverture et de leur précision, ont été exploitées avec le même objectif d’identifier les polysémies régulières et leurs effectifs (Barque et al., 2018). Après validation manuelle des données extraites automatiquement, les auteurs de l’étude ont obtenu un ensemble de 50 patrons de type métonymique et 53 patrons de type métaphorique pour le français, dont respectivement 22 et 9 sont représentés dans les deux ressources.
Les données produites à partir de ressources lexicales ne peuvent toutefois suffire à une caractérisation précise du degré de régularité des patrons identifiés. En effet, les dictionnaires ne listent qu’une partie des mots de la langue et ne décrivent pas l’ensemble des sens possibles pour ces mots, notamment quand il s’agit de sens hautement prédictibles. Par exemple, seuls les noms qui dénotent des contenants servant prototypiquement de mesure voient leur sens cible décrit dans les dictionnaires. On y trouve ainsi plus fréquemment le sens cible de verre (‘le contenu du verre’) que celui de flûte ou de mug. Une autre limitation des ressources lexicales pour l’identification des patrons de polysémie régulière et de leurs effectifs concerne l’hétérogénéité des traitements en termes de distinction des sens et d’encodage des liens entre ces sens : il n’est pas rare que les alternances fortement régulières, comme la polysémie “action>résultat”, soient décrites au sein d’une entrée tantôt par deux définitions distinctes (ex. le nom construction dans Le Petit Robert est défini d’une part comme A. ‘action de construire’ et B. ‘ce qui est construit, bâti’), tantôt par une unique définition disjonctive (ex. le nom affirmation dans le même dictionnaire est défini comme ‘action d’affirmer [...] ; jugement ainsi énoncé’) sans qu’il apparaisse clairement si cette différence de traitement encode une différence linguistique entre polysémie et monosémie complexe (voir section 1).
2.2. Évaluation de la régularité d’une polysémie à partir de corpus
L’exploration de corpus constitue une autre façon de déterminer empiriquement l’inventaire des polysémies régulières d’une langue et de leurs instances. Cette méthode présente l’intérêt, par rapport à la méthode lexicographique, de donner des informations de fréquence sur les mots et leurs sens, second paramètre important pour le calcul du degré de régularité d’une polysémie. L’étude du phénomène en contexte permet par ailleurs de s’affranchir des questions de conventionnalisation des sens et d’accéder ainsi aussi bien aux sens systématiquement produits par un patron qu’aux productions discursives néologiques vouées ou non à intégrer le lexique (voir L’omelette au jambon est partie sans payer6). Il existe théoriquement deux cas de figure : soit on dispose de corpus sémantiquement annotés et donc des données nécessaires pour le calcul de la régularité des patrons au sein de ce corpus, soit on ne dispose que de corpus bruts, ce qui implique une étape préalable d’induction ou de repérage automatique d’alternances de sens récurrentes. La rareté des corpus annotés sémantiquement limite l’utilisation de la première méthode. Seul l’anglais dispose d’une telle ressource avec le corpus Semcor (Landes et al., 1998), dans lequel environ 193 000 occurrences de noms, verbes et adjectifs ont été annotées manuellement d’après l’inventaire des sens de WordNet. La représentation de la polysémie régulière dans ce corpus n’a toutefois, à notre connaissance, pas encore fait l’objet d’une analyse approfondie. On peut citer toutefois des projets d’annotation plus circonscrits qui s’intéressent aux alternances sémantiques régulières (Martinez Alonso et al., 2013 ; Jurgen, 2014), mais qui ont pour visée spécifique l’étude des cas d’ambiguïté contextuelle révélés par un désaccord entre annotateurs (ou par une annotation multiple, quand elle est permise dans le protocole d’annotation). L’ambiguïté contextuelle pouvant résulter de plusieurs phénomènes distincts (homonymie, polysémie – régulière ou non –, monosémie complexe, sous-détermination), les données produites dans le cadre de ces études ne peuvent être qu’en partie exploitées pour l’étude de la polysémie régulière.
Du côté de l’exploration de corpus non annotés sémantiquement, plusieurs études utilisent les représentations distribuées de mots pour évaluer leur appartenance ou non à une classe de polysémie régulière. Boleda et al. (2012) proposent un premier modèle de polysémie régulière qu’ils testent dans une tâche de classification binaire. Dans ce modèle, une alternance de sens A-B est représentée par la moyenne des représentations des classes sémantiques A et B, elles-mêmes respectivement représentées par la moyenne des représentations de mots monosémiques relevant de ces classes. La représentation des mots à classer, qui se limitent dans cette étude à des mots bisémiques dans la ressource WordNet, est calculée quant à elle à partir de l’ensemble de leurs occurrences. Le classement s’effectue par le calcul de la distance cosinus entre la représentation du mot à classer et celle de l’alternance de sens. La méthode, appliquée sur 60 alternances régulières issues de Corelex (Buitelaar, 1998), donne des résultats variés selon les alternances, ce que les auteurs expliquent par la proximité sémantique plus ou moins grande entre les deux sens en jeu dans l’alternance, proximité sémantique allant de pair avec une similarité distributionnelle variable. Del Tredici et Bel (2015) proposent un modèle qui s’inspire dans les grandes lignes du précédent mais qui s’en distingue en ce que les deux sens de l’alternance ne sont pas moyennés mais représentés indépendamment. Les mots polysémiques sont quant à eux représentés par leur degré d’appartenance à chacune des deux classes. Par exemple, les noms bœuf et autruche, dont les deux sens ‘animal’ et ‘viande’ sont lexicalisés, auront des indices distincts d’appartenance à chacune de ces deux classes, le sens ‘viande’ étant plus fréquent en corpus pour bœuf que pour autruche. Cette modélisation leur permet ainsi de rendre compte des différences de fréquence entre les sens du mot polysémique.
3. Les facteurs explicatifs de la polysémie régulière
Les polysémies régulières présentant des degrés de régularité variables, on peut se demander ce qui peut expliquer cette variation. On évoquera ici trois facteurs susceptibles d’influencer le degré de régularité d’un patron de polysémie : le type de figure sur laquelle repose l’extension de sens (section 3.1), la force du lien qui unit les deux sens en jeu (section 3.2) et enfin le caractère morphologiquement construit des mots qui instancient les sens impliqués dans un patron de polysémie (section 3.3).
3.1. Types d’extensions de sens
La figure lexicale sur laquelle repose une polysémie régulière peut s’imposer d’emblée comme l’un des facteurs explicatifs du degré de régularité de cette polysémie. Depuis (Apresjan, 1974), la régularité est en effet fréquemment décrite comme une propriété typique de la métonymie plutôt que de la métaphore7 et les études théoriques portant sur la polysémie régulière s’intéressent de fait majoritairement aux alternances fortement régulières de type métonymique (Nunberg & Zaenen, 1992 ; Pustejovsky, 1995 ; entre autres8). La corrélation entre figure et régularité est également postulée dans les études psycholinguistiques s’intéressant au traitement cognitif des différents types de mots à sens multiples et à leur représentation dans le lexique mental. Les travaux de Brocher et al. (2016, 2018), par exemple, montrent que les polysèmes irréguliers, représentés par des mots à sens cible métaphorique, ont un traitement plus proche de celui des homonymes que les polysèmes réguliers, représentés par des mots à sens cible métonymique.
Le lien de causalité entre figure et régularité peut s’expliquer en partie par les propriétés structurelles des deux figures. La métonymie repose sur une relation de contiguïté entre le référent du sens dérivé et celui du sens source, ce qui implique la création d’un référent connecté à celui dénoté par le sens source. La métaphore, quant à elle, repose sur une relation d’analogie entre les deux référents, qui implique la création d’un référent disjoint du précédent. Cette différence implique qu’il y a tendanciellement une plus grande proximité entre deux sens liés par métonymie qu’entre deux sens liés par métaphore, notamment lorsque la contiguïté se traduit par une inclusion référentielle, c’est-à-dire lorsque le référent du sens dérivé correspond à une partie du référent du sens source (p. ex dans la métonymie “animal>viande”). Le sens cible est alors fortement prédictible. Ainsi, la production ou l’interprétation d’un sens métonymique, tendanciellement plus proche du sens source et plus prédictible qu’un sens produit par métaphore, demanderait aux locuteurs un effort cognitif moindre, ce qui expliquerait qu’il soit plus régulièrement produit.
Le traitement cognitif moins coûteux des métonymies par rapport à celui des métaphores a fait l’objet d’une validation empirique dans les travaux de Klepoustoniou et al. (2007, 2008, 2012). Les résultats des différentes expériences menées indiquent en effet (i) que les métonymies sont traitées significativement plus rapidement que les homonymes, et (ii) que les métaphores ont un traitement intermédiaire entre celui des métonymies et celui des homonymes. Pour ce qui est du lien entre figure et régularité à proprement parler, en revanche, il n’existe pas, à notre connaissance, d’étude d’envergure qui ait cherché à valider empiriquement la plus grande propension de la métonymie à la régularité, par rapport à la métaphore. En admettant que cela soit le cas, il reste que la figure ne peut expliquer à elle seule les degrés de régularité observés dans l’ensemble du lexique. En effet, comme l’ont souligné plusieurs auteurs (Copestake & Briscoe 1995 ; Pethö, 2007 ; Vincente & Falkum 2017 ; entre autres) et comme le montrent les inventaires de patrons de polysémie précédemment cités, les métaphores régulières ne sont pas rares et présentent, elles aussi, des degrés de régularité variables. Ces deux propriétés doivent donc absolument être décorrélées pour permettre une meilleure compréhension du phénomène (voir Lombard et al., à paraître).
3.2. Degré de connectivité entre les deux sens
Le degré de connectivité entre deux sens – qui, selon la définition qu’on en donne, peut concerner différentes propriétés de la relation : similarité, associativité, prédictibilité – semble être ainsi une variable explicative importante du degré de régularité de la polysémie en jeu. Plusieurs études typologiques s’intéressant à la polysémie font l’hypothèse d’un lien entre degré de connectivité des sens et régularité des cas de polysémie observés à travers les langues.
Dans l’étude de Srinivasan et Rabagliati (2015), des patrons de polysémie de l’anglais sont présentés à des locuteurs anglophones natifs d’une autre langue, qui doivent indiquer si les différents patrons proposés existent dans leur langue maternelle et, le cas échéant, si les mots polysémiques anglais relevant de ces patrons ont des équivalents dans leur langue. Les résultats de leur enquête montrent que la grande majorité des 27 alternances sémantiques régulières testées9 s’observent dans la plupart des langues considérées mais que ces patrons récurrents varient du point de vue de la taille de l’ensemble des instances comparables d’une langue à l’autre. Pour expliquer cette variation, les auteurs font l’hypothèse de contraintes plus ou moins fortes pesant sur le sens cible, qui détermineraient la prédictibilité de ce sens cible et donc sa fréquence de réalisation au sein des langues. Le sens de viande, par exemple, est plus prédictible à partir du sens d’animal (ex. lapin, bœuf) que le sens d’objet à partir du sens de matière (ex. coton, verre) et il est donc plus probable de trouver, d’une langue à l’autre, des instances similaires pour le premier patron que pour le second.
Dans une étude récente, Xu et al. (2020) s’intéressent de plus près aux causes des colexifications récurrentes à travers les langues10. Leur hypothèse est que la fréquence de colexication de deux concepts à travers les langues dépend de l’effort cognitif nécessaire à leur traitement, et que cet effort cognitif dépend lui-même du degré de connectivité entre les concepts en jeu : plus ces derniers sont connectés, plus leur traitement cognitif s’en trouve facilité et plus ils ont tendance à être colexifiés dans les langues. Le degré de connectivité est ici évalué à partir de mesures d’associativité et de mesures de similarité entre des mots représentant les concepts colexifiés11. Ces deux modèles (associativité et similarité) s’avèrent être ceux qui prédisent le mieux les données de colexifications observées, extraites des Intercontinental Dictionary Series (Borin et al., 2013), par rapport à deux autres modèles servant de baselines : l’un qui s’appuie sur des données de fréquence (moyenne des fréquences des deux mots représentant les concepts), l’autre qui s’appuie sur la notion de “métaphoricité” entre concepts, opérationnalisée par l’existence d’un changement de concrétude et/ou de polarité (perçu comme négatif vs positif) entre les deux concepts. Les résultats confirment ainsi l’hypothèse formulée par les auteurs selon laquelle les concepts qui ont la plus grande probabilité d’être associés et ceux qui apparaissent le plus souvent dans des contextes similaires sont ceux qui sont le plus souvent colexifiés dans les langues, autrement dit que le degré de connectivité entre deux concepts influence leur fréquence de colexification.
L’analyse des concepts associés aux mots polysémiques, dans l’étude qui vient d’être présentée, ne s’accompagne pas d’une généralisation en termes de patrons de polysémie. Par ailleurs, l’estimation qui est faite de la similarité entre concepts s’appuie sur des représentations distribuées de mots (word embeddings), dont les limites pour l’étude de la polysémie sont connues (Camacho-Collados & Pilehvar, 2018). L’utilisation de plus en plus fréquente de plongements contextualisés, qui représentent des occurrences de mots, permet d’envisager une analyse plus fine des rapports entre similarité sémantique et sens associés à une même forme lexicale. De fait, plusieurs études récentes cherchent à évaluer dans quelle mesure les modèles de langue contextuels captent la distinction entre polysémie et homonymie, et dans quelle mesure ces modèles coïncident avec les jugements humains sur le degré de similarité entre emplois d’un même mot (Nair et al., 2020 ; Haber & Poesio, 2021 ; Trott & Bergen, 2021 ; entre autres). Bien que ne portant pas spécifiquement sur la question du degré de régularité d’une polysémie, les données présentées dans ces études nous donnent un premier aperçu des liens entre similarité distributionnelle et polysémie régulière. Elles confirment tout d’abord empiriquement que la polysémie occupe une position intermédiaire entre homonymie et monosémie. La mise en regard des résultats de ces études montre par ailleurs que la polysémie semble plus proche de la monosémie lorsque les cas étudiés relèvent tous de la polysémie régulière, comme dans les données de Haber et Poesio (2021)12 que lorsque les mots polysémiques étudiés ne sont pas homogènes en termes de régularité, comme dans les données de Trott et Bergen (2021). Les données de ces deux études ne sont toutefois bien sûr pas directement comparables et une expérimentation reste à mener sur la similarité distributionnelle entre sens de patrons de polysémie plus ou moins réguliers pour évaluer dans quelle mesure celle-ci explique ou non la régularité observée d’une polysémie.
3.3. Relations avec le lexique morphologiquement construit
Mentionnons enfin, comme dernier élément susceptible de nous donner des informations sur la régularité d’un patron de polysémie, les relations qu’entretiennent, au sein du lexique, les règles d’extension de sens avec les règles de construction morphologique. Deux aspects de ces relations sont à considérer : la rivalité entre procédés de création de sens, d’une part, et les propriétés morphologiques des mots polysémiques, d’autre part.
On peut faire l’hypothèse que, dans les langues, tous les sens construits à partir d’autres sens n’ont pas les mêmes probabilités d’être produits par une construction morphologique ou par une extension de sens. Certains types de sens vont avoir tendance à être exclusivement construits par la morphologie, comme la transposition, qui implique un changement de catégorie grammaticale que l’extension de sens seule ne peut opérer, ou encore l’antonymie. D’autres au contraire vont typiquement être construits par extension de sens comme c’est le cas des sens métaphoriques, qui reposent sur une analogie non exprimée avec le sens de base. Mais il existe également tout un ensemble de cas où construction morphologique et extension de sens entrent en concurrence (ex. Copestake & Briscoe, 1995). En français par exemple, il est possible de produire à partir d’un nom d’artefact (ex. cuillère, table) un nom ayant le sens de ‘quantité’ soit par dérivation sémantique (ex. une cuillère de farine, une table de convives) soit par dérivation morphologique à l’aide du suffixe -ée (ex. une cuillerée de farine, une tablée de convives). De même certains sens typiquement dérivés par polysémie dans une langue peuvent s’exprimer morphologiquement dans une autre langue, comme le montrent les données produites dans le cadre d’études typologiques (Zalizniak et al., 2012 ; Zalizniak, 2018). La rivalité entre construction morphologique et extension de sens, qu’elle ait lieu au sein d’une langue ou entre langues distinctes, est ainsi susceptible de nous informer sur la régularité de ces dernières. Les constructions morphologiques reposant sur un principe de régularité formelle et sémantique, on peut faire l’hypothèse qu’une polysémie qui construit le même type de sens qu’une construction morphologique aura elle aussi tendance à être régulière. Par exemple, les noms d’agent, typiquement construits en -eur à partir d’un verbe (ex. construire > constructeur), peuvent aussi être produits par extension de sens à partir d’un nom d’événement, que celui soit construit morphologiquement (ex. accusation ‘action d’accuser’ / ‘partie qui accuse’) ou non (ex. censure ‘action de censurer’ / ‘groupe qui censure’).
L’autre question est de savoir si le statut morphologique (construit ou non) des mots qui instancient une polysémie est susceptible de nous informer sur la régularité de celle-ci. Les alternances de sens régulièrement observées au sein du lexique construit (Lehrer, 2003 ; Rainer, 2014) ont théoriquement trois origines possibles (Salvadori & Huyghe, ce numéro). La polysémie observée peut tout d’abord être héritée de la base morphologique, elle-même polysémique. Par exemple, les noms déverbaux dérivés de verbes présentant une alternance causative (ex. sécher le linge / le linge sèche) héritent souvent de cette alternance : le séchage du linge est ainsi ambigu entre une lecture causative et une lecture anticausative. Elle peut par ailleurs être le résultat d’une dérivation en parallèle à l’aide d’un suffixe polyvalent à partir d’une base sémantique unique. Le suffixe -eur par exemple permet de produire des noms d’animés et des noms d’instruments, ce qui donne lieu à des alternances récurrentes parmi les noms construits en -eur (ex. distributeur, qui peut dénoter une machine ou une personne qui distribue, avec la possibilité d’établir un lien d’analogie entre les deux). Elle peut enfin résulter d’une extension de sens prenant pour base le sens produit par la dérivation morphologique. Par exemple, la polysémie “action > groupe de personnes qui font l’action” de certains noms en -ion (ex. accusation, opposition) est le résultat d’une extension métonymique. Ces différents types de polysémies récurrentes observées au sein de classes lexicales morphologiquement construites font ainsi des propriétés morphologiques des mots polysémiques un élément à prendre en compte pour expliquer la régularité de ces derniers.
4. Présentation des contributions
Les quatre contributions regroupées dans ce numéro s’appuient sur l’exploration de ressources lexicales pour questionner certains des aspects de la polysémie régulière, tels que la possibilité de voir se réaliser un sens cible à partir d’un sens source, l’origine des polysémies observées au sein du lexique construit ou encore celle des polysémies récurrentes à travers les langues. Les trois premières contributions offrent une analyse de cas de polysémie en français liés à des classes circonscrites sémantiquement (noms de fleurs) et/ou morphologiquement (noms en -isme et noms déverbaux), tandis que la quatrième étude adopte une approche typologique en analysant un cas de polysémie complexe (c’est-à-dire correspondant à une série d’extensions de sens) récurrent dans les langues indo-européennes. Nous les présentons ici dans cet ordre.
L’étude présentée par Alain Polguère porte sur l’identification de la polysémie régulière dans le Réseau lexical du français (RL-fr), une ressource dans laquelle les unités lexicales, spécifiées sémantiquement, sont liées entre elles par différents types de relations (représentées par des fonctions lexicales), dont celle de co-polysémie. L’auteur y propose de décrire les polysémies régulières observées au sein d’une classe sémantique à partir de l’hyperonyme (accessible par la fonction lexicale Gener) des unités lexicales qui composent cette classe, ce qu’il illustre avec l’exemple des noms de fleurs en français. S’appuyant sur les descriptions du RL-fr, Alain Polguère montre ainsi que la définition lexicographique structurée de l’unité lexicale fleur encode les polysémies régulières observées pour les hyponymes de fleur (ex. cyclamen, lavande, gentiane, lotus). L’auteur illustre sa méthode de description lexicographique des patrons de polysémie régulière à l’aide de quatre patrons de la classe des noms de fleurs : (i) “fleur > couleur” (ex. cyclamen), (ii) “fleur > fragrance” (ex. lavande), (iii) “fleur > substance comestible” (ex. gentiane) et enfin (iv) “fleur > forme” (ex. lotus).
Grigory Agabalian s’intéresse aux alternances de sens régulièrement observées dans la classe morphologique des noms du français suffixés en -isme, dont certains peuvent dénoter une doctrine ou une attitude (ex. hédonisme, scepticisme). Après avoir proposé un ensemble de tests linguistiques révélateurs de l’une et l’autre de ces classes sémantiques et les avoir appliqués pour identifier les noms en -isme relevant conjointement des deux classes, Grigory Agabalian s’interroge sur la nature de la relation qui unit ces deux sens. Il montre que si les N de doctrine sont parfois dotés de facettes relevant d’une autre classe (ex des noms en ‑isme qui dénotent à la fois une doctrine et une activité, comme chamanisme), la relation entre les sens de doctrine et d’attitude sont clairement incompatibles et ne relèvent donc pas de la monosémie complexe. S’appuyant sur l’étude de descriptions issues du Trésor de la Langue Française, l’auteur montre ensuite que l’alternance a deux sources possibles : la polysémie, dans le cas où le sens attitude est dérivé du sens doctrine, comme c’est le cas pour machiavélisme par exemple ; et l’homonymie, dans le cas où les deux sens sont dérivés en parallèle lors de deux constructions morphologiques.
Justine Salvadori et Richard Huyghe s’intéressent à la question de l’origine des polysémies régulières s’observant dans le lexique construit, plus particulièrement dans l’ensemble des noms déverbaux. S’appuyant sur les descriptions d’un large ensemble de noms morphologiquement construits présentant des sens multiples (2954 noms déverbaux du français formés à l’aide de 46 suffixes), ils distinguent les cas où la polysémie régulièrement observée pour le nom construit est le fruit de deux dérivations morphologiques (avec lien de sens postulable a posteriori) des cas où elle résulte d’une seule dérivation morphologique avec extension de sens. C’est ce second phénomène que les auteurs se proposent de décrire, en proposant la notion de patron morphologique complexe et en comparant les 40 patrons qu’ils observent au sein des noms déverbaux du français. Ils mettent ainsi en évidence des spécificités morphologiques associées à la polysémie régulière. Par exemple, parmi les suffixes produisant des noms d’événement (-age, -ment, -ion), le suffixe -age est le plus apte à produire des noms présentant une polysémie régulière de type ‘événement’ / ‘artefact’ (l’artefact étant le résultat de l’événement).
Enfin, dans une perspective typologique, Mariia Orlova propose une étude comparative d’une chaîne d’extension de sens s’appliquant à des verbes de mouvement dans 11 langues indo-européennes. L’auteure y décrit précisément les différentes étapes de dérivations permettant de passer du sens original de ‘lever’ (to take up) à celui de ‘détruire’ (to destroy) ou de ‘abolir’ (to abolish). S’appuyant sur les données de la base SemShift (Zalizniak, 2018) et sur celles de dictionnaires de référence des langues décrites, Mariia Orlova montre que cette polysémie s’observe dans les 11 langues étudiées, qu’elle est régulière dans chacune de ces langues, et enfin que la chaîne de glissements de sens comporte, selon les lexèmes et selon les langues, entre 2 et 5 sens attestés de la chaîne. L’étude met ainsi en lumière l’existence de patrons de polysémie régulière complexes récurrents à travers les langues et les structures cognitives qui leur sont sous-jacentes.