Introduction
Cet article poursuit un double objectif : il s’agit d’une part de présenter les résultats d’une enquête permettant de rendre compte de la répartition géographique et de la vitalité de quelques lexies spécifiques au « français régional à substrat picard » (désormais FRP), c’est-à-dire au français que l’on parle grosso modo dans la région des Hauts-de-France (départements du Nord, Pas-de-Calais, de la Somme, de l’Aisne et de l’Oise) et sur une large frange occidentale de la Wallonie (province du Hainaut, v. Figure 1)2 ; d’autre part de mettre en rapport et de commenter les cartes que les résultats de ces enquêtes permettent de dessiner avec les cartes des atlas linguistiques consacrés aux dialectes galloromans, établies au siècle dernier3.
Plus précisément, nous nous intéressons à la vitalité et à l’aire d’extension d’une demi-douzaine de lexèmes, choisis parce qu’ils font partie de la liste des nombreux types lexicaux communs aux parlers dialectaux picards et au FRP : cinq d’entre eux concernent la façon de dénommer la pièce de tissu épaisse servant à nettoyer les sols, c.-à-d. l’objet que l’on appelle « serpillière » en français commun (outre serpillière, nous nous intéresserons aux types loque, pièce, torchon et wassingue dans les systèmes linguistiques à l’étude). Le type lexical suivant concerne la dénomination du « repas de midi » (ce qu’on appelle le déjeuner en français commun, que le type lexical dîner concurrence en FRP et en dialecte), alors que le dernier est relatif à l’emploi du verbe savoir pour exprimer une capacité physique dans un contexte négatif (comme dans l’exemple j’avais tellement mal au dos que je ne savais plus dormir, que l’on gloserait en français commun par j’avais tellement mal au dos que je ne pouvais plus dormir).
Au cours des deux dernières décennies, de nombreux auteurs ont montré que les français régionaux avaient une dynamique qui leur était propre, et que les spécificités (notamment lexicales) de ces variétés ne devaient pas être regardées seulement comme les survivances des patois qui en constituent aujourd’hui le substrat (Francard 1991 ; Chambon 1997a et b ; Chambon & Chauveau 2004 ; Chambon & Greub 2009). Si nous ne renions pas cet état de fait, nous faisons toutefois le pari avec Chambon (2006 : 767) que la documentation dialectologique constitue « un précieux révélateur des phases anciennes du français régional »4. L’idée de se baser sur les atlas dialectaux pour étudier l’évolution, en micro-diachronie, des aires et de la vitalité de certains items lexicaux du français régional n’est pas nouvelle : elle a été exploitée par de nombreux lexicographes travaillant dans le cadre de la lexicologie différentielle du français (voir notamment Thibault 1997, Rézeau 2001 et Chambon, Chauveau & Greub loc. cit.). L’originalité de la démarche, on le verra, réside plutôt dans l’utilisation de modèles statistiques permettant de juger de la significativité des écarts entre différentes groupes de participants (en tenant compte de leur âge), ainsi que du degré de précision aérologique de nos cartes.
Figure 1 : Entre France et Wallonie : le domaine du français à substrat picard et ses alentours. Les frontières internes délimitent les départements en France, les arrondissements en Belgique, les points indiquent les noms des préfectures de ces entités. Avec, pour la France, Ro = Rouen (Seine-Maritime), Be = Beauvais (Oise), Am = Amiens (Somme), Ar = Arras (Pas-de-Calais), Li = Lille (Nord), La = Laon (Aisne) et Ch = Charleville-Mézières (Ardennes) ; pour la Belgique Mc = Mouscron, To = Tournai, At = Ath, Mn = Mons, So = Soignies, Ni = Nivelles, Th = Thuin, Ch = Charleroi, Na = Namur, Di = Dinant, Ph = Philippeville.
Matériel
Documenter la variation lexicale en FRP
Les particularités lexicales du FRP ont fait l’objet de diverses recensions, du côté de la France (Carton & Poulet 1991, Rézeau 2001) comme de la Belgique (Doppagne 1979, Bal et al. 1994, Lebouc 2006, Francard et al. 2015). Les plus anciens ouvrages de cette liste ont été construits à la suite du dépouillement de sources essentiellement écrites (qu’il s’agisse de sources de première main (romans, presse, etc.) ou de seconde main (glossaires, cacologies, etc.), alors que les plus récents prennent en compte les résultats d’enquêtes de vitalité5. La façon dont ont été conduites ces enquêtes, de même que les items contenus dans les inventaires, n’étant pas comparable d’un ouvrage à l’autre, il nous a paru plus prudent de raisonner à partir des données d’une enquête indépendante. Dans le cadre d’un projet plus vaste, visant à cartographier les régionalismes du français d’Europe, nous avons mis en place plusieurs sondages faisant appel à la méthode de la « production participative »6. Dans ces enquêtes, après avoir fourni quelques informations personnelles destinées à l’exploitation sociolinguistique des données, les internautes étaient appelés soit à cocher dans une liste la ou les tournures qu’ils utilisent pour nommer le référent ou la situation présentée sur une image ; soit à indiquer, sur une échelle de 0 (= jamais) à 10 (= très souvent), à quelle fréquence ils utilisaient telle ou telle tournure. Il était demandé aux participants de répondre le plus naturellement possible, comme dans le cadre d’une conversation informelle avec des pairs vivant dans l’endroit où ils ont passé la plus grande partie de leur vie.
Pour cet article, nous avons utilisé trois des questions de l’enquête présentée dans Avanzi et al. (2016). Sur les 11 000 internautes qui ont pris part à cette enquête, nous avons retenu les réponses des 777 participants ayant indiqué avoir passé la plus grande partie de leur enfance dans l’un des départements français de l’aire linguistique que nous étudions dans cet article, contre 227 pour la partie de la Belgique à l’étude. Le Tableau 1 ci-dessous donne le détail du nombre de participants, de leurs âges en fonction du département/(groupe d’)arrondissement(s) où ils ont déclaré avoir passé la plus grande partie de leur enfance7.
Documenter la variation lexicale en picard
En ce qui concerne les données dialectales, outre les données contenues dans l’ALF, on dispose pour la partie hexagonale de l’aire picarde des données de l’ALPic, pour les aires voisines des données publiées dans l’ALN et l’ALCB ; pour la partie belge de l’aire picarde, les données réunies dans les volumes de l’ALW, qui couvrent également l’aire wallonne. Pour cette étude, nous nous sommes servi des points des atlas linguistiques et ethnographiques de la France par régions (ALPic et ALN) et de l’ALW pour cartographier les dénominations de la « serpillière » (v. Figure 2), alors que nous nous sommes servi des données de l’ALF pour les questions relatives au « repas de midi » et à l’usage du verbe savoir pour exprimer une capacité physique (v. Figure 8 et Figure 10)8.
Résultats
Méthode
Différents modules du logiciel R (R development Core Team 2016) ont été utilisés pour cartographier les résultats de ces enquêtes. Pour les fonds de cartes, nous avons utilisé les ressources mises à disposition par l’entreprise Stamen®, alors qu’en ce qui concerne les coordonnées spatiales (longitudes et latitudes des points et des polygones), nous nous sommes servi des données fournies par ArcGis®. Sur les cartes que nous présentons dans les sections suivantes, les points renvoient à un code postal (le code postal de la localité où le participant a déclaré avoir passé la plus grande partie de son enfance), les polygones délimitent les frontières d’un département en France, d’un arrondissement en Belgique. La teinte des polygones varie en fonction du pourcentage de répondants ayant donné telle ou telle réponse (dans le cas des questions à choix multiple) ou de la moyenne des valeurs de fréquence (dans le cas des questions à échelle de Likert) : plus la valeur de pourcentage ou de fréquence est élevée, plus la teinte est sombre, et inversement.
Par ailleurs, des modèles de régression avec la réponse comme variable dépendante9, et la région, l’âge des participants et l’interaction entre l’âge et la région des participants comme variables indépendantes, ont été conduits en vue de vérifier si les différences de pourcentage ou de valeurs de fréquence entre une ou plusieurs régions, tout en tenant compte de l’âge des participants, étaient statistiquement significatives. Compte tenu du grand nombre de régions à prendre en compte (12 au total), il n’était pas possible de comparer systématiquement toutes les régions dans un seul et même modèle. Aussi, nous avons procédé en trois temps. D’abord, nous avons comparé les moyennes de chacun des deux pays pour diagnostiquer s’il existait une différence significative entre les deux aires politiques. Pour évaluer les différences inter-régions ensuite, nous avons cherché s’il existait des différences significatives entre les régions à l’intérieur de chacun des deux pays, et avons isolé les régions qui s’opposaient au moins à l’une des autres à l’intérieur du même pays. Nous avons enfin effectué une autre analyse de régression pour vérifier s’il existait des différences entre les régions des deux pays alors mises à l’écart.
Les dénominations de la « serpillière »
L’enquête Euro-1 contenait une question relative à la dénomination de la « serpillière ». Outre le mot du français commun, la question proposait aux enquêtés une dizaine d’autres lexèmes, dont les variantes loque, toile, torchon et wassingue10.
Dans les parlers picards et environnants, on observe pour chacun de ces types lexicaux une répartition dans l’espace assez nette, comme le montre la Figure 2 ci-dessous. Au nord-est du Pas-de-Calais, on trouve quelques attestations du type toile, comme c’est le cas pour la plupart des locuteurs des dialectes normands (v. la situation du département de la Seine-Maritime), alors que dans le reste de ce département, comme dans le département du Nord, c’est le type wassingue qui a été donné par les témoins. Ce type est concurrencé au sud du Pas-de-Calais, comme dans le département de l’Oise, par le lexème serpillière du français commun (on peut d’ailleurs voir que de nombreux informateurs ont donné à la fois wassingue et serpillière, v. points 29-31, 41-42, 74-75 de l’ALPic). De l’autre côté de la frontière, dans les arrondissements de Tournai et de Mouscron, c’est le type wassingue qui est employé, comme c’est le cas à Lille ; plus à l’est, les témoins ont donné des réponses impliquant le type loque. On remarquera pour finir que le type torchon n’est pas employé par les informateurs picards : le type est attesté dans le département de la Seine-Maritime, et n’a été donné qu’une fois à Mouscron (v. point 6 en haut à droite de l’arrondissement de Tournai).
En FRP (Figure 3), la répartition géographique des types est assez similaire, même si on peut constater quelques différences notables avec ce qu’il se passe en dialecte, notamment en ce qui concerne les aires des types torchon et serpillière. Pour plus de précision, nous allons examiner les cartes de vitalité de chacun des types les unes à la suite des autres11.
Serpillière12
La Figure 4 ci-après montre le pourcentage de participants ayant coché la réponse serpillière. Pour les départements français, la moyenne est de 79,2% (min. = 63,1% pour le Pas-de-Calais ; max. = 90,9% pour la Somme). Entre les groupes d’arrondissements de Belgique, la moyenne est de 23,4% (min. = 12,2% pour le groupe At-Mo-So ; max. = 47,1% pour le groupe Mc-To).
Une première analyse de régression montre que le pourcentage obtenu pour la France (tous départements confondus) est significativement différent du pourcentage obtenu pour la Belgique (toutes régions confondues), donc que globalement, le mot serpillière est utilisé davantage dans cette partie de l’Hexagone que de l’autre côté de la frontière (χ²(1) = 7468,1 ; p < 0.001). Le modèle montre également que l’âge a un effet sur la réponse (χ²(2) = 7468,1 ; p < 0,001), mais que cet effet interagit avec le pays. Plus précisément, on constate qu’en France, plus le locuteur est jeune, plus il a tendance à choisir la réponse « serpillière » ; à l’inverse, plus il est âgé, plus il a tendance à répondre autre chose. En revanche, en Belgique, l’âge des répondants n’a pas d’impact sur la réponse « serpillière » vs « autre chose ».
Un second modèle rend compte de différences significatives à l’intérieur des Hauts-de-France (χ²(7) = 838,74 ; p < 0,001) : avec un score moyen de 68,4%, les départements du Nord et du Pas-de-Calais présentent des pourcentages plus bas que les départements de la Somme, de l’Oise et de la Seine-Maritime (87,4% en moyenne). De plus, la présence d’une interaction significative dans le modèle montre que l’effet d’âge est plus fort pour ces deux départements de l’ex-région Pas-de-Calais que pour les cinq autres.
Un troisième modèle (χ²(5) = 234,21 ; p < 0,05) a révélé qu’en Belgique, le groupe Mc-To, avec un pourcentage de 47,1%, se comportait différemment des groupes At-Mo-So (12,2%), Ch-Ph-Th (15,5%) et Di-Na-Ph (26,9%).
Enfin, nous avons conduit un quatrième modèle visant à évaluer les différences entre les départements du Nord et du Pas-de-Calais avec le groupe Ms-To, les trois aires qui présentaient des différences avec les autres aires à l’intérieur de la France et de la Belgique. Outre un effet d’âge pour le Nord et le Pas-de-Calais (v. supra), le modèle a montré qu’il existe une différence significative entre les deux départements français et la région de Tournai-Mouscron (χ²(3) = 621,35 ; p<0,001), en d’autres termes que la région belge présente un pourcentage d’emploi du type serpillière plus bas que chacun des deux départements français, qui ne se différencient pas entre eux.
En résumé, on observe que le mot serpillière est utilisé davantage en France qu’en Belgique. On constate toutefois qu’en France, ce lexème est davantage concurrencé par ses synonymes régionaux dans les départements du Nord et du Pas-de-Calais qu’ailleurs, notamment chez les participants âgés ; qu’en Belgique, les locuteurs de la région Mc-To utilisent davantage ce mot que les locuteurs du reste de la Belgique. On remarque toutefois que le pourcentage du Nord-Pas-de-Calais reste supérieur à celui du groupe Mc-To.
Loque13
La Figure 5 présente le pourcentage d’emploi du mot loque d’après les résultats de l’enquête d’Avanzi et al. (2016). En France, les pourcentages présentent une moyenne de 17,1% (min.= 1,2% pour le Pas-de-Calais ; max.= 57,5% pour l’Aisne). En Belgique, le pourcentage moyen atteint 25,3% (minimum = 18,1% pour le groupe At-Mn-So ; max.= 38,7% atteint pour Nivelles).
Un premier modèle permet de révéler l’existence de différences significatives entre la France et la Belgique (χ²(2) = 2524,6 ; p < 0,001), le pourcentage d’emploi de la variante loque étant plus élevé en Wallonie que de l’autre côté de la frontière.
Un second modèle montre qu’à l’intérieur de la France, la situation n’est pas homogène (χ²(7) = 376,39 ; p < 0,001) : les départements des Ardennes et de l’Aisne (avec un pourcentage moyen de 37,3%) se distinguent des quatre autres départements (qui présentent un pourcentage moyen de 4,5%)14. La présence d’une interaction avec l’âge rend compte du fait que, dans ces deux départements, l’usage de ce lexème est vieillissant (l’effet signale que plus les informateurs sont âgés, plus la probabilité qu’ils donnent la réponse « loque » est élevée ; et inversement, plus les informateurs sont jeunes, plus la probabilité qu’ils répondent autre chose que « loque » est élevée).
En Belgique, le troisième modèle ne permet pas de mettre le doigt sur l’existence de différences significatives entre les (groupes d’)arrondissements, ce qui veut dire que les nuances de couleur que l’on peut observer sur la Figure 5 sont dues au hasard.
Enfin, nous avons comparé chacun des pourcentages des départements de l’Aisne et des Ardennes avec les pourcentages de l’ensemble des arrondissements de Belgique (d’une moyenne de 25,3%) dans un quatrième modèle. Nous avons ainsi pu constater qu’en ce qui concerne l’emploi du mot loque, les participants des départements de l’Aisne et des Ardennes ne se comportent pas différemment des participants de la moitié ouest de la Wallonie (χ²(3) = 742,76, n.s.).
En résumé, on observe un pourcentage d’emploi du mot loque plus important en Belgique qu’en France. Toutefois, cette différence mérite d’être nuancée par le fait que tous les départements de France ne sont pas à mettre sur le même plan. Les Ardennes et l’Aisne présentent des pourcentages plus élevés que les autres départements français, et ces pourcentages ne sont pas différents de ceux que l’on relève pour les régions de Belgique. Il faut toutefois souligner que pour les deux départements français, l’item loque est vieillissant, qui n’est pas le cas en Belgique.
Torchon15
La carte suivante (v. Figure 6) donne une représentation cartographique des variations qui touchent l’usage du lexème torchon. En France, le mot est très peu employé (minimum = 0% pour la Somme et les Ardennes, maximum = 7,4% pour le Nord, moyenne = 2,9%), alors qu’en Belgique il jouit d’une vitalité significativement plus élevée (minimum = 75,7% pour les arrondissements du groupe Ch-Ph-Th, maximum = 92% pour les arrondissements du groupe Di-Na-Ph, moyenne = 84,3%), comme le confirme l’analyse de régression (χ²(2) = 1264,8 ; p < 0,001), qui révèle, en plus, une interaction intéressante entre le pays et l’âge des participants. On constate qu’en France, l’âge des participants n’a aucun effet sur l’usage du mot torchon, alors qu’en Belgique, plus les participants sont jeunes, plus ils ont tendance à utiliser ce mot.
Sans surprise, en France, les différences entre départements ne sont pas significatives (χ²(7) = 200,21 ; n.s.). En d’autres termes, le mot est aussi peu employé dans le Nord-Pas-de-Calais que dans les autres départements. En Belgique, même constat : les différences ne sont pas significatives (χ²(5) = 201,85 ; n.s.).
En résumé, on observe pour l’usage du mot torchon des différences significatives entre la France et la Belgique, mais pas de différence à l’intérieur de ces deux pays. On relève toutefois que l’usage du mot torchon est « moderne » en Belgique : la probabilité d’utilisation du mot est plus grande chez les participants jeunes que chez les participants âgés.
Wassingue16
La carte de wassingue (v. Figure 7 ci-après) montre que ce mot est davantage employé en France qu’en Belgique : on constate en effet des pourcentages d’emploi significativement plus hauts en France (moyenne = 31,7% ; minimum = 4,86% pour la Seine-Maritime ; maximum = 71,9% pour le Pas-de-Calais) qu’en Belgique (moyenne = 2,3% ; maximum = 11,7% pour le groupe Mc-To ; mininum = 0%, partout ailleurs)17.
À l’intérieur de la partie de la France à l’étude, les résultats du modèle de régression indiquent des différences notables entre les participants des différents départements (χ²(7) = 1054,27 ; p < 0.001). En pratique, on observe la hiérarchie suivante : avec 5,46% en moyenne, les départements de la Seine-Maritime et des Ardennes présentent des valeurs plus basses que les départements de l’Aisne, de la Somme et de l’Oise (25,1% en moyenne), qui présentent quant à eux des différences significatives avec les départements de l’ex-région Nord-Pas-de-Calais (67,9% en moyenne). Une interaction avec l’âge indique que ce terme est vieillissant dans ces deux derniers départements (l’effet signale que plus les locuteurs sont âgés, plus la probabilité qu’ils donnent la réponse « wassingue » à cette question est élevée).
En Belgique, la région Mc-To, qui est la seule où la réponse wassingue a été choisie (11,75%), se différencie de toutes les autres (χ²(5) = 24.91, p < 0.05).
Dans un dernier modèle, nous avons comparé les scores de Mc-To avec ceux obtenus pour chacun des départements de France, l’idée étant de vérifier si Tournai se comporte différemment de l’un des départements français. Les résultats nous laissent penser que Mc-To se comporte de la même façon que les départements de la Seine-Maritime et de la Somme (χ²(8) = 1073.72, p < 0.001), c’est-à-dire qu’il présente des différences significatives avec tous les autres départements sauf ces deux-là.
En résumé, on fait face à une grande hétérogénéité à l’intérieur de la France, les départements du Nord et du Pas-de-Calais présentant des pourcentages plus élevés que ceux de l’ex-région Picardie, qui eux-mêmes présentent des pourcentages plus élevés que les départements à substrat non-picard (la Seine-Maritime à l’ouest, les Ardennes à l’est). On observe également un effet d’âge dans les départements du Nord-Pas-de-Calais, qui indique que le terme y est vieillissant. En Belgique, le mot wassingue n’est connu que des participants ayant passé leur enfance dans l’arrondissement de Mouscron ou dans celui de Tournai. Le pourcentage atteint pour cette partie de la Belgique demeure assez bas par rapport aux départements français à substrat picard.
Les dénominations du « repas de midi »
Dans les dialectes galloromans d’oïl, notamment dans les dialectes picards et les parlers qui les entourent, le « repas de midi » était communément appelé dîner, comme le montre la Figure 8, où nous avons typisé les diverses variantes phonétiques issues du latin DISJEJUNARE (FEW 3, 94b).
Jusqu’à la fin du xviiie siècle environ, le triptyque déjeuner/dîner/souper désignait communément les trois repas de la journée. À Paris, l’heure du dîner a reculé aux alentours de 17h à partir de la fin du xviiie siècle, puis jusqu’à l’heure où l’on soupait auparavant au xixe siècle, de sorte que, dans cette région, le mot dîner a commencé à être utilisé pour désigner un repas différent de celui que l’on prenait en province (voire directement au-delà des portes de la capitale19). À l’heure actuelle, l’usage parisien s’est imposé dans la norme française, et le mot dîner au sens de « repas de midi » est signalé dans les dictionnaires de grande consultation comme un archaïsme, voire un régionalisme – v. p. ex. TLF). Si on considère avec Goosse (1989 : 7) que la situation de l’ALF reflète la situation du français populaire et rural il y a près d’un siècle20, force est de constater que le type a aujourd’hui perdu du terrain dans les Hauts-de-France, alors qu’il résiste assez bien à l’ouest de la Wallonie, comme on peut s’en rendre compte sur la Figure 9 :
Les résultats de l’analyse de régression montrent que le mot dîner pour désigner le « repas de midi » est effectivement plus employé en Belgique (moyenne = 80,2% ; min. = 67% pour Nivelles ; max. = 89,3% pour le groupe Di-Na-Ph,) qu’en France (moyenne = 8,3% ; min. = 0,3% pour l’Oise, max. = 25,9% pour le Pas-de-Calais)22. Ces analyses montrent également qu’en France comme en Belgique, plus les informateurs sont âgés, plus ils ont tendance à utiliser la variante dîner.
En Belgique, la situation est assez homogène, malgré une petite différence entre le groupe Di-Na-Ph et Nivelles (χ²(2) = 3704,7 ; p < 0.05). En France, l’analyse de régression montre que le pourcentage calculé pour le département du Pas-de-Calais (25,9%) est supérieur à tous les autres (χ²(7) = 544,85 ; p < 0,001).
Finalement, un modèle visant à comparer les participants du Pas-de-Calais avec les participants de Belgique (toutes régions confondues) montre que malgré tout, le pourcentage du département français reste en-deçà des pourcentages de l’ensemble des arrondissements de Belgique (χ²(2) = 477,68 ; p < 0,001).
En résumé, on peut donc dire qu’en France, le mot dîner mérite bien son étiquette de régionalisme archaïsant ; les résultats montrent en effet qu’il n’est guère utilisé qu’en Pas-de-Calais. En Belgique en revanche, il fait partie de la norme locale, et n’est pas concurrencé par le terme du français commun.
Le verbe savoir
La dernière lexie à l’étude est le verbe savoir, employé au sens de « pouvoir ». D’après le DRF23, il s’agit d’un usage archaïque en français, qui a été maintenu dans les régions du grand Nord de la France, sans doute sous l’influence du substrat germanique24.
Dans les dialectes galloromans, le type était connu dans les dialectes wallons, lorrains et champenois, et seulement sur une petite partie du domaine picard25.
En FRP, les résultats de notre enquête montrent que la vitalité du terme est variable selon le pays. Comme on peut le voir sur la carte ci-après (v. Figure 11), les participants ont indiqué employer le verbe savoir de capacité avec une moyenne de 1,2 en France (minimum = 0,2 dans la Somme ; maximum = 3,3 dans le Nord), contre en moyenne 5,4 en Belgique (minimum = 4,8 pour la région Di-Na-Ph, maximum = 6,5 pour la région At-Mn-So)26. L’analyse de régression a révélé que la différence entre les deux pays était significative (χ²(2) = 1998,4 ; p < 0,001), en d’autres termes que la fréquence de savoir de capacité était significativement plus grande en Belgique qu’en France.
En France, un effet de l’origine du participant a été trouvé (χ²(7) = 5860,4 ; p < 0,001). En pratique, il ressort que la moyenne des scores obtenus pour les participants du département du Nord est nettement supérieure aux moyennes obtenues pour les autres départements (y compris par rapport au département du Pas-de-Calais, qui présente une moyenne de 1,3). Une interaction entre le département et l’âge montre en outre que la fréquence d’utilisation de savoir est dépendante de l’âge : dans le département du Nord, plus le participant est âgé, plus il a tendance à utiliser ce verbe ; à l’inverse, dans les autres départements, plus le participant est âgé, moins il a tendance à l’utiliser.
Au contraire, dans la Wallonie occidentale, la situation est homogène : les moyennes pour chacun des groupes d’arrondissement ne se distinguent pas significativement les unes des autres (χ²(5) = 95,136 ; p < 0,001).
Enfin, nous avons comparé les fréquences obtenues pour le département du Nord avec les moyennes obtenues pour la Belgique (toutes régions confondues). Les résultats ont montré que les moyennes du département du Nord restent inférieures aux moyennes obtenues pour la Belgique (χ²(2) = 613,88 ; p < 0,001).
En résumé, on observe que le verbe savoir de capacité est utilisé en Belgique avec de hautes fréquences, alors qu’en France cet usage ne se maintient que dans le département du Nord. En France, l’usage de ce verbe est également dépendant de l’âge des participants : il est vieillissant dans le Nord, alors qu’ailleurs les fréquences sont plus élevées chez les jeunes participants.
Classification automatique
Afin de rendre compte de la distance entre les régions géographiques en fonction des valeurs obtenues pour l’emploi de chacun des types lexicaux étudiés dans cet article, nous avons opté pour une classification hiérarchique qui prend la forme d’une représentation arborescente27. La classification fait apparaître une première différenciation entre la France d’un côté, et la Belgique de l’autre. À l’intérieur de la France, on voit que les deux départements de l’ancienne région Nord - Pas-de-Calais forment un premier groupe, les quatre autres départements un second groupe. À l’intérieur de ce second groupe, le noyau est constitué des départements de l’Oise et de la Somme, auxquels se greffent de part et d’autre l’Aisne et la Seine-Maritime. À l’intérieur de la Belgique, les distances entre les groupes d’arrondissements sont moins importantes que les distances entre les groupes de départements en France. On peut toutefois remarquer l’écart qui sépare le groupe Mc-To du reste des régions de la Wallonie occidentale.
Discussion et conclusion28
En matière de régionalismes dans le domaine du français à substrat picard, on peut constater, à la lumière des résultats obtenus à la suite de l’analyse de six lexèmes, qu’il y a bien une contrainte de frontière politique quant à la distribution des régionalismes. Sous divers aspects, la France apparaît moins conservatrice que la Belgique. Elle est ainsi moins résistante face aux innovations venues du français commun, comme le montre l’usage de plus en plus important de mots comme serpillière pour désigner la pièce de tissu pour lessiver les sols, ou la disparition presque absolue du mot dîner pour désigner le « repas de midi », qui a fait désormais place au mot déjeuner, même dans les régions les plus éloignées de Paris. Bien que certains régionalismes se maintiennent, les statistiques ont montré qu’ils étaient en général vieillissants. En Belgique, rien de tel. Les participants, sans doute protégés de l’influence de Paris29, opposent une résistance beaucoup plus importante aux innovations venues du français commun de l’Hexagone, ce que souligne le maintien de régionalismes archaïsants comme dîner et savoir. Il ne faudrait toutefois pas croire que le français ne connaît pas de dynamique interne en Belgique. On a vu avec l’exemple du torchon que ce mot est connu aujourd’hui sur une aire beaucoup plus étendue que dans les patois du siècle dernier : il constitue aujourd’hui le terme de référence dans le français parlé en Belgique pour désigner la serpillière30. Le fait que les jeunes participants utilisent davantage ce mot qu’un autre par rapport aux informateurs âgés suggère qu’il s’agit d’un changement en cours, ou du moins récent.
En ce qui concerne les rapports entre aires dialectales et aires régionales, il ressort de notre étude que les frontières de l’un et de l’autre système coïncident généralement. Le type loque connaissait une aire d’extension contenue essentiellement dans l’Aisne, les Ardennes et l’ensemble de la Belgique (exception faite de l’arrondissement de Tournai). Les frontières de l’aire actuelle d’emploi de ce vocable ont très peu bougé si on compare les deux systèmes. Même constat pour le type wassingue, qui occupe le même espace en FRP qu’en dialecte, c’est-à-dire qu’il se retrouve dans les départements du Nord, du Pas-de-Calais et dans les arrondissements de Mouscron et de Tournai. En dialecte, le verbe savoir de capacité était connu dans toute la Belgique (et dans le sud des Ardennes), mais à l’ouest, il dépassait à peine la frontière franco-belge (points 281 et 295 de l’ALF, v. Figure 10). Aujourd’hui, comme on l’a vu, il ne connaît pas une vitalité notoire dans les départements de Hauts-de-France, mise à part dans le département du Nord, frontalier avec la Belgique. En d’autres termes, cette étude nous apprend que, mis à part l’archaïsme dîner en France, les aires d’extension des régionalismes examinés sont restées stables, dans la mesure où ces aires n’ont pas diminué (ni même augmenté) dans les dernières décennies.
On terminera en soulignant le statut particulier, dans cette étude, des départements du Nord, du Pas-de-Calais et du groupe d’arrondissement Mc-To. On a vu que ces régions ne se comportent pas comme les autres régions du pays dans lequel elles sont localisées. Si des facteurs comme celui du substrat dialectal peuvent expliquer ces différences (ces deux départements n’étaient pas en contact direct avec des localités où d’autres dialectes étaient parlés), il ne faut pas oublier le statut de la ville de Lille, qui joue le rôle de centre sur le plan historique, géographique, culturel et économique, et qui contribue de fait au maintien de certaines particularités linguistiques dans le français de cette région, indépendamment de la frontière politique qui sépare les provinces belges des départements français.