Remarques préliminaires
Les Nouveaux atlas linguistiques de la France (NALF), dont la réalisation a mobilisé pendant plus d'un demi-siècle une partie importante de la recherche dialectologique de France, comportent un volume d'informations richissime notamment dans les domaines lexical et phonétique, mais aussi en morphologie et morpho-syntaxe. Il est notoire que l'exploitation de ce patrimoine précieux reste extrêmement partielle, ce qui met en cause – après coup et à tort – le bien-fondé de sa constitution et l'investissement d'une énergie scientifique conséquente. La mise à profit des environ 80 volumes d'atlas galloromans1 – dont huit non publiés – demande toutefois un effort considérable, surtout dans une discipline où la ‘main d’œuvre’ est devenue rare.
Nous souhaiterions par la suite présenter un état des lieux des Nouveaux atlas, en les plaçant dans leur trajectoire génétique, et mener sur cette base une réflexion structurelle en vue d'une exploitation commune et harmonieuse de ce patrimoine linguistique inestimable2.
La proto-histoire des NALF : Albert Dauzat et l'ÉPHÉ
Le point de départ génétique des Nouveaux atlas se place comme on le sait dans le cadre de l'enseignement d'Albert Dauzat à l'École Pratique des Hautes Études. Cette dernière disposait à travers le xxe siècle de trois chaires de linguistique (gallo-)romane, dédiées à la philologie médiévale, à la dialectologie et au français moderne. La première, établie en 1868, est de grande tradition, mais elle n'est pas pertinente dans le présent contexte3. La dernière en revanche l'est devenue de manière secondaire, justement à travers la personne d'Albert Dauzat. Cet érudit polyvalent occupait la chaire du Développement moderne de la langue française créée en 1921, grâce à l'intérêt émergent pour la variation linguistique stimulé par la Première Guerre mondiale4. Sa nomination répondait à ses travaux sur La langue française contemporaine5 et l'Argot de la guerre6. Albert Dauzat dédia toutefois seulement une moitié de son enseignement aux évolutions du français non standard entre le xvie et le xxe siècle, en réservant d'emblée l'autre moitié à l'onomastique et plus particulièrement la toponymie galloromane7. Cette interrogation, pleinement étymologique, le rapprocha de la variation phonétique et lexicale dialectale, matière enseignée par son maître Jules Gilliéron, puis – depuis 1927 – par son ami Oscar Bloch. Après la disparition prématurée de Bloch en 19388, Dauzat assuma un troisième enseignement hebdomadaire pour pallier la suppression de la chaire de Dialectologie de la Gaule romane9.
C'est précisément dans ce cadre que Dauzat développa le projet d'un « Nouvel Atlas Linguistique de la France » sous forme d'atlas régionaux « en s'efforçant de serrer la réalité de plus près, en augmentant le nombre de points enquêtés et en adaptant le questionnaire à chaque région »10. Il semble évident que ce projet ait été inspiré par l'Atlas linguistique des Vosges méridionales de Bloch (1917), sachant qu'il n'est jamais évoqué dans les procès-verbaux des conférences d'Oscar Bloch ni encore dans le premier procès-verbal d’Albert Dauzat pour l'année 1937/38. La première mention, encore indirecte, apparaît dans l'annuaire de 1938/39 évoquant parmi les auditeurs « trois jeunes dialectologues qui vont prêter leur concours au nouvel atlas linguistique de la France : MM. Babin [...], Paul Lebel et Rostaing11 ». L'année suivante, Albert Dauzat est pleinement explicite : « La première conférence a été consacrée à l'Atlas linguistique de la France, dont la réfection est en préparation sous la direction de M. Dauzat12. »
Il semblerait donc que la paternité de l'idée revienne véritablement à Albert Dauzat, qui l'a poursuivie avec une extrême conséquence. Les seize années de son enseignement de dialectologie entre 1939 et 1955 seront en effet intégralement et presque exclusivement dédiées à ce projet, qui se précise et s'élargit au fur et à mesure. Les huit premières années sont vouées à la préparation du questionnaire, bipartite entre « un questionnaire général, qui sera demandé dans toute la France, et un questionnaire annexe, groupant les termes qui ne seront demandés que dans une ou plusieurs régions13 » ; ce questionnaire est « imprimé à la fin de l'année scolaire [= été 1946] et distribué aux enquêteurs avant les vacances14 ». Le séminaire de Dauzat intègre par ailleurs au fur et à mesure les linguistes de son époque impliqués dans ce grand projet, comme Charles Rostaing (dès 1938/39), Jacques Pignon (1939/40), Georges Straka et Adolphe Terracher (1941/42), Pierre Gardette (1945/46), Jean Séguy (1946/47) ou Geneviève Massignon (1950/51).
À son éméritat en 1947, Dauzat abandonna sa matière attitrée, la langue française moderne, poursuivie alors par Léon Wagner (1948-1978), puis par Bernard Quemada (1976-1989) et Claire Blanche-Benveniste (1989-1999). Il garda en revanche les enseignements d'onomastique et de dialectologie en poursuivant ainsi son grand projet jusqu'à sa mort en 195515, dans un dialogue de plus en plus étroit avec Jean Séguy et Monseigneur Gardette qui devaient orchestrer la suite de l'entreprise des NALF.
Avec la disparition de Dauzat, l'École Pratique abandonna l'engagement pour les atlas, pour lesquels elle avait toutefois été déterminante jusque-là. L'enseignement de dialectologie resta en suspens jusqu'en 1977, avant de donner lieu à une charge de conférences de « Géographie linguistique romane » ou, alternativement, de « Géolinguistique romane », puis de « Dialectologie et géolinguistique romanes ». L'équilibre de force était alors inversé puisque c'étaient désormais des protagonistes des atlas régionaux et de leur exploitation qui intervenaient de l'extérieur et non plus le directeur d'études de l'École Pratique qui animait le projet.
L'idée des atlas linguistiques représente ainsi un fil rouge dans le cheminement institutionnel et personnel de la dialectologie (gallo)romane à l'ÉPHÉ entre 1882 et 2011 dont voici un aperçu synthétique :
– charge de conférences puis maîtrise de conférences en Langues romanes
Jules Gilliéron | 1882-1894 (maîtrise de conférences en 1883) |
– chaire de Dialectologie de la Gaule romane
Jules Gilliéron | 1894-1926 (directeur d'études à partir de 1917) |
Oscar Bloch | 1927-1937 (directeur d'études) |
– intérim (enseignement dans le cadre de la chaire du français moderne)
Albert Dauzat | 1938-1955 |
– enseignement en suspens 1956-1977
– charge de conférences de Géographie linguistique romane / Géolinguistique romane, puis (depuis 2001) de Dialectologie et géolinguistique romanes
Gaston Tuaillon | 1978-1982 |
Jean-Claude Bouvier | 1983-1986 |
Marie-Rose Simoni-Aurembou | 1988-2000 |
Jean-Philippe Dalbera | 2001-2006 |
Elisabetta Carpitelli | 2010-2011 |
La trajectoire de la chaire de dialectologie à l'ÉPHÉ s'avère ainsi liée de manière intrinsèque à celle des NALF : après la réalisation de l'ALF par Gilliéron et Edmont, Bloch concrétise l'idée d'un atlas régional moderne à petite échelle. Il s'inscrit alors, comme l'ancêtre des atlas linguistiques romans, le Petit atlas phonétique du Valais roman (ALV) de Gilliéron dans une logique plus globale et rigoureusement interprétative. Dans cette lignée, Dauzat entreprend la rédaction du questionnaire avec une ambition plus vaste, qu'il poursuit sans toutefois ne serait-ce que co-signer un seul atlas16. Enfin, l'École Pratique renoue pendant plus de trois décennies dans son enseignement un lien avec le projet des NALF et ses retombées, le Thésaurus Occitan, ou thesoc17, et l'Atlas linguistique roman (ALiR). Ces séminaires sont alors restés un lieu d'échange pour les auteurs des atlas régionaux, même s'ils n'ont plus fonctionné comme un noyau fédérateur de ce projet aux dimensions désormais gigantesques. L'abandon d'un enseignement dialectologique propre en 2011 par l'École Pratique marque ensuite une rupture forte qui souligne et entérine la perte d'intérêt pour cette matière en France.
Cette évolution permet – et c'est ici que réside la raison de notre aperçu – de mieux expliquer les difficultés structurelles auxquelles se heurte le projet des NALF depuis les années 2000. Si les atlas physiques ont été publiés pour l'essentiel – mais pas intégralement (cf. infra section 3) –, leur exploitation linguistique n'en est toujours qu'à ses débuts. Rappelons qu'Oscar Bloch avait accompagné son atlas d'un dictionnaire (Lexique français-patois des Vosges méridionales, 1915), d'une description phonétique et grammaticale (Les parlers des Vosges méridionales, 1917) ainsi que d'une étude méthodologique novatrice concernant La pénétration du français dans les Vosges méridionales (1921), exploitant ainsi tout le potentiel de l'enquête dialectologique à une échelle régionale. Pour les NALF, déjà le premier pas, celui d'un répertoire lexical, n'est pas franchi, sachant que la matière est infiniment plus complexe que celle recueillie dans les 26 points de Bloch.
Mener à bien un tel projet suppose inévitablement de fédérer les efforts des différents acteurs, comme cela a pu être possible dans les années 1940, 1950 et 1960 dans le cadre de l'École Pratique d'abord, de l'Université catholique de Lyon ensuite. Le renouveau d'intérêt évident pour la dialectologie et la géolinguistique (gallo)romanes à travers les dernières années en France et en Europe permet de penser de nouveau dans la logique d'une stratégie scientifique plus globale.
Quant à l'École Pratique, pour clore ce chapitre, la chaire du Français moderne a été transformée en 2002 en Sociolinguistique diachronique romane (Michel Banniard, jusqu'en 2016) et ensuite en Linguistique romane (Martin Glessgen, depuis 2015), permettant ainsi d'intégrer de nouveau l'enseignement de Dialectologie et géolinguistique romanes18. Nous sommes bien entendu très loin d'un noyau fédérateur, mais éventuellement dans l'idée d'un lieu d'échanges.
Inventaire des atlas et de leur état d'avancement
À travers la deuxième moitié du xxe siècle, le projet des Nouveaux atlas a été réalisé de manière exemplaire, grâce aux efforts conjoints d'un grand nombre de linguistes engagés. L'inventaire détaillé qu'a dressé Guylaine Brun-Trigaud sur l'état de disponibilité des différentes séries fait immédiatement apparaître les dimensions et l'envergure de cette réalisation19. État des lieux minutieux et extrêmement complet, ce tableau fait ressortir d'une manière évidente le problème des séries non achevées, comme elle le formule elle-même :
Il serait éminemment souhaitable que la collection des Nouveaux Atlas linguistiques régionaux soit achevée et que les données inédites soient mises à la disposition des chercheurs, soit sous la forme d’une publication papier (aujourd’hui beaucoup moins coûteuse qu’autrefois), soit sous un format électronique disponible au téléchargement20.
Quatre années après le travail de Guylaine Brun Trigaud, il est possible d’actualiser l’état des lieux des atlas régionaux et leur disponibilité en mentionnant les travaux de recherches qui sont menés par différentes équipes aujourd’hui21. Certains projets ont été achevés récemment, avec une publication sur papier ‘traditionnelle’, comme, en 2016, le quatrième tome de l’Atlas linguistique de la Provence22 sous une forme remaniée pour atteindre un public plus large de non-spécialistes, ou l’Atlas linguistique et ethnographique de la Normandie, dont le questionnaire et les index ainsi que les cartes morpho-syntaxiques ont été publiés en 201923.
Il reste toutefois encore quatre volumes dont la publication est pleinement en suspens, présentés dans le tableau ci-dessous : les troisièmes volumes de la Bretagne romane et de l'Île-de-France, le quatrième volume de l'Ouest et le troisième du domaine picard, désormais en chantier à Lille24.
Figure 1.
Sigle | Titre | Volumes inédits |
ALBRAM | GABRIEL, G., CHAUVEAU, J.-P. Atlas linguistique et ethnographique de la Bretagne romane, de l'Anjou et du Maine. | ALBRAM 3 |
ALIFO | SIMONI-AUREMBOU, M.-R., Atlas linguistique et ethnographique de l'Île-de-France et de l'Orléanais. | ALIFO 3 |
ALO | MASSIGNON G., HORIOT B., Atlas Linguistique et ethnographique de l'Ouest. | ALO 4 |
ALPic | CARTON F., LEBÈGUE M., Atlas linguistique et ethnographique picard | ALPic 3 |
Tableau synthétique des volumes des NALF en suspens
Pour certaines entreprises, il semble difficile d’obtenir davantage d’informations sur une possible finalisation ou l’existence de données préparatoires inachevées. C’est le cas par exemple pour les données du troisième volume de l’atlas de la Bretagne romane, de l’Anjou et du Maine, l’ALBRAM, qui devraient être conservées à Nantes, mais que nous n'avons pas (encore) pu localiser.
Par ailleurs, les derniers volumes de quatre autres atlas linguistiques n'ont pas pu être publiés sous un format papier mais leurs données ont été intégrées dans le thesoc, initiative de Jean-Philippe Dalbera et développé depuis 1989 à l’Université de Nice sous l'initiative de Jean-Philippe Dalbera. Elles sont donc accessibles et peuvent être exploitées librement grâce à l’interface de consultation25. Il s’agit des atlas suivants :
- le quatrième volume de l'atlas de l'Auvergne et du Limousin
- le cinquième du Languedoc occidental,
- le quatrième et le cinquième du Languedoc oriental
Figure 2.
Sigle | Titre | Volumes concernés |
ALAL | POTTE J. C., Atlas Linguistique et ethnographique de l'Auvergne et du Limousin. | ALAL 4 |
ALLOc | RAVIER X., Atlas Linguistique et ethnographique du Languedoc Occidental. | ALLOc 5 |
ALLOr | BOISGONTIER J., Atlas Linguistique et ethnographique du Languedoc Oriental. | ALLOr 4 + 5 |
Tableau synthétique des volumes des NALF inédits accessibles via le thesoc
Sur la base du travail de Guylaine Brun Trigaud, nous avons pu mettre à jour l'ancienne carte élaborée par Séguy en 197326 qui donne une vue d'ensemble assez immédiate sur l’état des lieux actuel des atlas régionaux et leur disponibilité :
Notons par ailleurs que les atlas non-galloromans de territoires situés en France27 ou bien de l'occitan alpin en Piémont28 sont riches d’enseignements et la communication avec les équipes qui les élaborent est précieuse. La géolinguistique du domaine galloroman a perdu de son souffle mais ne s’est pas complètement arrêtée pour autant : plusieurs projets sont aujourd’hui en cours de réalisation dans différents laboratoires et progressent de manière indépendante. La plupart de ces nouvelles entreprises exploitent des ressources numériques, pour leur élaboration ou leur diffusion, car ces dernières offrent des solutions plus souples, plus efficaces et moins coûteuses. Initié par Patrice Brasseur dans les années 1980 et abandonné une première fois29, l’Atlas Linguistique des Côtes Atlantiques et de la Manche (ALCAM) a repris sous un format numériquement natif, réalisé à l’aide d’un logiciel SIG30 par les équipes de Daniel Le Bris et d’Alain Viaut. De même, une version numérisée du troisième volume de l’Atlas Picard, l’ALPic 3, est en cours, réalisée par Alain Dawson31.
Hors du continent européen, les variétés régionales de français ont été explorées par la géolinguistique. Bien avant l’Atlas des Petites Antilles de Jean Le Dû et Guylaine Brun-Trigaud32, achevé en 2013, le français traditionnel parlé au Québec et dans ses régions voisines est étudié dans l’Atlas linguistique de l’Est du Canada (ALEC)33. Pour le territoire de la Confédération Helvétique, à défaut d’un atlas linguistique global (le projet, initialement entrepris au début du xxe siècle par les rédacteurs du Glossaire des patois de la Suisse romande et contemporain de l’ALF, a malheureusement dû être interrompu prématurément34), et plus d’un siècle après le Petit atlas phonétique du Valais roman de Jules Gilliéron mentionné plus haut, l’Atlas linguistique audiovisuel du francoprovençal valaisan, ALAVAL, dirigé par Andres Kristol et Federica Diémoz, vient d’être finalisé35. Entièrement numérique, il propose un modèle original de cartographie linguistique interprétée, qui intègre le son et l’image originaux des enquêtes avec les témoins, et s’intéresse principalement à l’analyse de faits morpho-syntaxiques de cette petite partie de la Suisse, historiquement de langue francoprovençale. Alors que certains projets sont en cours ou viennent tout juste d’être achevés, d’autres commencent à voir le jour. À l’Université de Zurich, le projet d’un atlas morphosyntaxique de la Gascogne appelé MAGY36, à partir des matériaux de l’ALF, de l’ALG mais également de données issues de nouvelles enquêtes menées depuis l’été 2019, est une récente entreprise de Tania Paciaroni.
Si certains projets actuels, comme l’ALAVAL ou MAGY, reposent sur la collecte de nouvelles données lors de « collectages d’urgence37 », grâce au témoignage d’ultimes locuteurs primaires, d’autres cherchent avant tout à rassembler des matériaux collectés antérieurement d’une manière originale (en combinant plusieurs ressources, comme le fait l’Atlas pan-picard informatisé, APPI38) ou de rendre exploitable des matériaux restés inédits. Guido Mensching et Sandra Hajek ont par exemple entrepris la numérisation de l’Atlas linguistique de la Lozère (ALLo) de Rudolf Hallig (1902-64), resté inédit, dont le seul exemplaire est conservé à l’ATILF, à Nancy39 et dont les données ne sont accessibles que par l’intermédiaire du FEW40. De même, G. Brun-Trigaud met à profit les données de l’ALAL pour illustrer les parlers de la Creuse, en proposant 128 nouvelles cartes commentées41.
S’interroger sur le futur commun des atlas régionaux permet également de se poser la question des frontières linguistiques et des « effets de marge », lorsque l’on cherche à appréhender un domaine linguistique. Rassembler les différentes pièces découpées dans la « tapisserie » de la Galloromania, lors de l’initiative des Nouveaux atlas, pourrait faire apparaître de nouvelles lectures de l’espace. Ainsi, l’on pourra se demander comment intégrer les données de l’atlas des Pyrénées orientales d’Henri Guiter (ALPO) et le domaine catalan afin d’appréhender sur une base quantifiable les relations entre les variétés occitano-gasconnes et catalano-valenciennes. De la même façon les matériaux des atlas recouvrant le nord de l’Italie ou le Piémont sont toujours éclairants pour l’étude des variétés francoprovençales ou d’occitan oriental ou alpin.
Pour le domaine occitan, c’est cette mission qu’a entreprise avec succès le thesoc, riche d’1,2 million de données, à partir de la série des Nouveaux atlas. Comme nous l’avons vu précédemment, le thesoc a permis de réaliser l'intégration des ‘volumes’ cités plus haut sous un format informatique, ce qui serait également imaginable pour les autres volumes non édités ainsi que pour les atlas complémentaires que nous venons d'évoquer. Bien qu’il s’agisse sans le moindre doute de la voie la moins coûteuse et également la plus porteuse, la réalisation d’un thésaurus géolinguistique galloroman constitue un chantier très exigeant.
L'exploitation lexicologique et les glossaires et index des NALF
Les glossaires des NALF et l'entreprise du thesoc
Une fois réunis tous les matériaux des Nouveau atlas se pose la question de leur exploitation qui doit passer inévitablement par une indexation lemmatisée des formes dialectales.
L'absence d'une indexation rend les atlas difficiles d'accès et empêche dans les faits une utilisation dans une logique systématique, malgré certains outils précieux pour ‘naviguer’ entre les atlas régionaux, comme l’Index onomasiologique de Pierre-Henri Billy42. Peu de séries toutefois sont dotées d’un index de leur contenu. C'est le cas des atlas de la Bourgogne (ALB), du Centre (ALCe) et de la Champagne et de la Brie (ALCB). Le cinquième volume de l’Atlas Linguistique de la Gascogne (ALG) propose, seulement pour les verbes étudiés, une liste des lexèmes selon la forme gasconne de leur infinitif. L'inventaire le plus développé est celui de l’Atlas Linguistique et ethnographique du Lyonnais (ALLy), dont le cinquième tome rassemble des index (un index des mots comprenant les types lexicaux dialectaux étudiés dans les commentaires et un index des bases étymologiques) mais aussi les commentaires de Pierre Gardette, publiés après sa mort par ses collaborateurs·rice·s, permettant pour chaque mot de connaître l’histoire de la forme et de sa distribution. Plus récemment, Fernand Carton et Alain Dawson ont établi un index étymologique de l'atlas picard (ALPic)43. Pour l’Atlas Linguistique et ethnographique du Massif Central (ALMC) il existe des données inédites, qui forment un ensemble semblable au cinquième volume de l’ALLy. Conservées au format PDF à titre privé, elles n’ont pas été intégrées au thesoc.
Le seul répertoire intégral et étymologisé des formes dialectales concerne l'atlas de la Franche-Comté (ALFC), réalisé par son auteur, Colette Dondaine, dans son Trésor étymologique des mots de la Franche-Comté44. Ce dernier donne également les formes équivalentes des lexèmes traités dans des dialectes voisins, oïliques (en Lorraine) ou francoprovençaux (en Suisse romande) et il se clôt par un précieux « index des bases étymologiques ».
Nous ne nous arrêterons pas sur le cas de l'Atlas Linguistique de la Wallonie, l’ALW, qui est relativement avancé, mais aussi relativement complexe45. Parmi les dix volumes publiés, les tomes 1, 6-8, 15 et 17 contiennent chaque fois un index des formes dialectales et un index étymologique (le premier tome possède aussi un index des formes françaises correspondantes). Les index étymologiques corrigent et complètent le FEW. Ils fournissent également la référence à celui-ci pour les mots d'origine incertaine ou inconnue. En revanche, les index des tomes 3-5 et 9 ne répertorient que les formes dialectales sous leur forme française ou, le cas échéant, sous une forme neutralisée. Il existe également un index global de tous les mots français désignant les concepts traités46.
Ajoutons enfin que les données des Nouveaux atlas n’ont pu être exploitées que dans les articles récents du FEW, tandis que celles de l’ALF y figurent de manière systématique et (presque) intégrale47.
Lors de la journée d’études du 26 septembre 2019, Guylaine Brun-Trigaud a rappelé qu’un projet d’index des atlas linguistiques avait été initié dans les années 1990 mais s’était soldé par un échec, d’une part en raison de la suspension du GDR 09 par le CNRS en 1996 et d’autre part en raison de difficultés de communication entre les acteurs. Ce projet prévoyait « la constitution d’une base de données à l’échelle nationale et la publication d’index propres à chaque atlas 48 ». L’index spécifique devait permettre de relever l’ensemble des types lexicaux dans un atlas donné, cumulés et complétés par des informations étymologiques dans l’index global. Fernand Carton et Guylaine Brun-Trigaud ont mentionné les difficultés que présente le travail d’indexation des atlas pour le domaine d’oïl49. Toutefois, ils ont souligné sa dimension heuristique et son utilité, en en appelant à la communauté scientifique afin de tenter à nouveau de mettre en place une structure informatique ouverte et participative pour les index des atlas linguistiques régionaux50. Aucun résultat informatique du premier projet n’a malheureusement été rendu public. En revanche, l’ouvrage de Fernand Carton et Alain Dawson pour la Picardie peut être considéré comme un produit abouti issu de cette entreprise51.
Face à cette problématique des index, le thesoc représente sans doute la réponse la plus cohérente à cette lacune : une interface électronique a l'immense avantage de permettre l'alignement de plusieurs séries d'atlas, ce qui crée une plus-value considérable. Il est vrai que le thesoc ne concerne que six des vingt atlas galloromans de manière intégrale : c’est-à-dire les atlas de la Gascogne (ALG), du Languedoc occidental (ALLOc) et oriental (ALLor), de la Provence (ALP), de l'Auvergne et du Limousin (ALAL), du Massif Central (ALMC). Trois autres atlas sont partiellement intégrés au thesoc : la partie sud des atlas du Centre et du Jura et Alpes du Nord (ALJA), la partie sud-ouest de l'atlas de l'Ouest (ALO) et enfin la partie ouest de l'atlas du Lyonnais (ALLy). Cela représente plus de 30 % de la nomenclature des Nouveaux atlas. Le thesoc rassemble donc ainsi une proportion considérable des données dialectales du territoire. La carte suivante représente une vue d'ensemble de l'indexation des NALF.
Les analyses de Max Pfister
L'évident intérêt lexical des Nouveaux atlas a notamment été souligné dès 1965 par Max Pfister dans ses comptes-rendus des atlas de la Galloromania orientale et centrale. Ancien rédacteur du FEW, Max Pfister nous offre un regard extérieur sur l’entreprise des Nouveaux atlas régionaux, dont il se pose en utilisateur : il commente notamment les trois premiers volumes de l’ALCe, de l’ALFC et de l’ALJA ainsi que les quatre volumes de l’ALMC et de l’ALLR, qui comprennent un index alphabétique. Dans le compte rendu du premier volume de l’ALCe, Max Pfister souligne la productivité des années 1970 pour le renouvellement de la géolinguistique, et de l’année 1971 en particulier, qui a vu la publication des premiers volumes de l’ALCe, de l’ALO et de l’ALJA : « sans aucun doute, ces riches matériaux linguistiques donneront un nouvel élan à la géolinguistique et à dialectologie52 ». Après avoir salué la qualité de la réalisation cartographique de Pierrette Dubuisson pour l’ALCe, Max Pfister met en relief la « position lexicale particulière du bourbonnais » en identifiant des isoglosses le rattachant à tour de rôle à l'occitan, au francoprovençal et au franc-comtois et propose de comparer les données de l’Atlas avec le travail réalisé quelques années plus tôt par Simone Escoffier53. Il relève également certains types lexicaux isolés propres au Bourbonnais, comme le nom du peuplier, ọbre̜l f. (ALCe 130, Escoffier § 58, qui confirme ALF 1008 et FEW 24,297a, pour une petite zone entre la Nièvre et l’Allier).
Max Pfister observe par ailleurs l’intérêt que représente le rapprochement d’atlas linguistiques régionaux pour l’étude des zones de transition et de limites linguistiques, comme le Croissant. En effet, cette aire linguistique intermédiaire est caractérisée par ses traits mixtes entre oïl, oc et francoprovençal, pour la zone orientale que couvre justement l’ALCe. Encore peu étudié, du moins au regard de son importance comme aire de transition54, le Croissant se trouve dispersé sur quatre atlas régionaux (ALLy, ALO, ALCe et ALAL), qui ont chacun leurs particularités (questionnaires différents, dates de publication échelonnées) : cette « disparité embarrassante »55 présente de nombreux inconvénients auxquels les avantages d’un répertoire lexical commun apporteraient une compensation. Le domaine francoprovençal, que Max Pfister considère comme l’un des domaines les plus intéressants de la Galloromania56, souffre aussi de ce morcellement. L'ALJA, par exemple, ne couvre que le « francoprovençal central », notion dont l’auteur interroge la pertinence. En effet, pour appréhender l’ensemble du francoprovençal, « il est nécessaire pour l’utilisateur d’élargir les données de l’ALJA à l’Ouest et à l’Est »57 à l'aide de l’ALLy, de l’AIS et des TPSR.
Ces comptes-rendus denses offrent une première occasion d’explorer les multiples façons d’utiliser les ressources des atlas régionaux, du point de vue de la lexicologie historique. Max Pfister exploite ainsi les matériaux du premier volume de l’ALJA pour mettre en évidence les frontières internes du domaine francoprovençal avec un relevé de lexèmes. En particulier, il observe la ligne d’isoglosse frappante entre le Bugey et la Bresse, qui reflète l'ancienne frontière politique entre le royaume de France et la Savoie, et qui voit s’opposer des types lexicaux comme fau côté France vs fayard côté Savoie (sur la carte 526 « hêtre »), siza vs ve̜na (carte 184 « haie ») ou des formes issues du latin *recordu et des formes issues de l’ancien francique *waida pour le « regain » (carte 233). De même, il met en évidence les isoglosses lexicales qui réunissent le francoprovençal alpin et le piémontais, en prenant l’exemple de points sur les cartes sciure (carte 555) ou cuivre (carte 148).
Dans le compte-rendu du premier volume de l'ALFC (1975), Max Pfister réunit une série de lexèmes propres au francoprovençal qui confirment l'hypothèse, avancée par Jakob Jud en 1939 et étayée depuis par Andres Kristol (2004), Jean-Pierre Chambon (2005) et Jean-Pierre Chambon/Yan Greub (à par.) ou encore François Zufferey (2006), que le francoprovençal s'étendait nettement plus au Nord à l'époque médiévale58. C’est le cas du mot tsirõ, substantif masculin désignant un « petit tas de foin » (ALFC 265).
Les matériaux de l'ALMC (1965) et de l'ALLR (1990) permettent également à Max Pfister de proposer entre autres quelques nouvelles interprétations étymologiques du nom du lézard ou du bourdon en Lorraine59. Il relève aussi une série de germanismes significatifs de cette province frontière avec des variétés germanophones, comme les dénominations de la guêpe (des formes vṓs, wé̜z ou wáʃ venues de l’ancien bas francique waspa) et de l’ortie (des formes issues de l’ancien germanique schoch, carte 79) ou bien celui de la pomme de terre, emprunté plus récemment aux dialectes rhénans de l’ouest de l’Allemagne. En outre, comme dans de nombreuses autres régions de la France dans la deuxième moitié du xxe siècle, il évalue le degré d'avancement de la francisation en Lorraine et la façon dont certaines formes venues du français standard écrit ont remplacé les formes dialectales locales : la forme historique venue du mot *gallus a par exemple été remplacée par une forme coq60.
Dans la plupart de ses comptes-rendus, Max Pfister rappelle la nécessité du travail d’indexation pour mesurer l’apport des matériaux des atlas pour la lexicographie. Ainsi, pour l’ALJA, il estime nécessaire d’attendre la publication du quatrième et dernier tome dans lequel les index sont annoncés : ils constituent, pour lui « une partie indispensable pour l’évaluation des enquêtes linguistiques61 ». De même, il se joint à Mgr Gardette pour souhaiter que Pierre Nauton ajoute au répertoire des mots français de l’ALMC « un index typisé des formes dialectales, semblable à celui qui se trouve dans l’AIS62 ». Il va plus loin encore dans le compte-rendu de l’ALLR, dans lequel il propose lui-même une typisation lexicale des cartes, en reprenant le modèle du cinquième volume de l'ALLy. Prenant l'exemple de la carte ALLR 1236, « la petite colline », il relève et analyse les types dialectaux en présence : les formes kū́t/kṓt (correspondant au français ‘côte’), les formes bos/bas63, les formes issues de *crista64, celles issues de la base préromane hypothétique *mutt- ou celles qui présentent un suffixe diminutif -itta. En effet, il souligne que « l’apport majeur pour la linguistique que contient ce matériau primaire ne pourra être vu par l’utilisateur moyen des atlas linguistiques que lorsque les auteurs et les spécialistes de ces patois donneront des explications et des interprétations de leur spécificités65 ». C’est également ce qu’affirme nettement Jean-Pierre Chambon dans le compte-rendu des index élaborés par Gérard Taverdet pour l’ALB : « L’index des formes ou des types apparaît en effet comme une partie intégrante, indispensable, de toute entreprise atlantographique : on n’aurait affaire, autrement, qu’à une accumulation de matériaux bruts irrémédiablement voués à la sous-exploitation66 ».
Les prises de positions « internes »
Le point de vue externe d’un lexicographe et philologue de renom sur l’entreprise des NALF est avantageusement complété par le regard interne d’un auteur d’atlas linguistique. Les auteurs des Nouveaux Atlas ont eux-mêmes commenté dans les principales revues de romanistique le résultat des travaux de leurs collègues. Jean Séguy a proposé, par exemple, une analyse critique de l’atlas linguistique d’Andorre de Mgr Griera, dans lequel il discerne l’influence sur le catalan andorran des langues voisines (occitan, français et castillan)67 ou de l’ALPO d’Henri Guiter, qui explore le modèle de l’atlas « exhaustif », c’est-à-dire avec un réseau d’enquête à la granularité maximalement fine (un point d’enquête par commune), pour le catalan de France68. Mgr Gardette, pour sa part, s’est intéressé au volume 4 de l’ALMC et s’appuie sur son expérience pour faire des remarques sur la méthodologie employée, en particulier l’élaboration du questionnaire. L’auteur de l’ALLy rappelle le manque de coordination, déjà, lors des prémices de l’entreprise des NALF : « Au cours d’un colloque à Strasbourg en 1956, j’ai émis le vœu qu’un questionnaire commun soit adopté par tous, au moins pour une partie de l’enquête. Mais plusieurs atlas étaient déjà en chantier, et les diverses entreprises n’étaient guère coordonnées : mon vœu n’eut aucun écho69 ». De même, Jean Le Dû, auteur du Nouvel Atlas de Basse Bretagne et co-auteur, plus tard, de l’Atlas des Petites Antilles, deux terrains d’enquêtes très différents quant aux problèmes qu’ils posent à un géolinguiste, apporte ses réflexions d’atlantographe sur les volumes parus de l’ALEPO ou sur le deuxième volume du Nouvel Atlas de la Corse consacré au lexique maritime, dans lequel il relève plusieurs index (des mots corses, des notions et des dénominations scientifiques).
L’ALEPO et le NALC sont deux initiatives datant des années 1980, soit presque trente ans après les premiers atlas issus de l’entreprise initiée par A. Dauzat, l’ALLy et l’ALMC. Ce décalage temporel implique une inévitable évolution des outils de travail. Jean Le Dû mentionne en effet l’utilisation judicieuse des progrès de l’informatique par les linguistes turinois à l’origine de l’ALEPO : « un système de consultation souple permet de lire les index, de passer de la liste à la carte, de présenter carte et liste côte à côte, etc.70 » Il souligne que le NALC, comme l’ALEPO, a été conçu parallèlement à une base de données, qui a servi à réaliser les cartes de l’atlas. La Banque de Données de la Langue Corse71, en effet, est le modèle qui a inspiré le thesoc. Si Jean Le Dû s’est intéressé, pour la réalisation du NALBB, à l’informatisation des atlas linguistiques dès les années 198072, l’intérêt pour le développement des outils informatiques et le souci d’en faire bénéficier la lexicographie ou la géolinguistique, est aussi venu très tôt au concepteur du LEI, comme le rappelle Elton Prifti, qui est aujourd’hui le codirecteur de cette monumentale entreprise lexicographique 73.
Ce détour par les comptes-rendus de certains volumes des Nouveaux Atlas permet de faire écho à l’intérêt qu’ils ont suscité, dès leur publication. Des spécialistes reconnus, venus de différents horizons de la discipline, ont unanimement salué la richesse des matériaux que ces atlas renferment, en particulier du point de vue lexical. Le vocabulaire dialectal spécialisé, par exemple, obtenu par les questionnaires spécifiques des NALF, permet de compléter les matériaux existants et promettait une nouvelle moisson, plus fructueuse encore que celle de l’ALF, à ajouter au FEW, et une meilleure compréhension de l'histoire et de l'articulation des différentes aires lexicales des domaines galloromans (en particulier les zones de transition comme le Croissant ou le domaine francoprovençal), grâce à la confrontation des données des NALF entre elles mais également avec celles du FEW ou des sources anciennes (les matériaux de l’ALMC confrontés par Pierre Nauton aux textes des troubadours occitans comme Peire Cardenal74). Toutefois, tous les auteurs de ces comptes-rendus soulignent l’importance de concevoir, de manière cohérente et raisonnée, un moyen d’accéder à un répertoire des formes dialectales afin de commencer au plus tôt les analyses.
Réflexions pour l'avenir des Nouveaux atlas linguistiques : virtus unita fortior
Sur la base de ces constats généraux, et dans la lignée du thesoc, nous tenterons enfin de formuler dans notre optique d'utilisateurs des atlas quelques souhaits, peut-être ambitieux, pour les orientations à venir, afin de mutualiser les efforts et les forces de travail, et favoriser le développement de notre discipline. Il nous semblerait précieux, en effet, de pouvoir disposer d'un site internet et d'une base de données réunissant les données de tous les atlas galloromans (y inclus l'ALW). Cette base devrait comporter une lemmatisation de toutes les formes dialectales et idéalement aussi leur étymologisation. Enfin, les formes devraient être balisées en fonction des concepts en question, et, idéalement, hiérarchisées.
Il serait également utile et souhaitable d'avoir sur cette base de données des hyperliens réciproques entre les lexèmes et le FEW informatisé75. La représentation des données sous la forme de cartes variables et évolutives (par ex. les dénominations d'un concept donné sur tout le territoire) serait également une façon précieuse de préparer l’analyse des données. Pour finir, l’intégration complémentaire de l'ALF ferait partie intégrante de ce scénario rêvé de dialectologie et de géolinguistique.
Nous sommes naturellement conscients que nous en sommes loin, malgré la réalisation très avancée du thesoc, et que cet objectif ne peut pas être atteint facilement. Mais ce qu’il nous semblerait important – et l’occasion de la journée d’études « Quel dialogue numérique entre les atlas linguistiques galloromans » pourrait être un bon endroit pour lancer cette idée – serait que les acteurs potentiels s’accordent sur les contours précis d'une finalité commune. Sur cette base, des étapes réalisables pourraient être envisagées au fur et à mesure, de manière coordonnée. Nous pensons en effet que la dimension évolutive de l'informatique ouvre désormais une voie réaliste. Mais il serait indispensable de penser d'emblée à une réalisation conjointe de tous les acteurs. Il n'est pas nécessaire que tous travaillent sur les mêmes éléments, mais il faudrait que le chantier global soit commun.
Concrètement, il nous semble presque inévitable de prendre appui sur l'interface déjà existante du thesoc et de l'élargir aux séries d'oïl et francoprovençales. Cela demandera sans doute certaines adaptations, mais l'ouverture d'un site et d'une base de données différents et par la force des choses concurrents, rendrait un objectif commun beaucoup moins réalisable. Il faudrait toutefois d'emblée réfléchir sur l'interface entre le thesoc et le projet VerbaAlpina de Munich. Ce dernier intègre déjà les données orientales du thesoc et sa structure informatique est à la base de l'APPI qui devrait permettre l’accès aux deux collections de manière conjointe. Malgré les problèmes et les lourdeurs de programmation qu'une telle idée implique, elle nous semble essentielle, autant en vue de sa portée interprétative que pour éviter des déperditions d'énergies autrement inévitables. Rappelons que l'ALF a été numérisé indépendamment trois fois avec ses 1 420 cartes en format A0 : une fois par l’Université d’Innsbruck76, la deuxième dans le cadre de l’ANR SYMILA77 avec l’aide du CIRDOC78 et enfin dans le cadre des projets GéoDialect et CartoDialect, financés par le Labex Persyval79, puis développés par l’ANR ECLATS80.
Une coopération de ce type ne peut bien entendu ne pas se placer à l'échelle d'une seule université, d'un seul centre de recherche ou encore d'une seule demande de projet. Dans ce sens, il est heureux que les instances de recherche attendent aujourd'hui des collaborations entre les universités, les équipes et les pays. La réalisation de ces souhaits invite ainsi à réfléchir à l’échelle à laquelle situer la coopération entre les différents acteurs. Elle peut intervenir à plusieurs niveaux :
- de la structure linguistique commune et du choix d’une organisation comparable des données dialectales. Se mettre d’accord sur la façon de traiter les lemmes, les étymons, des gloses morphologiques ou syntaxiques, et l’ensemble des métadonnées permettant de reconnaître et d’étudier les formes dialectales ;
- de la structure informatique interactive permettant des aller-retours entre les différents ensembles de données et des interrogations communes ;
- de la structure institutionnelle qui pourra être sollicitée pour coordonner des travaux et les ressources humaines et financières qu’il sera possible de réunir.
Pour donner deux exemples concernant le premier point : le premier pas pour organiser les matériaux dialectologiques consiste en une lemmatisation, pour laquelle il faut viser d'après notre expérience une simplification maximale. Un lemme a comme fonction essentielle celle de permettre l'identification d'une entité lexématique ; c'est à dire l'identité d'une base non dérivée ou celle de la composition particulière entre une base et un ou plusieurs affixes. Les changements phonétiques héréditaires n'affectent pas l'identité ‘lexématique’. Dans les Documents linguistiques galloromans (DocLing) et dans le Dictionnaire électronique d'ancien gascon (DAGél), nous ne retenons par conséquent qu'un seul lemme pour une seule entité lexématique dans une langue donnée, et il est évident que la variance grapho-phonétique des formes à l'intérieur d'un lemme peut s'avérer très forte. Pour un éventuel thésaurus commun des données des Nouveaux atlas, il ne faudrait ainsi retenir, pour un type lexématique donné, pas plus de quatre lemmes : un pour le domaine d’oïl, un pour le francoprovençal, un pour l'occitan et un pour le gascon.
Un deuxième exemple concret concerne la correction des rattachements sémantiques erronés. Il y a en effet un nombre non négligeable de réponses dans les NALF qui fournissent un hyponyme pour un hypéronyme, ou l'inverse, ou encore un co-hyponyme pour un autre. Ces cas sont facilement identifiables, mais ils devraient mener à une correction systématique pour augmenter l'homogénéité des données.
La dimension informatique est peut-être la plus cruciale à l'heure actuelle : la réalisation d'interfaces – concrètement entre le thesoc, l’APPI, VerbaAlpina et le FEW – demanderait un effort non négligeable, mais elle ferait appel aux techniques de travail actuelles81 et elle créerait des potentialités considérables. C'est donc une question qui mérite une attention très particulière.
Enfin, d'un point de vue institutionnel, il serait certainement possible d’envisager, selon les volontés et les possibilités matérielles, une structure de consortium, qui réunirait les trois grands domaines galloromans permettant de réfléchir à un protocole commun, ou au moins compatible pour le traitement des données et d'articuler les travaux individuels. Serait-il envisageable dans cette optique qu’une équipe de chercheurs parmi les spécialistes actuels de la géolinguistique galloromane assume la responsabilité de s'accorder sur un site internet commun pour les Nouveaux atlas ? Un tel consortium pourrait très certainement compter sur le soutien personnel et institutionnel d'autres collègues.
D’un point de vue plus pragmatique, la poursuite des efforts pour la numérisation des matériaux bruts, dans un format image de bonne qualité (pour pouvoir supporter un agrandissement important), des cartes des atlas linguistiques régionaux serait déjà, dans un premier temps, une ressource précieuse et un moyen efficace d’accéder au matériau d’origine, si la saisie des données (manuelle ou par des techniques de reconnaissance automatiques OCR) oppose encore des obstacles matériels. Nous avons mentionné la numérisation de l’ALF et sa mise à disposition par le projet CartoDialect82, qui s’avère d’une très grande utilité et se dote de nouveaux outils d’exploration à chacun de ses développements, mais c’est également le cas de l’ALLy, dont les cartes numérisées sont stockées sur la plateforme ORTOLANG83, fruit d’une collaboration entre le laboratoire Dynamique du Langage (Université Lumière-Lyon II) et l’Institut Pierre Gardette (UCLy)84, ou de l’ALPic, dont les cartes sont disponibles sur le site du projet APPI85.
La dialectologie est l'une des plus anciennes parmi les disciplines de linguistique (romane). Elle s'instaure de manière spécifique dès 1879 avec la Gredner Mundart de Theodor Gartner, suivie de près d'un enseignement thématique à l'École Pratique en 1882. Si notre discipline a donné lieu depuis à des milliers de travaux monographiques et des centaines d'atlas linguistiques, elle est aujourd'hui menacée et un projet commun qui exploiterait et mettrait en valeur le potentiel exceptionnel des Nouveaux atlas pourrait contribuer à la renforcer. Une telle collaboration contribuerait sans aucun doute à garantir son avenir86.