Évaluation de l’exposition en zones urbaines à la pollution atmosphérique : méthodes existantes et application aux PM10 en France métropolitaine

  • Assessment of urban population exposure to atmospheric pollution: existing methods and application to PM10 in France

DOI : 10.4267/pollution-atmospherique.1517

p. 197-209

Abstracts

L’évaluation des impacts sanitaires liés à la pollution atmosphérique requiert la connaissance quantifiée de l’exposition des populations. Cette exposition peut être mesurée ou estimée, individuellement ou collectivement. Au plan collectif, plusieurs approches permettent d’estimer la répartition spatiale des expositions : 1) l’approche dite « déterministe » part de l’inventaire des sources et de leurs flux d’émission et calcule les concentrations atmosphériques résultantes, 2) l’approche dite « probabiliste » spatialise des résultats de mesures issues du réseau de surveillance de la qualité de l’air par interpolation géostatistique. Outre leurs incertitudes propres, la pertinence de ces deux approches dépend des objectifs de l’étude des impacts sanitaires. Concernant la prévision des bénéfices sanitaires attribuables aux normes limitant les émissions des véhicules routiers, une combinaison des deux approches s’avère nécessaire. Cette combinaison est possible par l’intermédiaire des méthodes géostatistiques, qui présentent en outre l’avantage de fournir une estimation des incertitudes liées à la cartographie du polluant. L’objectif de cette étude est donc de tester la faisabilité d’une approche combinée déterministe/ probabiliste pour la détermination de la répartition spatiale de l’exposition moyenne annuelle aux PM10 en France métropolitaine en 2000. Elle fait partie d’une étude portant sur l’évaluation des impacts sanitaires de la pollution atmosphérique liée au trafic routier dans les zones urbaines, en se focalisant en particulier sur les enfants et en comparant les situations en 2000 et en 2010. Cette étude s’inscrit dans le cadre du programme UNECE-WHO Pan European Program for Transport, Health and Environment (THE PEP Project): « Transport-related health impacts and their costs and benefits with a particular focus on children ».Les avantages et inconvénients des méthodes permettant d’évaluer l’exposition des populations à la pollution atmosphérique sont tout d’abord discutés. Le cas d’étude et les principales étapes d’une combinaison géostatistique sont ensuite présentés, ainsi que les résultats obtenus pour l’évaluation des populations exposées aux PM10 en France en 2000.

Health Impact Assessment (HIA) associated to air pollution requires a quantified knowledge of population exposure. This exposure may be measured or estimated, individually or collectively. From a collective point of view, several approaches allow a spatial estimation of population exposure: 1) a so called “deterministic” approach which transforms emissions derived from inventories into atmospheric concentrations, 2) a so called “probabilistic” approach which consists in spatializing concentrations obtained from an air quality monitoring network, with geostatistical techniques. Despite their respective uncertainties, the relevance of both approaches depends on the objective of the HIA. To predict health benefits attributable to regulatory norms limitating traffic emissions, these approaches have to be combined. Geostatistics allow this integration and give access to an estimate of the uncertainty associated to the spatial estimation of the pollutant. The goal of the present work is to evaluate the feasibility of such a combination of approaches for the spatial estimation of population exposure to PM10 annual means in France in 2000. It is coming from a study about health impact assessment of air pollution attributable to road traffic in urban areas in 2000 and 2010, with a focus on children. This study has been realized in the framework of the UNECE-WHO Pan European Program for Transport, Health and Environment (THE PEP Project): “Transport-related health impacts and their costs and benefits with a particular focus on children“.
Advantages and drawbacks of the existing methodologies for air pollution mapping dedicated to population exposure are first discussed. Then, the case study and the main steps of a geostatistical approach are presented, together with the results obtained in terms of PM10 mapping and population exposure in 2000.

Outline

Text

1. Introduction

Les normes européennes concernant les moteurs, les échappements et les carburants des véhicules routiers visent, notamment, à limiter les impacts sanitaires liés à la pollution de l’air générée par le trafic routier. Cet objectif est fondé sur le constat, fait par les études épidémiologiques dans de nombreux pays d’Europe, que la pollution ambiante augmente la mortalité et la morbidité associée, principalement cardiovasculaire et respiratoire [Atkinson et al., 2001]. Il semble donc intéressant d’évaluer le potentiel de bénéfice sanitaire imputable aux normes EURO IV et V qui entreront prochainement en vigueur.

D’une manière générale, pour estimer des impacts sanitaires il est nécessaire de connaître et de quantifier l’exposition des personnes. Concernant l’exposition collective en zone urbaine liée aux émissions du trafic routier, deux types d’approche sont possibles. La première, (dite « probabiliste »), est basée sur les données des réseaux de surveillance de la qualité de l’air. On part des concentrations mesurées en quelques points de l’espace pour déduire les concentrations en tout point d’une zone géographique donnée. Les résultats de mesure sont donc répartis dans l’espace au moyen d’outils géostatistiques. Ces outils sont classiquement utilisés en qualité de l’air depuis plusieurs années pour cartographier des pollutions atmosphériques à l’échelle urbaine [Cressie, 1998], régionale [Roth, 2001] ou nationale [Jeannée, 2003]. Au-delà de la cartographie elle-même, la géostatistique permet de quantifier les incertitudes associées aux niveaux de concentrations estimées et de prendre en compte ces incertitudes lors de l’évaluation de l’exposition des populations [Deraisme et al., 2002, Perron et Jeannée, 2005]. Cependant, les données ne sont parfois disponibles qu’en un nombre limité de points, en raison de leur coût évident d’acquisition. Il en découle que d’assez vastes zones peuvent être dépourvues de mesure et qu’une interpolation spatiale du champ de concentration basée exclusivement sur ces mesures risque de présenter des incertitudes très élevées, quelle que soit la technique d’interpolation mise en œuvre. De plus, cette approche, robuste d’un point de vue de santé publique, ne permet pas de dissocier ce qui vient du trafic routier et ce qui vient des autres sources (bâtiment, industrie, agriculture…). Enfin, si l’on peut analyser les tendances temporelles passées, la prévision des concentrations futures est très hypothétique. De fait, il n’est pas possible de prévoir l’effet des nouvelles normes sur la qualité de l’air. Une étude utilisant l’approche probabiliste et réalisée en Autriche, en France et en Suisse sous l’égide de l’OMS a été publiée en 2000 [Kunzli et al., 2000].

La seconde approche (dite « déterministe ») consiste, en utilisant l’inventaire des sources émettrices de polluants atmosphériques présents dans un espace géographique donné, à calculer les concentrations dans l’air résultant des flux d’émissions de chaque source. Cette approche est souvent utilisée pour évaluer l’impact d’installations industrielles au cas par cas. À l’échelle d’un territoire national, elle suppose l’intégration d’un très grand nombre d’informations et des codes de calcul complexes, notamment pour estimer la formation secondaire de polluants à partir de gaz précurseurs émis initialement. Le traitement informatique de ces données nécessite une puissance de calcul peu commune. En revanche la modélisation d’une situation future est possible, de même que l’intégration de nouvelles normes d’émissions pour chaque type de source.

L’intérêt évident de cette approche est aussi sa cohérence physico-chimique et la possibilité qu’elle offre de calculer ou de prévoir des champs de concentration de polluants sur des zones où peu de données de mesure sont disponibles. Par contre, de nombreuses incertitudes existent dans ces modèles, notamment en ce qui concerne les PM10, les cadastres d’émissions des particules de combustion [Liousse et al., 1996] et la fraction des aérosols secondaires, issus de transformations physico-chimiques à partir de gaz précurseurs [Guillaume et Liousse, 2006]. De surcroît, ces modèles peuvent exiger des temps de calculs élevés ne permettant raisonnablement, dans le cas des modèles disponibles lors de la réalisation de cette étude, la simulation de champs de concentration que pour quelques jours. De plus, pour que de tels modèles couvrent la France entière, les limitations informatiques actuelles imposent une maille d’environ 10 km × 10 km, et les concentrations réelles peuvent se trouver diluées, notamment en milieu urbain. Des modèles plus récents permettent de s’affranchir en partie de ces limitations [Bessagnet et al., 2004].

Afin de combiner les avantages et de palier les inconvénients respectifs des deux approches, il semble donc intéressant de combiner à la fois la cohérence spatiale du champ de concentrations issu de la modélisation déterministe avec les données à petite échelle fournies par le dispositif de mesures, en particulier dans les zones urbaines qui présentent un intérêt évident au vu de l’objectif de calcul d’exposition des populations à la pollution. L’approche géostatistique permet cette intégration en fournissant des outils de spatialisation des mesures qui intègrent à la fois les mesures en polluants disponibles et les autres données pertinentes : champ de concentration issu d’une modélisation déterministe, cadastres d’émission ou occupation des sols, mesures d’autres polluants corrélés au polluant d’intérêt, mesures potentiellement plus nombreuses [Bobbia et al., 2001].

L’objectif de l’article est de présenter cette approche géostatistique combinant mesures et résultats de modèles déterministes en vue d’une évaluation de l’exposition potentielle de la population à un polluant atmosphérique.

L’illustration présentée est issue d’une étude soutenue par l’ADEME dont l’objectif est d’évaluer l’impact sanitaire de la pollution atmosphérique liée au trafic routier, en se focalisant en particulier sur les enfants [Nedellec et al., 2005]. Cette étude a été réalisée dans le cadre du programme UNECE-WHO Pan European Programme for Transport, Health and Environment (THE PEP Project): “Transport-related health impacts and their costs and benefits with a particular focus on children”. Cet article concerne l’évaluation, en France métropolitaine pour l’année 2000, de l’exposition moyenne annuelle de la population (tous âges confondus) aux poussières atmosphériques PM10 (particules de diamètre aérodynamique médian inférieur à 10 microns), un des polluants retenus dans l’étude comme indicateur d’exposition à la pollution atmosphérique liée au trafic routier [Mosqueron et al., 2004].

2. Matériel et méthodes

2.1. Évaluation des impacts sanitaires

L’évaluation des impacts sanitaires (EIS) permet d’estimer le nombre de cas attribuables, en terme de mortalité ou de morbidité, à un niveau de concentration par rapport à une concentration de référence ou de quantifier le gain sanitaire imputable à une action visant la réduction des concentrations atmosphériques (exemples : nouveau plan de circulation urbaine, création d’un contournement, nouvelle norme d’émission pour les moteurs, nouvelle norme de qualité des carburants).

L’EIS est fondée sur l’utilisation de fonctions exposition-risque (FER) établies dans les études épidémiologiques réalisées en milieu urbain. Les FER sont basées sur des « corrélations statistiques » entre les fluctuations de concentrations atmosphériques et les fluctuations d’événements sanitaires. Pour réaliser une EIS il est donc indispensable de quantifier l’exposition en terme de concentrations atmosphériques. C’est l’objectif de l’approche géostatistique combinée présentée ici.

2.2. Données de surveillance de l’air ambiant

Dans le cadre de la loi sur l’air et l’utilisation rationnelle de l’énergie du 30 décembre 1996 (LAURE) et à la directive 1996/62/CE sur l’évaluation et la gestion de la qualité de l’air ambiant, la surveillance de l’air ambiant est confiée en France à des Associations agréées pour la surveillance de la qualité de l’air (AASQA). Chaque station du dispositif de surveillance des AASQA est classée selon une typologie qui est fonction de sa localisation géographique et de la nature des informations qu’elle procure. Les stations sont qualifiées de « proximité » lorsqu’elles ont pour but de documenter la qualité de l’air au voisinage de certaines sources de pollution (industries, axes routiers…), « urbaine de fond » ou « périurbaine de fond » lorsqu’elles sont destinées à caractériser une pollution atmosphérique moyenne sur ces zones, et « rurales » lorsqu’elles sont destinées à caractériser la qualité de l’air à l’échelle régionale ou nationale sur des sites éloignés des sources de pollution [ADEME, 2002]. La surveillance réalisée par les AASQA, coordonnée techniquement par l’ADEME, vise en premier lieu à s’assurer du respect des réglementations sur la qualité de l’air ambiant. Ces réglementations s’appuient sur des données toxicologiques et épidémiologiques mais dépendent aussi de contraintes techniques et économiques [Elichegaray, 2004]. En parallèle à cette surveillance, il importe aussi de pouvoir évaluer l’impact sanitaire d’une pollution sur les populations qui y sont exposées.

Les données utilisées ont donc été extraites de la base de données de qualité de l’air (BDQA) gérée par l’ADEME. En 2000, 185 stations de mesure de PM10 étaient recensées dans la BDQA (Figure 1). Parmi les 185 stations, 131 sont des stations de fond et 54 sont des stations de proximité (trafic, industries, observations spécifiques). Il n’y a pas de station en zones rurales pour l’année 2000. Les 54 stations de proximité ont été exclues de l’étude afin de ne pas biaiser l’estimation d’une exposition moyenne. En effet, ces stations de proximité sont par définition placées au voisinage immédiat de sites émetteurs spécifiques et ne procurent donc pas une information spatialement représentative de la qualité de l’air à l’échelle de la maille de quatre kilomètres dans laquelle elles se situent.

Figure 1 : Localisation des stations ATMO de mesure des PM10 en 2000 (■),et des stations supplémentaires mesurant en 2004 les PM10 (+) et les NOx (x).
Location of ATMO PM10 measurements in 2000 (), and supplementary stations measuring PM10 (+) and NOx (x) in 2004.

Le choix de la moyenne annuelle comme expression de l’exposition résulte de la volonté d’évaluer des risques liés à des expositions à long terme dans le cadre du projet THE PEP. Pour les besoins de ce projet, le calcul de cette exposition a comporté une représentation cartographique de la distribution de la moyenne annuelle en PM10 dans des mailles carrées de quatre kilomètres de côté. Le choix de la dimension des mailles résulte d’un compromis raisonnable tenant compte d’une part des données disponibles pour procéder à des calculs, et d’autre part de la résolution spatiale souhaitable pour disposer d’une évaluation satisfaisante des effets attribuables.

La figure 1 met par ailleurs en évidence le fait que certaines zones – notamment en milieu rural – étaient en 2000 relativement peu équipées de sites fixes de mesure des PM10, ce qui pénalise fortement la qualité de la cartographie des données par des approches géostatistiques sur ces zones. Plusieurs sources d’informations complémentaires peuvent toutefois être intégrées à l’approche géostatistique afin de pallier cette lacune et d’affiner la cartographie des PM10. Tout d’abord, suite au développement du dispositif des AASQA, le nombre de stations de fond mesurant les PM10 en 2004 s’est accru pour passer à 187, soit 43 % de sites de fond supplémentaires. La possibilité d’utiliser ces données, sous réserve de bonne corrélation avec les concentrations de PM10 en 2000, a été testée en vue d’être intégrée dans une approche géostatistique.

Figure 2 : Champ de concentration en PM10 obtenu par modélisation déterministe pour la journée estivale, superposition des stations ATMO de mesure des PM10 en 2000 (points noirs).
PM10 concentrations map obtained through deterministic modelling for the summer day, overlay of ATMO network: PM10 measurements in 2000 (black dots).

De même, l’origine partiellement commune des PM10 et des NOx (foyers de combustion fixes ou mobiles) suggère la possibilité d’une corrélation entre les concentrations moyennes annuelles de ces deux polluants. L’utilisation des 301 mesures de fond en NOx disponibles en 2004 a donc été testée pour compléter les données pour les PM10 disponibles en 2000.

Enfin, la modélisation déterministe des concentrations en PM10 peut également être utilisée pour enrichir la cartographie et fournir des données ou des informations sur l’allure de la distribution spatiale des polluants sur les zones pour lesquelles peu de données de mesure étaient disponibles en 2000. À cet effet, des modélisations déterministes ont été effectuées par le Laboratoire d’aérologie de Toulouse (LA) à l’aide du modèle MesoNH-ORISAM qui y a été développé [Cousin et al., 2005]. Ces simulations portent sur plusieurs journées (hiver et été) sans pluie de l’année 2000, en raison de la non prise en compte de la précipitation dans MesoNH-ORISAM. Les cadastres d’émission de particules primaires utilisés reposent sur l’inventaire européen, national et régional développé pour cette étude [Guillaume et Liousse, 2006], les cadastres des précurseurs gazeux reposant sur l'inventaire GENEMIS. Parmi les journées simulées, seule une journée estivale a été retenue (Figure 2) en raison de sa meilleure comparabilité avec les mesures moyennes annuelles en PM10 issues de la BDQA.

2.3. Étapes de la modélisation géostatistique

La description succincte de la méthodologie géostatistique reprise ci-dessous est inspirée de Deraisme et Bobbia (2003) et Jeannée (2003, 2004).

2.3.1. Analyse exploratoire des données

L’analyse exploratoire des données est la première étape de l’étude géostatistique. Elle consiste à analyser d’un point de vue statistique les résultats de concentrations en polluants suivis : distribution statistique des concentrations, comparaison des différents types de mesures (proximité, urbaines et périurbaines de fond, rurales). Il est ainsi possible de détecter des anomalies ou des points atypiques qui appellent une attention particulière.

Il importe également dans cette phase d’étudier les corrélations avec les informations indirectes disponibles. L’analyse de ces corrélations repose sur l’étude du nuage de corrélation entre les variables. Dans le cas d’une mauvaise corrélation, établie à partir d’un nombre significatif de données, l’information indirecte ne présente pas de lien avec la variable d’intérêt, ce qui rend son utilisation inappropriée.

Plusieurs informations indirectes, expliquant chacune une échelle de variabilité différente de la pollution suivie, peuvent être ainsi évaluées :

  • corrélation des données PM10 sur 131 stations de fond en 2000 avec les 187 mesures de fond disponibles en 2004 ;

  • corrélation des données PM10 en 2000 avec les 301 mesures de fond en NOx disponibles en 2004 ;

  • corrélation des données PM10 en 2000 avec la cartographie issue de la modélisation déterministe pour la journée estivale retenue.

2.3.2. Estimation par krigeage

Tout comme pour les interpolations classiques, l’estimation de la concentration z pour un polluant donné en un point x0, notée , est obtenue par combinaison linéaire de n concentrations aux points de mesure xi:

Le krigeage se différencie des techniques d’interpolation classiques (inverse des distances, plus proche voisin…) uniquement dans le choix des coefficients i appelés poids de krigeage et qui dépendent :

  • des distances entre les données et la cible X0

  • (comme les interpolateurs classiques) ;

  • des distances séparant les données entre elles (prise en compte de regroupements de données, en particulier dans les zones urbaines) ;

  • de la structure spatiale (variogramme) du polluant.

L’analyse de cette structure spatiale précède donc l’estimation par krigeage. L’objet de cette analyse est de caractériser le degré de corrélation entre deux mesures de polluant en fonction de la distance h qui les sépare. Pour une distance h donnée, on recherche tous les couples de mesures dont on calcule l’écart quadratique. En moyennant ces contributions par classe de distance, on obtient le variogramme expérimental. Ce variogramme expérimental est ensuite ajusté et interprété par un modèle de variogramme, fonction mathématique qui caractérise le degré de corrélation du polluant entre deux points quelconques de l’espace. Cet ajustement doit concilier l’information expérimentale fournie par les données et la connaissance a priori de la continuité spatiale du polluant. Le variogramme est une fonction croissante de la distance jusqu’à une distance critique appelée « portée ». Au-delà de la portée, le variogramme se stabilise autour d’un palier ; les valeurs ne sont alors plus corrélées. Ainsi, plus la portée est grande, plus les valeurs des mesures auront une influence à grande distance. Une fois le variogramme déterminé, le krigeage consiste alors à déterminer les poids de krigeage. Ces poids permettent de minimiser le risque d’erreur associé à l’estimation tout en garantissant l’absence de biais.

En ce sens, le krigeage constitue le meilleur estimateur linéaire sans biais. Une valeur ajoutée importante du krigeage par rapport aux interpolateurs classiques réside dans la quantification de la précision de l’estimation, rendue possible par la modélisation de la structure spatiale et usuellement représentée sous forme d’écart-type, donc de l’erreur, de krigeage. Sous certaines hypothèses (cadre gaussien), la connaissance de la précision peut être interprétée en termes d’incertitude associée à l’estimation (écart relatif entre concentration mesurée et estimée).

2.3.3. Intégration des informations indirectes

L’intégration dans ces procédures d’estimation des informations indirectes identifiées lors de l’analyse des données permet d’améliorer l’interpolation lorsque les corrélations sont significatives.

Dans le cas présent, ces informations sont de plusieurs types. Tout d’abord, les mesures en polluants disponibles en 2004, plus nombreuses qu’en 2000. En cas de corrélation avec la variable d’intérêt, ces informations sont classiquement prises en compte par « cokrigeage » dans la modélisation. Ce cokrigeage est l’extension à plusieurs variables du krigeage. Il requiert d’attribuer également un poids aux informations indirectes dans la combinaison linéaire (1). Il est nécessaire, pour déterminer ces poids, de connaître la structure spatiale des différentes variables, ainsi que leur corrélation spatiale. Cela se fait par le calcul de variogrammes simples et croisés entre la variable d’intérêt et les variables secondaires [Bobbia et al., 2001].

Plusieurs simplifications de ce cokrigeage sont possibles. Tout d’abord, en cas de très bonne corrélation entre polluant et variable auxiliaire, cette dernière étant mieux connue, il est possible de compléter la variable d’intérêt, aux points où elle est inconnue, par les valeurs de la variable auxiliaire déduites de la régression linéaire entre les variables. Le problème d’estimation se ramène alors à un krigeage monovariable plus aisé à mettre en œuvre. Ces données additionnelles n’ayant pas le même statut que les mesures réelles du polluant, elles sont cependant assorties d’une incertitude sous la forme d’une variance d’erreur de mesure (VEM). La valeur de cette VEM peut par exemple être égale à la variance des résidus issus de la régression entre polluant et variable auxiliaire [Jeannée, 2004].

Par ailleurs, lorsque l’information indirecte, ou cofacteur, est connue exhaustivement sur la zone d’étude, la résolution pratique du cokrigeage devient délicate en raison de la quantité d’information à intégrer. C’est le cas par exemple lorsque l’information indirecte est un cadastre d’émissions ou le résultat d’une modélisation déterministe. Le cokrigeage peut dans ce cas être simplifié en un cokrigeage colocalisé ; cette « simplification », rigoureuse sous certaines hypothèses, consiste à ne retenir dans le système de cokrigeage que les points de mesure de la variable d’intérêt, les valeurs de l’information indirecte en ces points, ainsi que la valeur de l’information indirecte au point où l’on procède à l’estimation.

Dans le cas où le cofacteur résulte de la mise en œuvre d’une modélisation physico-chimique, ce cofacteur est censé représenter la tendance globale du polluant. Le krigeage avec dérive externe peut alors être préféré au cokrigeage colocalisé, sous réserve de très bonne corrélation entre modèle déterministe et mesures. Pour estimer les concentrations en polluant, le krigeage avec dérive externe consiste à reprendre l’allure globale fournie par le cofacteur et à corriger localement cette tendance en prenant en compte les valeurs mesurées pour le polluant. Cette approche est par exemple mise en œuvre dans le cadre du système PREVAIR pour l’obtention des cartes dites « analysées » [http://prevair.ineris.fr, Honoré et Malherbe 2003 ; voir aussi Blond 2002].

2.3.4. Choix et validation du modèle de cartographie

En fonction de la pertinence de l’intégration des informations indirectes, plusieurs modélisations sont possibles pour cartographier les concentrations moyennes annuelles en PM10 en 2000, par exemple :

  • interpolation classique par inverse des distances quadratiques (ID2) ;

  • krigeage ordinaire des concentrations en PM10 (KO PM10) ;

  • cokrigeage intégrant les mesures en PM10 et NOx de 2004 (CK PM10 – NOx) ;

  • cokrigeage colocalisé intégrant ces mesures de 2004 et le modèle déterministe du LA (CCK PM10 – NOx – LA).

La pertinence de ces choix de modélisation peut être comparée par une technique de validation. Dans le cas présent, 25 % des données de PM10 pour l’année 2000, soit 30 points, sont aléatoirement sélectionnés, retirés du jeu de données et ré-estimés à partir des 75 % de données restantes par chacune des techniques envisagées. Le calcul de statistiques du type erreur quadratique moyenne permet alors de comparer la pertinence des différents choix de modélisation.

2.4. Exposition de la population

Les données concernant la distribution spatiale de la population sont issues du recensement INSEE de 1999, recalculées pour des mailles de 4 km × 4 km couvrant l’ensemble du territoire français.

Les techniques d’interpolation tendent à gommer les valeurs extrêmes, peu probables, et à les attirer vers les valeurs les plus probables de la pollution sur la zone d’intérêt : la variabilité des concentrations spatialisées est par conséquent plus faible que la variabilité observée sur les concentrations réellement mesurées. En outre, la continuité spatiale est accentuée sur la cartographie obtenue par interpolation, par rapport aux données de départ. Cet « effet de lissage » est bien connu en géostatistique. Il correspond bien à l’objectif de l’interpolation, par exemple par krigeage, qui consiste à prévoir en chaque point de la zone d’étude la concentration la plus probable.

L’estimation de la population potentiellement exposée à un niveau de concentration ne peut donc être évaluée à partir d’une carte interpolée, que cette dernière intègre ou non des informations indirectes [Deraisme et al., 2002]. Il en découlerait en effet un risque potentiellement important de surestimation ou de sous-estimation des populations exposées.

Il est par conséquent nécessaire de baser tout calcul d’exposition sur des représentations du champ de concentrations en PM10 qui ont les mêmes propriétés de distribution statistique et de continuité spatiale que celles observées expérimentalement sur les données de départ. Les simulations géostatistiques répondent à ce besoin. Chaque simulation correspond ainsi à un scénario possible pour la variable étudiée, car elle en reproduit la distribution statistique, la structure spatiale et prend en compte les liens avec les informations indirectes.

Le degré de liberté lié au champ de concentration laissé par les données peu nombreuses étant très important, de nombreux scénarios sont possibles et compatibles avec l’information disponible. Ces simulations sont réalisées ici par la technique classique des bandes tournantes [Matheron, 1973].

La réalisation de simulations requiert de travailler dans un cadre multigaussien. Il est par conséquent nécessaire de transformer les concentrations en PM10 et les informations indirectes afin de se ramener à ce cadre, puis d’en vérifier les hypothèses [Jeannée, 2004]. La transformation doit en outre prendre en compte l’existence de regroupements dans les données (clusters) afin d’éviter tout risque de biais lié au sur-échantillonnage de zones de fortes concentrations. Ensuite, le modèle privilégié pour la cartographie est reconstruit sur ces transformées gaussiennes. Une fois les simulations gaussiennes construites et validées en termes de reproduction de la distribution statistique et de la structure spatiale des données, la transformation inverse est réalisée.

Afin de classer les populations exposées dans des catégories d’exposition avec des intervalles successifs de 5 μg/m3 de PM10 (10 à 15 μg/m3, 15 à 20 μg/m3, etc.), on calcule, pour chaque simulation obtenue, la population exposée à chaque intervalle de concentrations en sommant les habitants pour les mailles où la concentration simulée est comprise dans l’intervalle voulu.

La répétition de ce calcul pour un grand nombre de simulations équiprobables permet alors un raisonnement en probabilité. On obtient ainsi l’histogramme de la population exposée à chaque intervalle de concentrations en PM10, histogramme duquel découlent les statistiques classiques nécessaires à l’évaluation des impacts sanitaires : population exposée en moyenne, écart-type associé, quantiles, etc.

L’ensemble des calculs et modélisations géostatistique est réalisé à l’aide du logiciel ISATIS [Geovariances, 2004].

3. Résultats et discussion

3.1. Analyse des données

Les 131 concentrations moyennes annuelles en PM10 des stations urbaines et périurbaines de fond en 2000 sur la France métropolitaine se situent entre 10 et 36 μg/m3 avec une concentration moyenne de 20,7 μg/m3. Cette valeur est légèrement inférieure à celle obtenue en tenant compte des 54 stations de proximité du territoire (21,7 μg/m3). Cette différence découle du fait que, les stations de proximité étant situées dans des environnements plus pollués que les sites de fond, leur retrait de l’analyse statistique conduit de manière mécanique à diminuer la moyenne des concentrations en PM10. Par ailleurs, au sein des stations de fond, on observe que ce sont les stations périurbaines qui présentent les concentrations moyennes annuelles les plus faibles (18,8 μg/m3 en sites périurbains de fond contre 21,1 μg/m3 en sites urbains de fond). Cette différence est attribuable à une plus grande activité émettrice de particules dans les noyaux urbains (foyers de combustion, circulation automobile, etc.) par rapport à leur périphérie. On note toutefois que les moyennes annuelles sur ces différents types de stations demeurent relativement proches.

Du fait que diverses zones du territoire disposaient de peu de mesures des PM10 en 2000, et afin d’améliorer la qualité du calcul d’une exposition par krigeage, la possibilité d’utiliser des données de PM10 et de NOx acquises en 2004 a été testée.

Les nouvelles stations mises en place en 2004 pour les PM10 (56 mesures de fond supplémentaires) constituent une information indirecte potentielle très utile pour enrichir la cartographie de l’année 2000 (Figure 1). La figure 3 (a) montre la bonne corrélation entre les données de PM10 recueillies sur les sites où des mesures étaient disponibles en 2000 et en 2004, à l’exception de quelques sites atypiques (visibles sur la figure 3). Le coefficient de corrélation de 0,77 justifie l’usage des données de 2004 pour compléter les données sur des points manquants de l’année 2000, et améliorer ainsi la cartographie de l’exposition.

La figure 3 (b) montre de manière analogue des corrélations satisfaisantes, pour chaque site où des mesures étaient disponibles, entre les PM10 de l’année 2000 et les NOx de l’année 2004 (coefficient de corrélation égal à 0,6). Les mesures de l’année 2004 en NOx ont été préférées à celles de 2000, étant plus nombreuses et excellemment corrélées avec ces dernières (coefficient de corrélation égal à 0,98). Les NOx en 2004 apportent ainsi 185 points complémentaires d’information par rapport aux seules mesures directes de PM10 acquises en 2000.

Figure 3 : Nuages de corrélation entre PM10 en 2000 et (gauche :) PM10 en 2004, (droite :) NOx en 2004. Indication des droites de régression linéaire et des coefficients de corrélation (rho). Indication de la première bissectrice pour le nuage PM10 2000/2004. Stations atypiques représentées par des carrés.
Scatter diagrams between PM10 measures in 2000 and (left:) PM10 in 2004, (right:) NOx in 2004. Linear regression lines are indicated, as well as the first bisector line for the PM10 2000/2004 diagram. Anomalous stations are represented by squares.

Il convient de noter que cette méthode ne peut être généralisée de manière systématique chaque année, sans contrôle préalable des corrélations. Il est probable que les données 2000 n’auraient pas fourni de si bonnes corrélations avec celles de l’année 2003, cette année ayant été marquée par des circonstances climatiques exceptionnelles (canicule de l’été 2003 notamment) se traduisant par des événements de pollution particuliers en matière d’ozone et d’oxydes d’azote notamment.

Finalement, la modélisation déterministe estivale mise en œuvre par le LA (Figure 2) fournit une information indirecte intéressante pour la spatialisation des mesures en PM10 dans les zones rurales, en dépit d’une faible corrélation statistique avec les concentrations moyennes annuelles, due à la fois à l’échelle spatiale de 10 km × 10 km utilisée pour la construction du modèle, qui ne permet pas de restituer les hétérogénéités locales mises en évidence par les mesures et à la différence de support temporel par rapport aux moyennes annuelles mesurées.

3.2. Cartographie des niveaux de PM10

Les modèles envisagés à la section précédente pour l’estimation des concentrations de PM10 sont comparés par validation. L’erreur quadratique moyenne entre concentrations estimées et réelles aux points de validation est calculée pour chaque modèle (Tableau 1). Tout d’abord, la prise en compte de la structure spatiale par krigeage ou cokrigeage améliore clairement la prédiction par rapport à une technique d’interpolation déterministe. Ensuite, parmi les différents modèles géostatistiques envisagés, celui intégrant la modélisation déterministe du LA conduit aux meilleurs résultats de validation (erreur quadratique moyenne).

Tableau 1 : Erreurs quadratiques moyennes (EQM) obtenues par validation à l’aide de différents modèles d’interpolation des PM10 : inverse des distances quadratiques (ID2), krigeage (KO PM10), cokrigeage avec les NOx (CK PM10 – NOx), cokrigeage colocalisé avec les NOx et la modélisation estivale du LA (CCK PM10 – NOx – LA).
Mean quadratic errors obtained by validation with several PM10 models: inverse of squared distances (ID2), kriging (KO PM10), cokriging with NOx (CK PM10 – NOx), colocated cokriging with NOx and summer modelling from LA (CCK PM10 – NOx – LA).

Modèle

EQM

ID2

8,20

KO PM10

5,67

CK PM10 – NOx

5,55

CCK PM10 – NOx – LA

4,94

Le modèle retenu pour la cartographie des PM10 en 2000 combine donc par cokrigeage :

  • les concentrations en PM10 en 2000 complétées par les concentrations en PM10 en 2004, ces dernières étant assorties d’une incertitude plus élevée sous forme de variance d’erreur de mesure ;

  • les concentrations en NOx en 2004 ;

  • le modèle déterministe PM10 du LA.

Les variogrammes simples et croisés entre ces trois variables ainsi que l’ajustement de modèles sur ces structures spatiales, requis pour le cokrigeage, sont présentés à la figure 4.

Figure 4 : Variogrammes expérimentaux (traits fins) et modèles ajustés (traits épais) pour le modèle final de cartographie des PM10 en 2000. Ligne du haut : variogrammes simples des PM10 en 2000 (complétés par 2004), des NOx en 2004 et du modèle déterministe (LAT). Lignes du bas : variogrammes croisés correspondants. Variances expérimentales représentées en tirets noirs.
Experimental variograms (thin lines) and fitted models (thick lines) for the final modelling of PM10 in 2000. Top line: simple variograms for PM10 in 2000 (completed by 2004), NOx in 2004 and for the deterministic model (LAT). Bottom line: corresponding cross variograms. Experimental variances represented by dotted lines.

La figure 5 illustre le résultat final de cartographie des concentrations moyennes annuelles en PM10 en 2000. L’influence des informations indirectes est visible, permettant notamment d’améliorer la précision des niveaux de concentrations dans des zones non équipées de sites de mesure de PM10 en 2000, par l’apport combiné de mesures plus récentes et de la modélisation déterministe.

Figure 5 : Cartographie des concentrations moyennes annuelles en PM10 pour l’année 2000, en μg/m3 (mesures disponibles représentées par les points noirs) : modèle final intégrant les mesures de PM10 et NOx en 2004 ainsi que la modélisation déterministe estivale des PM10.
Map of PM10 annual average concentrations for year 2000 in μg/m3 (hard data represented by black dots): integrating PM10 and NOx measurements in 2004 as well as summer PM10 deterministic model.

La carte ainsi obtenue montre que les niveaux moyens annuels les plus élevés en PM10 s’observent – en toute logique – sur les zones plus peuplées ou industrialisées du territoire, notamment en Ile-de-France, Nord-Pas-de-Calais, Rhône-Alpes et vallée du Rhône, Aquitaine et Midi-Pyrénées. On observe aussi des niveaux moyens annuels plus élevés en région sud-est, qui peuvent être en partie attribués à la forte activité photochimique de cette région très ensoleillée. Cette hypothèse est étayée par la modélisation déterministe d’une journée estivale type qui montre clairement un fort gradient de PM10 dans diverses zones du sud de la Loire et en région PACA (Figure 2).

Malgré ces gradients et ces différences de concentrations, la figure 5 montre toutefois que les niveaux moyens en PM10 demeurent globalement relativement peu élevés sur l’ensemble du territoire. Ces niveaux sont également assez significativement inférieurs à la valeur limite annuelle de 40 μg/m3 en PM10 fixée par la directive 1999/30/CE pour la protection de la santé humaine.

La modélisation déterministe constitue une information intéressante quant aux niveaux de concentrations en PM10 dans les zones rurales, non mesurés en 2000. Bien que cette absence de mesure rende délicate la validation de la modélisation, l’intégration de celle-ci se justifie par la confiance a priori dans le champ de concentration issu d’une modélisation physico-chimique éprouvée et par les résultats de validation croisée, meilleurs en intégrant cette modélisation.

3.3. Exposition de la population aux PM10

Le croisement des simulations obtenues avec la population issue du recensement de 1999 conduit aux statistiques d’exposition des populations à différents intervalles de concentrations aux PM10. Le tableau 2 montre que la majorité de la population française (30 750 754 habitants selon nos calculs) est exposée à des niveaux de concentrations compris entre 15 et 20 μg/m3. Seule une faible proportion de la population (372 445 habitants) est exposée à des concentrations moyennes annuelles comprises entre 35 μg/m3 et 40 μg/m3.

Tableau 2 : Statistiques élémentaires de répartition des populations exposées aux PM10 dans l’air ambiant pour l’année 2000, en nombre d’habitants. Résultats obtenus à l’aide de la cartographie de la figure 5 (cokrigeage), puis par la mise en œuvre des simulations (moyenne, écart-types et quantiles).
Basic statistics about the population exposure to PM10 ambiant concentrations in 2000, in number of inhabitants. Results derived from the map of figure 5 (cokriging) and from the simulations (mean, standard deviation and quantiles).

PM10

10-15 μg/m3

15-20 μg/m3

20-25 μg/m3

25-30 μg/m3

30-35 μg/m3

35-40 μg/m3

Cokrigeage

0

29 134 107

25 682 203

3 417 269

0

0

Moyenne

1 122 779

30 750 754

22 274 854

3 298 330

537 511

372 445

Écart-type

323 773

1 335 795

1 244 574

575 143

193 888

214 949

P25

891 917

29 810 560

21 388 014

2 915 643

401 571

211 931

P50

1 090 913

30 733 109

22 320 149

3 261 329

524 861

333 125

P75

1 313 696

31 655 323

23 137 029

3 637 331

665 074

498 653

P95

1 731 283

33 122 268

24 381 676

4 303 574

892 429

821 214

Ces résultats peuvent être comparés avec ceux qui découleraient de la cartographie obtenue par cokrigeage. Ainsi, par exemple, le croisement entre la cartographie de la figure 4 et la population de 1999 conduit à considérer que 3 417 269 habitants sont exposés à des concentrations en PM10 comprises entre 25 et 30 μg/m3, sans aucune information sur l’incertitude associée à cette estimation. L’approche par simulations, quant à elle, permet d’estimer sans biais un nombre probable d’habitants exposés à cet intervalle de concentrations qui est égal à 3 298 330 habitants, assorti d’un écart-type élevé d’environ 575 000 habitants.

Bien que dépassant l’objectif de l’étude, une déclinaison régionale de l’exposition potentielle des populations serait pertinente, en raison de l’existence de gradients marqués pour la concentration en PM10 à l’échelle nationale.

Il est finalement important de garder à l’esprit que l’exposition potentielle des populations est basée sur les données du recensement national, sans prise en compte des déplacements de populations et du temps passé hors du lieu d’habitation.

4. Conclusion

Parmi les différentes approches de cartographie de la qualité de l’air utilisables pour une évaluation de l’exposition des populations, le travail réalisé dans le cadre du programme Transport Health and Environnement Pan-European Programme a permis de montrer la pertinence d’une approche géostatistique faisant appel à des données indirectes en vue de compléter la densité des données disponibles pour le polluant dont on cherche à établir la cartographie.

Ces données indirectes peuvent être constituées des données de pollution acquises à d’autres périodes, tant pour le polluant considéré que pour d’autres composés, moyennant la vérification des corrélations. L’usage de modèles déterministes apporte également des informations utiles afin de compléter les données ou valider l’allure générale des cartographies obtenues par géostatistique. Les simulations géostatistiques fournissent en outre un cadre approprié pour une évaluation non biaisée de l’exposition potentielle des populations et de l’incertitude associée à cette évaluation.

Cette approche gagnerait à être enrichie à l’avenir afin de prendre en compte l’incertitude liée aux paramètres d’entrée de l’évaluation des populations exposées : incertitudes sur la sortie du modèle déterministe, sur la représentativité spatiale des sites de mesure, sur la répartition spatiale de la population, etc.

Plusieurs extensions à l’illustration présentée ont été réalisées dans le cadre du projet Transport-related health impacts and their costs and benefits with a particular focus on children : évaluation de la part de pollution atmosphérique due au trafic routier, évaluation de l’exposition pour différentes tranches d’âge, distinction entre zones urbaines et zones rurales, extrapolation à 2010 en prenant en compte l’évolution des réglementations liées aux émissions d’origine automobile dans la modélisation déterministe. Cette évaluation prospective constitue un intérêt primordial de l’utilisation de telles statistiques d’exposition potentielle des populations à la pollution atmosphérique. Les différents calculs ont également été réalisés pour un second indicateur d’exposition à la pollution atmosphérique, le NO2 [Jeannée, 2005].

Les résultats de l’évaluation des impacts sanitaires liés à la pollution atmosphérique chez les sujets vivant dans les zones urbaines en France métropolitaine, basés sur cette approche géostatistique d’évaluation de l’exposition, pourront faire l’objet de publications futures.

Ce travail a bénéficié d’un soutien financier de l’ADEME au travers des conventions 03 62 C0023 et 03 62 C0053.

Bibliography

ADEME. Classification and Criteria for Setting Up Air-Quality Monitoring Stations. ADEME Editions, Paris 2002: 63.

– Atkinson RW, Anderson HR, Sunyer J, Ayres J, Baccini M, Vonk JM. Acute effects of particulate air pollution on respiratory admissions: results from APHEA 2 project. Air Pollution and Health: a European Approach. Am J. Respir. Crit. Care Med. 2001; 164 (10 Pt 1): 1860-6.

– Bessagnet B, Hodzic A, Vautard R, Beekmann M, Cheinet S, Honoré C, Liousse C, Rouil L. Aerosol modeling with CHIMERE -preliminary evaluation at the continental scale. Atmospheric Environment 2004 ; 18 (38) : 2803-17.

– Blond N. Assimilation de données photochimiques et prévision de la pollution troposphérique. Thèse de Doctorat de l’École Polytechnique, Palaiseau 2002 : 204 p.

– Bobbia M, Pernelet V, Roth C. L’intégration des informations indirectes à la cartographie géostatistique des polluants. Pollution Atmosphérique 2001 ; 170 : 251-61.

– Cousin F, Liousse C, Cachier H, Bessagnet B, Guillaume B, Rosset R. Aerosol modelling and validation during ESCOMPTE 2001. Atmos. Environment 2005 ; vol. 39 : 1539-50.

– Cressie N, Kaiser MS, Daniels MJ, Aldworth J, Lee J, Lahiri SN, Cox LH. Spatial analysis of particulate matter in an urban environment. Second European Conference on Geostatistics for Environmental Application. JJ Gomez-Hernandez, A Soares & R Froidevaux (eds), Kluwer Academic Publishers 1998: 41-51.

– Deraisme J, Jaquet O, Jeannée N. Uncertainty management for environmental risk assessment using geostatistical simulations. Fourth European Conference on Geostatistics for Environmental Application. X Sanchez-Villa, J Carrera & JJ Gomez-Hernandez (eds), Kluwer Academic Publishers 2002 : 139-50.

– Deraisme J, Bobbia M. L’apport de la géostatistique à l’étude des risques liés à la pollution atmosphérique. Environnement, Risques & Santé 2003 ; vol. 2 : 168-75.

– Elichegaray C, Bouallala S, Colosio J, Desqueyroux H, Galsomiès L, Pernin H, Poisson N, Stroebel R. Plan Santé-Environnement – Contribution au bilan des expositions aux nuisances environnementales en France – Le milieu atmosphérique, tendances et perspectives. Pollution Atmosphérique, janvier-mars 2004 ; 181 : 55-64.

– Geovariances. Isatis Software Manual, 5th Edition. Geovariances & École des Mines de Paris, 2004 : 710 p.

– Guillaume B, Liousse C, Rosset R, Cachier H. Modélisation des PM10 et du NO2 en France – Rapport final du projet Prédit G07 – convention ADEME 03 62 007, juin 2004.

– Guillaume B, Liousse C. Development of carbonaceous aerosol emission inventories from fossil fuel over Europe at continental scale with focus on traffic at national and regional scales, soumis à Atmos. Env., 2006.

– Honoré C, Malherbe L. Application des modèles grande échelle à la problématique régionale : cas de l’ozone. Rapport LCSQA, 2003.

– Jeannée N, Fangeat E, Ba M. Contributions pratiques d’une géostatistique raisonnée en environnement : méthodes et application à la cartographie nationale de la pollution par l’ozone en France. Présenté lors du congrès GÉOÉVÉNEMENT, 2-4 mars 2003, Paris.

– Jeannée N, Nedellec V, Bouallala S, Desqueyroux H. Geostatistical assessment of long term human exposure to air pollution. Fifth European Conference on Geostatistics for Environmental Applications, Renard, Demougeot-Renard & Froidevaux (eds), Kluwer Academic Publishers 2004: 161-72.

– Jeannée N. National cartography of the pollution by NO2 and PM10 in France – Contrats ADEME 03 62 C0023 et 03 62 C0053 – Rapport final, décembre 2003. Mise à jour : Cartographie nationale NO2 et PM10 : état en 2000 et projection en 2010, part attribuable au trafic et exposition des populations – Note technique finale, avril 2005.

Illustrations

References

Bibliographical reference

Nicolas Jeannée, Luc Mosqueron, Vincent Nedellec, Christian Elichegaray, Souad Bouallala, Hélène Desqueyroux, Bruno Guillaume, Catherine Liousse and Rémy Lagache, « Évaluation de l’exposition en zones urbaines à la pollution atmosphérique : méthodes existantes et application aux PM10 en France métropolitaine », Pollution atmosphérique, 190 | 2006, 197-209.

Electronic reference

Nicolas Jeannée, Luc Mosqueron, Vincent Nedellec, Christian Elichegaray, Souad Bouallala, Hélène Desqueyroux, Bruno Guillaume, Catherine Liousse and Rémy Lagache, « Évaluation de l’exposition en zones urbaines à la pollution atmosphérique : méthodes existantes et application aux PM10 en France métropolitaine », Pollution atmosphérique [Online], 190 | 2006, Online since 01 avril 2006, connection on 18 janvier 2025. URL : http://www.peren-revues.fr/pollutionatmospherique/1517

Authors

Nicolas Jeannée

GEOVARIANCES – 49 bis, av. Franklin Roosevelt, BP 91 – 77212 Avon

Luc Mosqueron

Vincent Nedellec Consultants – 15, rue Firmin Gillot – 75015 Paris

Vincent Nedellec

Vincent Nedellec Consultants – 15, rue Firmin Gillot – 75015 Paris

Christian Elichegaray

ADEME – Département Surveillance de la qualité de l’air – 27, rue Louis Vicat – 75737 Paris Cedex 15

By this author

Souad Bouallala

ADEME – Département Surveillance de la qualité de l’air – 27, rue Louis Vicat – 75737 Paris Cedex 15

By this author

Hélène Desqueyroux

ADEME – Département Surveillance de la qualité de l’air – 27, rue Louis Vicat – 75737 Paris Cedex 15

By this author

Bruno Guillaume

Laboratoire d’Aérologie – UMR 5560, UPS/CNRS – Obs. Midi-Pyrénées – 14, av. E. Belin – 31400 Toulouse

Catherine Liousse

Laboratoire d’Aérologie – UMR 5560, UPS/CNRS – Obs. Midi-Pyrénées – 14, av. E. Belin – 31400 Toulouse

Rémy Lagache

CETE Nord Picardie – 42 bis, rue Marais – Sequedin – BP 99 – 59482 Haubourdin