ARCHIVÉ - Maladies chroniques au Canada

 

Volume 29 · Supplément 2 · 2010

La pollution de l’air

Nhu D. Le, Li Sun et James V. Zidek

https://doi.org/10.24095/hpcdp.29.S2.06f

Des polluants toxiques sont rejetés sans interruption dans l’air ambiant. Divers polluants proviennent des industries chimiques et de petites entreprises, comme les stations-service et les entreprises de nettoyage à sec. D’autres contaminants, comme les oxydes d’azote, le monoxyde de carbone et d’autres produits chimiques organiques volatils, résultent principalement de la combustion incomplète des combustibles fossiles (charbon et pétrole). Ils sont rejetés dans l’air par diverses sources, dont les tuyaux d’échappement des automobiles, les  systèmes de chauffage résidentiels et  les centrales électriques industrielles. Les polluants atmosphériques proviennent aussi de diverses transformations photochimiques; par exemple, l’ozone se forme lorsque l’oxygène ou l’azote moléculaire sont exposés au rayonnement ultraviolet.

Une association entre l’exposition à la pollution atmosphérique et le cancer du poumon a été observée dans plusieurs études. Quant aux autres cancers, les éléments de preuve sont beaucoup moins concluants. Les estimations de la fraction étiologique du risque de cancer ont varié considérablement au cours des 40 dernières années, ce qui témoigne des limites des études. Ces limites comprennent le manque d’information sur les variables confusionnelles, la difficulté de caractériser les associations en raison d’une période de latence probablement longue ainsi que la classification erronée de l’exposition. Bien que les premières estimations aient été inférieures à 1 %, des études de cohorte récentes, qui ont tenu compte de certains facteurs de confusion, comme le tabagisme et la scolarité, estiment qu’environ 3,6 % des cancers du poumon dans l’Union européenne pourraient être attribuables à l’exposition à des polluants atmosphériques, en particulier les sulfates et les particules fines. Selon une étude de cohorte distincte, entre 5 et 7 % des cancers du poumon chez les Européens n’ayant jamais fumé et chez les ex-fumeurs pourraient être attribuables à l’exposition à la pollution de l’air. Par conséquent, même si le tabagisme demeure un facteur de risque prédominant, la proportion de cas de cancer du poumon attribuables à la pollution atmosphérique est peut-être supérieure à ce qui avait été estimé dans le passé.

Dans l’ensemble, les principales faiblesses de toutes les études sur la relation entre la pollution atmosphérique et le cancer menées jusqu’ici étaient une caractérisation inadéquate de l’exposition de longue durée à la pollution atmosphérique et l’imprécision ou l’absence des mesures des covariables. C’est au cours de la dernière décennie seulement que les mesures des PM2,5 sont devenues plus largement disponibles. L’une des faiblesses importantes de nombreuses études est l’utilisation de données de surveillance fondées sur des mesures dans des emplacements fixes et le fait de tenir pour acquis que tout le monde dans un région donnée a subi la même exposition. Cette méthode ne tient pas compte de la variabilité spatiale ni des variations de l’exposition des personnes, en fonction des sources de pollution à l’intérieur et à l’extérieur, aussi bien au travail, qu’à la maison ou ailleurs. Les récents efforts de modélisation des indicateurs de la circulation routière et de la distance entre les résidences et les principales routes et autoroutes permettent de mieux prendre en compte cette variabilité spatiale. Toutefois, les différences dans les profils d’activité ne sont pas pour autant prises en compte. Si l’effet est faible, ces biais réduiront la capacité de détecter une association. Dans la plupart des cas, les estimations obtenues tendent à être biaisées vers une valeur nulle (c.-à-d. aucun effet). Dans le cas de l’erreur de classification de l’exposition, l’incapacité de tenir compte de manière satisfaisante des variables confusionnelles peut engendrer un biais dans les deux directions. Des améliorations récentes apportées aux méthodes statistiques permettent aux analystes d’estimer les expositions cumulatives individuelles en utilisant des mesures prises dans des emplacements fixes combinées aux données sur les lieux de résidence antérieurs et actuels. Ces nouvelles méthodes tiennent également compte des erreurs de mesure liées aux covariables dans l’analyse, ce qui permet d’améliorer les estimations des effets. Parmi les autres écueils à surmonter figurent le fait que les mesures de l’exposition et les variables confusionnelles peuvent changer au fil du temps et la nécessité d’obtenir des données sur une longue période en raison de la période de latence prévue entre les expositions nocives et l’apparition du cancer.

Introduction

L’épisode de brouillard à Londres en 1952 a contribué de manière importante à stimuler la recherche sur les effets de la pollution atmosphérique1. Cet épisode a fait ressortir de façon dramatique une association à court terme entre des niveaux très élevés de pollution particulaire et une augmentation de la mortalité. Depuis cet épisode, les répercussions de la pollution atmosphérique sur la santé ont reçu une attention croissante, qui s’est traduite par un grand nombre d’études des effets sur la santé et par l’examen de plusieurs constituants de l’air, tant intérieur qu’extérieur ainsi que dans les lieux de travail.

Un inventaire préliminaire des substances toxiques rejetées dans l’air, établi par l’Environmental Protection Agency (EPA)  des États-Unis, a permis d’estimer qu’environ un milliard de kilogrammes de polluants atmosphériques toxiques sont libérés dans l’air de ce pays chaque année2a. Divers polluants proviennent des industries chimiques et des petites entreprises, comme les stations-service et les entreprises de nettoyage à sec. D’autres, comme les oxydes d’azote, le monoxyde de carbone et autres produits chimiques organiques volatils, résultent principalement de la combustion incomplète de combustibles fossiles (charbon et pétrole) et sont émis par diverses sources, dont les tuyaux d’échappement des automobiles, les systèmes de chauffage résidentiels et les centrales électriques industrielles. D’autres polluants atmosphériques sont aussi le résultat de transformations photochimiques; par exemple, l’ozone se forme lorsque l’oxygène ou l’azote moléculaire sont exposés au rayonnement ultraviolet. Le tableau 1 donne une description des polluants fréquemment mesurés et de leurs sources. Fishbein présente une analyse plus détaillée sur les sources de plusieurs polluants atmosphériques2b.

Tableau 1
Polluants atmosphériques les plus fréquemment étudiés et leurs sources3b,4
Polluant Source
Composés organiques volatils (COV) Une grande proportion des COV au Canada provient de sources naturelles. Les sources humaines  comprennent les véhicules à essence et l’évaporation de l’essence, les solvants dont la peinture à base d’huile, le liquide d’allumage pour barbecue, les produits de nettoyage domestiques.
Particules totales Les particules fines (PM2,5) viennent généralement de la combustion des combustibles fossiles dans le transport, de l’industrie, de la production d’électricité et du chauffage résidentiel. Les oxydes d’azote et les dioxydes de soufre se combinent au NH3 pour former des particules volatiles secondaires. L’ozone troposphérique et plus de la moitié des PM sont produits par la réaction de gaz précurseurs, deux des principaux gaz précurseurs étant l’oxyde d’azote et les COV. L’ozone troposphérique et les particules présentes dans l’air sont deux des principales composantes du smog.
Oxydes d’azote Le dioxyde d’azote, qui constitue la plus grande partie des oxydes d’azote, est relié surtout aux émissions des véhicules automobiles. Les oxydes d’azote (NOx) et les COV sont deux des principaux gaz précurseurs qui réagissent pour former l’ozone troposphérique et les PM; les sources des gaz précurseurs comprennent les véhicules automobiles, les fonderies, les résidences, les centrales électriques thermiques et autres industries.
Oxydes de soufre Les fonderies de métaux non ferreux et les centrales électriques alimentées au charbon sont les principales sources de dioxyde de soufre. Le dioxyde de soufre et les oxydes d’azote sont les principaux polluants qui causent les pluies acides.
Monoxyde de carbone Les transports. Le CO est un polluant atmosphérique étroitement associé aux effets nocifs pour la santé  et peut être mortel en fortes concentrations.
Ozone Les COV réagissent avec les oxydes nitreux en présence du soleil pour former l’ozone troposphérique.

Les concentrations annuelles des particules totales en suspension (PTS), une mesure de la pollution de l’air ambiant, sont très élevées dans certaines parties du monde, beaucoup plus qu’en Amérique du Nord. Par exemple, dans les années 90, les PTS dépassaient les 400 µg/m3 dans certaines villes de la Chine et de l’Inde5. Le Rapport sur la qualité de l’air en Ontario de 2005 présente une comparaison de la qualité de l’air dans 39 villes dans le monde6. Étant donné que les méthodes de surveillance et les emplacements peuvent varier d’une ville à l’autre, ces comparaisons ne doivent pas être considérées comme un classement exhaustif.

Selon les critères de qualité de l’air ambiant de l’Ontario, la concentration maximale d’ozone à l’heure est de 80 parties par milliard (ppb), et elle est de 120 ppb selon la National Ambient Air Quality Standard (NAAQS). Parmi les villes choisies, Houston, Athènes, Hong Kong et Sao Paulo ont enregistré les plus fortes concentrations maximales à l’heure en 2005, ces dernières se situant entre 160 et 200 ppb. Neuf villes (aucune au Canada) ont présenté des valeurs entre 120 et 160 ppb. Les villes de Windsor, Toronto, Montréal et Ottawa présentaient des concentrations maximales à l’heure situées entre 80 et 120 ppb.

Pour les PM2,5 annuelles moyennes, fines matières particulaires ayant un diamètre de 2,5 microns ou moins, les NAAQS des États-Unis fixent une valeur de 15 µg/m3, et la valeur fixée par l’Organisation mondiale de la santé (OMS) est de 10 µg/m3. Cinq villes  (aucune au Canada), ont enregistré des moyennes annuelles en 2005 se situant entre 15 et 26 µg/m3; à Sao Paulo et à Prague, ces valeurs étaient supérieures à 20 µg/m3. La valeur moyenne était de 10 µg/m3 à Montréal, et elle était légèrement supérieure à Windsor. Les valeurs enregistrées à Ottawa et à Toronto étaient d’environ 7 et 9 µg/m3, respectivement.

Les NAAQS des États-Unis fixent à 53 ppb les concentrations annuelles moyennes de NO2, et l’OMS, à 21 ppb. En 2005, huit villes ont eu des valeurs moyennes se situant entre 21 et 36 ppb, notamment Toronto, qui a affiché une valeur légèrement supérieure à la valeur de 21 ppb fixée par l’OMS. Windsor et Montréal ont enregistré des moyennes annuelles de 17 à 18 ppb.

Au Canada, on note depuis 1990 une chute marquée des niveaux de plusieurs polluants atmosphériques, dont le monoxyde de carbone et le dioxyde d’azote; les niveaux de plusieurs autres polluants, notamment les composés organiques volatils, le dioxyde de soufre, l’oxyde d’azote et l’ozone troposphérique, se sont également stabilisés entre le milieu des années 90 et l’an 20003a. Les concentrations annuelles moyennes de PM2,5 ont diminué dans les régions urbaines partout au Canada au cours de la période allant de 1990 à 1996 et ont été relativement stables de 1996 à 2001, alors que les concentrations annuelles moyennes de PM10 diminuaient dans la plupart des régions urbaines7. À la lumière des observations jusqu’en 2005, on prévoit une légère hausse de 6 % des PM2,5 pour la période 2000-20158. On ne dispose que de peu de données sur la pollution de l’air au Canada avant 1990, en particulier pour ce qui est des particules.

Il existe plusieurs types de pollution atmosphérique : la pollution atmosphérique extérieure, la pollution de l’air intérieur, la pollution en milieu de travail et la pollution provenant de sources industrielles ponctuelles, entre autres. La présente analyse se concentre sur la pollution atmosphérique extérieure, y compris les sources industrielles ponctuelles. Le présent chapitre comprend également un examen approfondi des difficultés rencontrées dans la mesure de l’exposition ainsi que quelques propositions de solutions, ce qui fait d’ailleurs l’objet de certaines de nos recherches actuelles. Cependant, ce sujet exige un contexte mathématique plus avancé que le restant de la présente monographie. Nous suggérons donc aux personnes qui ne s’intéressent qu’à l’examen de la pollution atmosphérique extérieure et au cancer de passer ces sections.

La relation entre des maladies pulmonaires aiguës chroniques non malignes et la pollution de l’air ambiant a été étudiée de façon approfondie, mais on n’a pas encore déterminé de façon certaine quels polluants et quels types de particules sont les plus nuisibles. Il est reconnu que la pollution atmosphérique fait augmenter l’incidence de ces maladies (ou les exacerbe). Des hausses de la concentration des particules inhalables (particules en suspension dans l’air et de diamètre inférieur ou égal à 10  µm,  connues sous le nom de PM10) dans l’atmosphère ont été associées à des baisses aiguës de la fonction pulmonaire et à d’autres effets respiratoires indésirables  chez les enfants9-11. Il est établi que la mortalité attribuable à des troubles cardiaques et respiratoires est liée aux concentrations de particules dans l’air12. Une relation a été établie entre des augmentations des concentrations d’ozone dans l’air ambiant et une baisse de la fonction pulmonaire, une augmentation des symptômes, une hausse des consultations dans les services d’urgences et des hospitalisations pour des maladies respiratoires et, peut-être, à une augmentation de la mortalité; cette abondante documentation est examinée ailleurs13,14a. Des études plus récentes continuent de faire ressortir des schémas similaires15,16. Certaines de ces études ont posé comme postulat que ces augmentations pouvaient être attribuables à une maladie préexistante chez les personnes qui sont, de ce fait, plus susceptibles aux expositions environnementales dangereuses.

Les importantes limites de ces études chronologiques tiennent au fait qu’elles ne peuvent porter que sur les résultats des expositions aiguës et non sur les expositions chroniques. En règle générale, la plupart des études des effets sur la santé ont porté sur les effets aigus, comme les consultations aux urgences, et les relations avec l’environnement ont été définies par une corrélation entre les taux d’effets néfastes sur la santé et les niveaux de pollution environnementale dans une région géographique donnée, telle que mesurée pendant une courte période. Les maladies chroniques dont la période de latence est longue, comme le cancer, nécessitent généralement une mesure des expositions chroniques à long terme.

Par conséquent, le risque lié à la pollution de l’air n’a pas été défini aussi clairement pour le cancer que pour les problèmes de santé aigus, et les données sur les cancers autres que le cancer du poumon sont limitées. Étant donné que plusieurs excellentes analyses documentaires ont été publiées sur le sujet14b,17a-23, nous nous pencherons ici sur les points principaux et les compléterons par les résultats d’études publiées récemment.

Indications d’une association entre la pollution atmosphérique et le cancer

Mécanismes biologiques

Comme le démontrent de nombreux ouvrages, l’air contient des substances qui transforment les cellules de culture24, et nous savons ou nous soupçonnons que ces substances causent le cancer chez l’humain2c,23. Une vaste gamme de produits chimiques potentiellement cancérogènes ont été rejetés dans l’air25-27. Ces polluants potentiellement cancérogènes sont, entres autres, le benzo[a]pyrène, le benzène, les composés inorganiques comme l’arsenic et le chrome, les particules, surtout les PM2,5, et probablement l’ozone28a. Les PM2,5 peuvent pénétrer plus profondément dans les poumons et peuvent donc représenter un risque plus grand pour la santé que les particules plus grosses. Les formes réactives de l’oxygène ont été associées aux effets toxicologiques des particules ultrafines29. Les PM2,5 ont aussi des concentrations plus élevées de sulfates, de nitrates,  de composés organiques et de métaux de transition30. Nielsen et coll.31 ont examiné la présence d’un polluant atmosphérique spécifique – les hydrocarbures aromatiques polycycliques (HAP) – dans une rue achalandée de Copenhague, au Danemark, et ont déterminé que les concentrations d’HAP suivaient l’ordre suivant : « rue > air urbain ambiant > banlieues > village > plein air ». La circulation automobile contribuait aux concentrations de HAP dans la rue dans une proportion de 90 % les jours de semaine, et de 60 % pendant la fin de semaine. Sa contribution à l’air urbain ambiant était estimée à 40 %.

Cancer du poumon et résidence  en milieu urbain

Quelques-unes des premières études sur le cancer du poumon et la pollution atmosphérique montraient que les risques de cancer du poumon étaient plus faibles en milieu rural que dans les régions urbaines, qui ont toujours eu des concentrations de polluants atmosphériques plus élevées en raison de la circulation automobile, des sources de pollution industrielles et du chauffage résidentiel32. Les résultats d’études écologiques indiquent que le risque de développer un cancer du poumon est plus grand en milieu urbain qu’en milieu rural par un facteur d’environ 1,3 à 2,0 et est généralement plus élevé chez les hommes que chez les femmes33. Il faut cependant noter que ces études ont une valeur limitée, étant donné qu’elles ne contiennent généralement pas d’information sur des facteurs de confusion importants, comme le tabagisme et les expositions professionnelles à l’échelle individuelle. Il est bien établi que l’usage du tabac est le plus important facteur déterminant du cancer du poumon et que la consommation de tabac est très différente chez les populations urbaines et rurales34a-35. On estime que le tabagisme est responsable de 87 % des cancers du poumon36-38. L’estimation des risques associés à la pollution atmosphérique dans le cas du cancer du poumon devrait idéalement être ajustée pour tenir compte de plusieurs caractéristiques du tabagisme, notamment le nombre d’années de consommation du tabac et la quantité fumée. D’autres caractéristiques pourraient également être importantes. Ainsi, Doll analyse l’influence sur le risque ultérieur de l’âge d’une personne au moment où celle-ci commence à fumer34b; la fumée de tabac ambiante (FTA) influe aussi sur le risque ultérieur. Des études épidémiologiques analytiques (études cas-témoins et de cohorte), dans lesquelles des facteurs de confusion comme le tabagisme et l’exposition professionnelle sont pris en compte, donnent en général un rapport de risques urbain-rural légèrement inférieur (1,2 à 1,5). Il est toutefois possible que l’effet confusionnel résiduel du tabagisme persiste toujours; l’évaluation des expositions professionnelles est souvent faite de façon rudimentaire et on ne dispose d’aucune information sur l’exposition au radon. Il convient de noter qu’il n’y aura effet confusionnel que si les comportements tabagiques à l’échelle individuelle sont corrélés avec les mesures de la pollution de l’air dans l’ensemble de la région.

Études cas-témoins et études de  cohorte sur la pollution de l’air extérieur  et le cancer du poumon

L’étude de l’American Cancer Society (ACS)  et la Harvard Six-City Study sont fondamentales dans le domaine et elles ont, dans une large mesure, servi de base à l’établissement des normes en matière de qualité de l’air de l’EPA des États-Unis. L’étude de cohorte de l’ACS a recruté environ 1,2 million d’adultes en 1982. Pope et coll. ont observé qu’une élévation de  10 µg/m3 de la pollution par des particules fines était associée à un risque de cancer du poumon de 8 % plus élevé39a. Les mesures de la fraction de grosses particules (PM15-2,5)  et des particules totales en suspension n’étaient pas associées à la mortalité par cancer du poumon. La Harvard Six City Study portait sur 8 111 adultes, qui ont fait l’objet d’un suivi prospectif de 14 à  16 ans40a. L’élévation de la mortalité par cancer du poumon dans la ville la plus polluée comparativement à la ville la moins polluée n’était pas statistiquement significative (RR = 1,37, IC à 95 % : 0,81-2,31), alors que la mortalité par maladie cardiopulmonaire était significativement élevée.

Aux Pays-Bas, Hoek et coll.41 n’ont observé aucune association entre le cancer du poumon et l’exposition aux particules fines (fumée noire) et au NO2; toutefois, l’étude était limitée par un nombre relativement  petit de décès par cancer du poumon (n = 60). Une autre étude de cohorte a examiné la relation entre la pollution atmosphérique et le cancer du poumon et d’autres causes de décès chez 16 209 hommes  norvégiens42. Un lien a été fait entre les concentrations annuelles de pollution atmosphérique et l’adresse de résidence des participants. Après ajustement pour les facteurs de l’âge, du tabagisme et de la scolarité, le RR de développer un cancer du poumon était de 1,08 (IC de 95 % =  1,02-1,15) pour une augmentation de  10 µg/m3 de l’oxyde d’azote. Une étude  de cohorte suédoise avec couplage de dossiers constatait un risque accru (RR = 1,4) de cancer du poumon pour les personnes subissant une exposition élevée aux émissions de diesel43.

Une étude réalisée auprès de 14 284 adultes qui résidaient dans neuf villes françaises a examiné la relation entre la pollution de l’air extérieur et la mortalité44. Dans le cadre de cette étude, on a aussi recueilli de l’information sur l’usage du tabac, le niveau de scolarité et les expositions professionnelles à la poussière, aux gaz et aux fumées. Une augmentation de 10 µg/m3  était associée à un rapport de taux accru de 1,48 (IC à 95 % = 1,05-2,06) de décéder d’un cancer du poumon. Cette estimation du risque est fondée sur un total de 42 décès  par cancer du poumon. Comme dans d’autres études de cohorte, l’information relative aux variables confusionnelles n’a été recueillie qu’à un moment précis, et les expositions à la pollution de l’air ont été mesurées au cours de la période de trois ans.  Les estimations du risque peuvent donc être biaisées par l’incapacité de prendre en compte les changements dans les valeurs de ces caractéristiques au cours de l’intervalle de suivi. L’un des points forts notables de l’étude est la longue durée du suivi, certains sujets ayant été suivis pendant 25 ans.

Dans une étude de cohorte réalisée auprès de 6 338 résidents non fumeurs du Sud de  la Californie, on a estimé l’exposition à vie aux polluants atmosphériques pour chaque sujet, en fonction du centroïde des zones de code postal associées aux antécédents de lieux de travail et de lieux de résidence45. Dans le cas de la mortalité par cancer du poumon, le RR associé à une augmentation de l’exposition égale à l’écart interquartile (EIQ) de 24 µg/m3 en ce qui concerne la concentration moyenne de PM10 s’établissait à 3,36 (IC à 95 % = 1,57-7,19; 18 décès) chez les hommes, et à 1,33 (IC à 95 % = 0,60-2,96; 12 décès) chez les femmes. Chez les hommes, l’ozone était aussi significativement associé à la mortalité par cancer du poumon (RR = 4,19, IC à 95 % = 1,81-9,69), mais il était difficile de distinguer les effets des PM10 et de l’O3 en raison de leur corrélation. En ce qui concerne le sous-ensemble de la cohorte pour lequel il était possible de distinguer les grosses particules et les particules fines, les associations s’expliquaient davantage par la fraction de particules fines (PM2,5)46.

Dans une recension, on a relevé dix  études cas-témoins qui comprenaient des mesures d’au moins un des polluants suivants : matières particulaires totales en suspension, SO2 et NO247a. Six études ont signalé des associations significatives, ainsi que des augmentations du risque d’environ 50 %, bien que l’une des femmes ait présenté un RR plus faible et non significatif. Une étude a fait état d’une association négative et trois études n’étaient pas statistiquement significatives. Cette recension comprenait une étude cas-témoins récente en population, portant sur des hommes résidant à Stockholm, en Suède; l’exposition à vie des répondants a été évaluée en utilisant leur adresse de résidence et les données sur les émissions créées par la circulation routière et le chauffage. Cette étude a révélé une augmentation de 40 % du risque de cancer du poumon pour le décile le plus élevé d’exposition au NO2 comparativement au décile le plus bas, après ajustement pour les facteurs de  confusion et en prévoyant une période  de latence de 20 ans48a.

Études portant sur des sources ponctuelles de pollution et le cancer du poumon

Des études internationales portant sur des collectivités situées à proximité de sources ponctuelles importantes de pollution atmosphérique semblent indiquer que de telles expositions augmentent le risque  de cancer du poumon. Un risque relatif (RR)  d’environ 1,5 à 2,0 a été observé chez les personnes vivant à proximité de fonderies émettant de l’arsenic par rapport à la population de référence vivant dans des régions plus éloignées, après avoir pris en compte le tabagisme et d’autres expositions professionnelles49,50. Dans le Nord-Est de l’Angleterre, un RR similaire concernant le cancer du poumon a été associé au fait de vivre près de sources industrielles multiples de pollution, mais les résultats obtenus différaient entre les hommes et les femmes et entre les différents groupes d’âges51. Les résultats d’études écologiques menées en Écosse ont indiqué des risques accrus associés au fait d’habiter à proximité de fonderies d’acier et de fonte, même après qu’on a effectué un ajustement en fonction des classes sociales52,53. En Suède, une étude récente portant sur les personnes vivant à proximité d’une fonderie de métaux non ferreux a mis en évidence un risque élevé, quoique statistiquement non significatif, pour les hommes exposés pendant les premières étapes de l’exploitation (RR = 1,51); aucune augmentation globale du risque n’a été observée chez les femmes54. Dans le Nord de l’Italie, la distribution géographique de l’incidence du cancer du poumon à proximité d’une cokerie semblait indiquer que la pollution atmosphérique industrielle représentait un facteur de risque55. Les résultats d’autres études n’ont toutefois pas révélé d’excès de risque56,57. La classification erronée de l’exposition pourrait être plus probable dans ces études écologiques, et les sites industriels étaient différents.

Épidémiologie moléculaire et toxicologie

Des études d’épidémiologie moléculaire et de toxicologie ont mis en évidence des relations entre l’exposition à la pollution atmosphérique et le cancer du poumon. Une de ces études58 a montré diverses relations dose-réponse entre certains biomarqueurs et des expositions environnementales, comme une exposition à des hydrocarbures aromatiques polycycliques, la pollution  de l’air ambiant intérieur et la pollution de l’air en milieu de travail. Les biomarqueurs comprenaient des adduits cancérogène-ADN et cancérogène-protéine, des mutations géniques et chromosomiques et des polymorphismes de gènes présumés de susceptibilité. L’étude portait sur des adultes, des nourrissons et des enfants, dont des patients atteints de cancer et des sujets témoins, exposés à diverses concentrations d’agents cancérogènes. Une étude de cohorte réalisée en Italie a révélé une association entre le fait de vivre en milieu urbain et la présence d’adduit anti-benzo[a]pyrène diol époxyde-ADN, un biomarqueur potentiel du cancer du poumon59. Ailleurs, dans une cohorte de mères et de nouveau-nés vivant dans une ville industrialisée de la Pologne, les chercheurs ont observé une relation dose-réponse entre la pollution de l’air ambiant et des dommages à l’ADN induits par les HAP60. Une étude in vitro récente61 a été la première à démontrer que les cellules cibles des poumons initient une cascade de signaux cellulaires liés étiologiquement  à la prolifération de cellules aberrantes et à  la cancérogenèse, lorsqu’elles sont exposées à des particules en suspension dans l’air ambiant (une des composantes de la pollution atmosphérique). Cislaghi et Nimis62 ont étudié les associations entre la mortalité par cancer et la biodiversité des organismes sensibles à la pollution en utilisant ces derniers comme mesure de substitution de la pollution atmosphérique. Les résultats semblent indiquer une association entre la pollution atmosphérique et le cancer du poumon, mais il faut noter certaines faiblesses du schéma écologique. Entre autres, des personnes exposées dans une région peuvent déménager dans une autre où apparaîtront les effets sur la santé, le schéma expérimental ne permet pas de tenir compte des facteurs de confusion, il ne considère pas de façon adéquate la période de latence (surtout dans les cas de cancer) et il attribue un même degré d’exposition à l’ensemble d’une région. Le chapitre de cet ouvrage portant sur les méthodes épidémiologiques comprend une analyse plus avancée des forces et des faiblesses des différentes études épidémiologiques (cas-témoins, études croisées, études de cohorte, études écologiques) et expose les concepts de base en ce qui a trait à l’évaluation de l’exposition.

Cancers autres que le cancer du poumon

Plusieurs études épidémiologiques se sont penchées sur certains cancers de l’adulte autres que le cancer du poumon. Des augmentations de l’incidence et de la mortalité ont souvent été observées dans des régions urbaines pour tous les sièges de cancer combinés ou pour des sièges autres que les voies respiratoires20. Les risques observés pour les autres cancers sont généralement inférieurs à ceux du cancer du poumon, bien que quelques-unes des associations observées avec la leucémie de l’enfant soient plus fortes. Pour divers sièges de cancer spécifiques de l’adulte, les résultats sont très contradictoires, et certains des principaux constats sont présentés ci-dessous.

Le rapport d’une étude portant sur un des deux comtés de Long Island, New York63, fait état d’une association positive, quoique statistiquement non significative, entre le fait de vivre sur des voies à forte densité de circulation et le cancer du sein chez la femme. Dans une étude cas-témoins réalisée dans les comtés d’Erie et de Niagara, dans l’État de New York, on a étudié le rôle, en tant que facteur de risque, des particules totales en suspension (PTS) comme données indirectes pour l’exposition aux HAP. Chez les femmes ménopausées, une exposition à des concentrations élevées de PTS (> 140 microgrammes/m3) à la naissance a été associée à un rapport de cotes ajusté de 2,42 (intervalle de confiance à 95 %, 0,97-6,09) comparé à une exposition à de faibles concentrations (< 84 microgrammes/m3). Par contre, pour ce qui est des femmes non ménopausées, lorsque les expositions étaient généralement plus faibles, les résultats ne concordaient pas avec l’hypothèse et semblaient même indiquer, dans certains cas, une réduction du risque de cancer  du sein64.

Dans une étude menée le long de la frontière entre la Norvège et la Russie, les concentrations élevées de dioxyde de soufre engendrées par les émissions industrielles ont été jugées responsables de dommages à l’environnement et d’une incidence accrue d’effets nocifs sur la santé65a. L’analyse des taux standardisés de mortalité a fait ressortir une augmentation du nombre de décès par cancer et par maladie cardiovasculaire dans deux villes possédant des raffineries de nickel comparativement à une ville témoin65b.

Au cours des dernières années, plusieurs études ont porté sur l’impact de l’exposition à la pollution atmosphérique causée par les émissions des véhicules automobiles sur le cancer, en se penchant principalement sur l’enfant et la leucémie. Considérés globalement, les résultats sont équivoques. Deux études cas-témoins sur le cancer de l’enfant, l’une menée à Denver et l’autre dans le Nord de l’Italie, ont fait ressortir des risques plusieurs fois plus élevés de leucémie chez les enfants exposés à un taux élevé d’émissions des véhicules automobiles66,67. Ailleurs, l’exposition professionnelle du père aux gaz d’échappement a été associée à une augmentation du cancer infantile chez ses enfants68. Plusieurs études n’ont toutefois pas trouvé d’association entre le fait de vivre près de zones à circulation automobile élevée et la leucémie infantile69-72.  Dans une étude, on a obtenu des résultats contradictoires concernant les adultes et les enfants. Ainsi, on n’a pas observé d’association entre un lieu de résidence situé le long de routes principales et le développement de cancers de l’adulte, mais on a fait ressortir une association avec des hémopathies malignes chez les femmes et les enfants73.

La fraction étiologique du risque

En résumé, il existe de fortes indications d’une association entre l’exposition à la pollution atmosphérique et le cancer du poumon. Dans le cas des autres cancers, les données sont beaucoup moins concluantes, bien que des recherches additionnelles soient nécessaires. Les estimations de la fraction étiologique du risque ont varié considérablement au cours des 40 dernières années17b,74, ce qui témoigne des limites des études, notamment du manque d’information sur les facteurs de confusion et la période de latence, ainsi que de la classification erronée des expositions. Par exemple, Stocks et Campbell75 ont estimé que la pollution atmosphérique en milieu urbain contribuait à environ 100 décès dus au cancer du poumon pour 100 000 personnes, alors que Doll and Peto35 ont estimé que moins de 1 % des cancers du poumon seraient imputables à la pollution atmosphérique. En 1990, l’EPA des États-Unis a estimé que, d’après les risques unitaires des agents cancérogènes connus ou soupçonnés présents dans l’air ambiant, 0,2 % de tous les cancers et moins de 1 % des cancers du poumon pouvaient être attribués à la pollution atmosphérique76. En revanche, la fraction étiologique du risque en ce qui concerne le tabagisme et le radon est considérablement plus élevée. On estime, notamment,  que 87 % des cancers du poumon peuvent être attribués au tabagisme, et entre 10 et 15 % au radon77.

Des études de cohorte récentes révèlent toutefois que des augmentations atteignant 50 % du risque de cancer du poumon pourraient être attribuables à l’exposition à la pollution atmosphérique et être associées en particulier aux indices de sulfates et de particules fines39b,40b,78. En se fondant sur une estimation prudente selon laquelle 20 % de la population appartient au groupe à faible exposition (RR 1,1), 4 % au groupe à exposition modérée (RR 1,3) et 1 % au groupe à exposition élevée (RR 1,5), environ 3,6 % des décès par cancer du poumon dans l’Union européenne pourraient être attribuables à l’exposition à la pollution atmosphérique47b. On estime qu’entre 5 et  7 % des cancers du poumon chez les sujets n’ayant jamais fumé et chez les ex- fumeurs sont attribuables à la pollution de l’air, selon une étude européenne multicentrique dans laquelle l’exposition à la pollution de l’air a été évaluée à partir des données sur les concentrations des stations de surveillance79. Ailleurs, un rapport de recension rédigé par Nikic et Stankovic donne à penser que l’estimation ne dépasse probablement pas 2 %, résultat obtenu en appliquant les risques unitaires des cancérogènes connus ou soupçonnés présents dans l’air atmosphérique80. Ces études portent à croire que bien que le tabagisme demeure le principal facteur de risque, les estimations de la fraction étiologique du risque largement citées – et présentées ci-dessus – ne sont peut-être pas assez élevées. Dans leurs études, ces chercheurs ont eu recours à l’approche de cohorte prospective pour tenter de pallier les limites des plans d’études écologiques. Ils ont aussi pris en considération des facteurs de confusion importants, comme le tabagisme et l’éducation. Toutefois, la plupart des études se sont limitées à utiliser des estimations de l’exposition dans des emplacements fixes de la région ou du voisinage, lesquelles ne tiennent pas compte des différences individuelles dans les profils d’activité ou n’effectuent pas d’ajustement pour prendre en compte les effets de l’exposition au radon ou à la pollution à l’intérieur. On n’a pas pris en compte, en général, les changements dans le temps.

Difficultés méthodologiques inhérentes à l’étude des associations entre la pollution atmosphérique et le cancer

Cette section sur l’évaluation de l’exposition et les erreurs de mesure est intégrée au chapitre sur la pollution atmosphérique étant donné que quelques-unes des méthodes décrites ont été élaborées dans le cadre d’études sur la pollution de l’air. Bien que certains concepts représentent des éléments de biostatistique avancée, des notions, même rudimentaires, de ces concepts vont aider à évaluer la documentation sur l’association entre le cancer et la pollution atmosphérique.

Dans l’ensemble, un des principaux obstacles auxquels se sont butées toutes les études sur la pollution atmosphérique et le cancer à ce jour a été la caractérisation inadéquate de l’exposition. En règle générale, les estimations de l’exposition à la pollution atmosphérique de toutes les personnes vivant dans un territoire donné ont été fondées sur les concentrations moyennes  ou médianes relevées par des stations de surveillance fixes situées sur ce territoire; c’est-à-dire que l’on suppose que toutes les personnes vivant dans la même région ont eu la même exposition. Cette limitation est particulièrement sérieuse car les variations de certains polluants associés à la circulation automobile (NO2 et particules ultrafines) dans une même ville peuvent être plus élevées que les variations entre les villes81,82. De plus, même des personnes vivant à proximité l’une de l’autre peuvent subir des expositions différentes. Les expositions à la pollution atmosphérique dépendent des profils d’activité et peuvent varier selon la saison, et certains emplois peuvent être associés à des expositions différentes. Les antécédents de résidence depuis la naissance n’ont que très rarement, sinon jamais, été pris en compte. En outre, les tentatives de longue durée en vue de caractériser l’exposition font généralement appel à des estimations annuelles de l’exposition, qui ne permettent pas de rendre compte des effets potentiellement importants à long terme d’augmentations très élevées de l’exposition sur une courte période. S’il est vrai que des personnes vivant au même endroit pourraient avoir connu des expositions semblables pendant une période donnée, il est très probable que leurs expositions cumulatives sur toute leur vie ont été fort différentes, en raison de la mobilité de la population. Au Canada, un recensement récent83 a révélé que près de 25 % de la population avait changé de lieu de résidence au cours des cinq années précédentes. Des appareils de surveillance personnelle sont maintenant utilisés dans le cadre de certaines études; toutefois, compte tenu de la période de latence que comporte le développement des cancers et de la nécessité d’avoir une évaluation rétrospective de l’exposition, de telles méthodes sont difficilement applicables pour des études sur l’ensemble d’une population. Dans cette situation, il faudrait pouvoir mesurer l’exposition sur une cohorte d’au moins 20 000 personnes, au moyen d’une étude prospective s’étendant sur plusieurs décennies. Ces appareils peuvent s’avérer utiles dans le cas d’expositions professionnelles. Dans les études sur le cancer, ils peuvent servir à la création de matrices emploi-exposition rétrospectives; toutefois, ce type d’étude devrait soit présumer que l’exposition actuelle est représentative des expositions antérieures, soit disposer d’un moyen quelconque de faire cet ajustement.

On aura sans doute de plus en plus recours, au cours des années à venir, aux données de l’imagerie par satellite pour estimer les concentrations de PM et de NO2. Cette approche permet d’obtenir des estimations de la pollution pour des étendues quadrillées rectangulaires, sur une base de 10 km par 10 km, et par conséquent pour toutes les régions géographiques (les estimations sont meilleures pour certaines régions que pour d’autres), et pas seulement pour celles situées tout près des stations de surveillance fixes84.

Ces limites peuvent donner lieu à des erreurs de classification importantes de l’exposition et donc fausser les risques relatifs estimés. Outre le manque de données sur d’autres facteurs de risque connus ou soupçonnés, une autre lacune importante découle du fait que des mesures imprécises des covariables sont traitées comme s’il s’agissait de mesures exactes. Dans la plupart des situations, une erreur de classification de l’exposition a pour effet de biaiser les estimations du risque vers un effet nul (c.-à-d. aucun effet) et il en découle une hausse de la variance résiduelle du modèle. Lorsque l’erreur de mesure de l’exposition est importante, comme c’est souvent le cas dans des études épidémiologiques environnementales de grande envergure, le biais peut être considérable. Une analyse qui ne tient pas compte de l’imprécision des covariables peut donc masquer la présence d’un effet statistiquement important. Ces limites ont été reconnues par plusieurs chercheurs18,22,28b. Dans d’autres données sur les facteurs de risque, les estimations du risque peuvent être biaisées dans une direction ou dans l’autre par une erreur de mesure. Il est possible qu’il existe des sources importantes de biais, étant donné qu’au cours d’un long intervalle de suivi, les expositions ayant un effet confusionnel (p. ex. le tabagisme) peuvent changer.

Dans le reste du chapitre, nous discuterons des nouvelles méthodologies mises au point pour estimer l’exposition cumulative à la pollution atmosphérique en utilisant des données de surveillance historiques et en intégrant les erreurs de mesure dans l’analyse. L’attention accordée à l’exposition cumulative s’explique par l’importance du rapport entre les expositions chroniques à la pollution et le cancer.

Évaluation de  l’exposition cumulative

Il n’est possible d’estimer l’exposition cumulée pendant toute la vie à la pollution de l’air extérieur que si l’on possède des informations sur les antécédents de résidence des personnes étudiées ainsi que des données historiques sur la pollution atmosphérique de leurs territoires de résidence. S’il est généralement possible d’obtenir les renseignements sur les lieux de résidence, par contre, il existe peu de  données historiques sur la pollution atmosphérique avant 1990. Par exemple, dans une récente étude pancanadienne de grande envergure sur les facteurs de risque liés à l’environnement – entreprise par Santé Canada en collaboration avec ses partenaires provinciaux et appelée « Système national de surveillance accrue du cancer (SNSAC)85a » –, des données ont été recueillies sur les antécédents de résidence ainsi que sur des facteurs de confusion importants, comme le tabagisme, l’alimentation et les antécédents professionnels, auprès de  20 000 patients atteints de cancer et  de 5 000 témoins issus de la population générale. Une base de données sur les expositions potentielles a également été établie. Les polluants modélisés dans l’étude sont les PM10, l’O3, le CO, le NO, le NO2 et le SO2. En règle générale, il est possible d’obtenir des mesures historiques de la pollution atmosphérique effectuées par des stations fixes faisant partie de réseaux de surveillance gouvernementaux; certaines stations fonctionnent depuis plus de vingt ans, mais les dates de mise en service varient considérablement.

Même en ayant accès aux antécédents de résidence et aux données historiques sur la pollution atmosphérique, les difficultés inhérentes à l’estimation de l’exposition pendant toute la vie persistent. Il est en effet impossible de mesurer la pollution atmosphérique à tous les endroits pertinents, comme les lieux de résidence, en raison des coûts inhérents à une telle opération. Par conséquent, le problème de base consiste à prédire la concentration à un endroit non surveillé à partir des concentrations relevées aux stations de surveillance. On peut ensuite agréger  les prédictions faites pour différents lieux de résidence de façon à obtenir une estimation de l’exposition cumulative. Toutefois, même ces méthodes pourraient être inexactes, car elles ne tiennent pas compte des différences dans les profils d’activité et, par conséquent, elles peuvent entraîner une erreur de classification de l’exposition à la pollution de l’air extérieur à l’échelle individuelle.

De tels problèmes, dits d’interpolation spatiale, surviennent dans d’autres  domaines, notamment en génie, en géologie, en sciences des sols, en hydrologie et en exploitation minière. Les analystes s’attaquent généralement à ces problèmes en utilisant la méthode bien connue de « krigeage »,  introduite au cours des années 60 par Matheron86. La méthode de krigeage prédit les concentrations à un endroit donné à l’aide d’une moyenne pondérée de toutes les concentrations observées aux stations de surveillance, les coefficients de pondération étant inversement proportionnels à la distance entre l’endroit en question et les stations. Ces prédictions prennent un intéressant caractère d’optimalité, c’est-à-dire qu’elles constituent le meilleur estimateur linéaire non biaisé, lorsque la covariance entre les endroits (ou de façon équivalente le variogramme) est connue. Le krigeage nécessite un réseau assez dense de stations de surveillance (entre 10 et 100) selon le type d’analyse87. On a élargi la méthode pour y intégrer des renseignements additionnels sur des covariables afin d’améliorer l’interpolateur. On parle alors de « co-krigeage »88.

Ces approches supposent implicitement qu’il y a isotropie du champ de pollution atmosphérique dans la région étudiée; c’est-à-dire que plus deux endroits sont rapprochés, plus les concentrations sont semblables. Cette supposition est généralement irréaliste dans le cas de données environnementales en raison des différences géographiques et météorologiques potentielles. Par exemple, les concentrations à deux endroits situés sur les flancs opposés d’une montagne peuvent ne pas être très semblables malgré la proximité géographique. Par contre, deux endroits éloignés peuvent avoir des concentrations très semblables s’ils se trouvent dans la direction du vent dominant.

De plus, ces méthodes ne tiennent pas compte de l’incertitude associée à la structure de covariance du champ de pollution dans leurs mesures de l’erreur d’interpolation, ce qui mène à une confiance injustifiée dans les valeurs interpolées. Plusieurs auteurs ont depuis reconnu ces limites et ont proposé des modifications pour en tenir compte89,90. Bien qu’elles permettent de surmonter partiellement ces problèmes, ces modifications supposent toujours une isotropie pour le champ de pollution.

Une nouvelle théorie qui permet de contourner les difficultés décrites ci-dessus a récemment été élaborée pour l’interpolation spatiale du taux de pollution atmosphérique91a,92a. Cette approche, qui est une solution de rechange bayésienne au krigeage et au co-krigeage, ne suppose ni l’isotropie, ni l’existence d’une structure de covariance connue. La théorie permet d’exécuter la modélisation spatiale et temporelle avec facilité et souplesse. Par ailleurs, elle permet de corriger, s’il y a lieu, les classifications erronées du modèle à l’aide de données additionnelles, lorsque celles-ci apparaissent. Le modèle développé est de type bayésien hiérarchique, où la covariance spatiale demeure totalement non précisée au premier niveau. L’incertitude relative à la structure de covariance est introduite a priori au deuxième niveau, ce qui élimine du même coup la possibilité d’intervalles de confiance excessivement petits pour les interpolants. La structure de covariance est modélisée de façon non paramétrique au moyen de la démarche de Sampson et Guttorp93a, une approche extrêmement puissante qui évite d’avoir à poser l’hypothèse de l’isotropie.

Cette théorie a été élargie et intègre non seulement les données univariées, mais encore les données multivariées mesurées par les appareils de surveillance de l’air ambiant. On peut donc se servir de ces données pour prédire les résultats à des endroits où il ne se fait aucune lecture, par exemple dans les maisons privées. La version élargie94a,95a permet de faire face aux situations dans lesquelles les stations de surveillance ne mesurent pas toutes la même série de polluants et ces stations n’ont pas toutes été mises en service au même moment. Cette version élargie permet d’utiliser toutes les données de diverses provenances sur les différents polluants pour les besoins de l’estimation. Autrement dit, elle permet d’« emprunter de l’information » afin d’estimer avec plus de précision le degré d’exposition aux polluants atmosphériques. Cette nouveauté s’avère très pertinente en ce qui concerne les données environnementales; en effet, il est possible qu’au fil du temps des stations ou des polluants aient été soit ajoutés soit retirés des réseaux en raison de considérations financières ou  de l’acquisition de nouvelles connaissances.

Les études de validation96a montrent que cette méthode donne de très bons résultats. Elle a été appliquée avec succès dans plusieurs évaluations des impacts de la pollution atmosphérique sur la santé97a,98a, dont une réalisée en Colombie-Britannique avec les données cas-témoins du SNSAC. Dans cette étude, on a calculé les distributions spatio-temporelles de polluants spécifiques pour chaque mois entre 1975 et 1995 à l’aide des données historiques sur les concentrations. La figure 1 présente les isoplèthes de la moyenne mensuelle estimée de la concentration d’ozone (juin 1985) pour une région donnée.

Figure 1
Isoplèthes de la moyenne mensuelle de la concentration d’ozone estimée (μg/m3) pour juin 1985, Sud de la Colombie-Britannique

Les distributions prédictives permettent de calculer les concentrations mensuelles estimées, ainsi que les incertitudes correspondantes, pour des territoires précis d’une région. Par conséquent, pour établir les antécédents de résidence d’une personne, on peut, grâce aux distributions prédictives, retracer les lieux de résidence particuliers et agréger les estimations mensuelles correspondantes pour obtenir  les estimations d’exposition cumulative et les incertitudes correspondantes. La figure 2 présente les taux mensuels estimés de la concentration d’ozone pour la période  de 1975 à 1995, calculée pour trois lieux de  résidence d’un participant à l’étude. À l’évidence, la structure et le taux de l’exposition varient considérablement, ce qui donne à penser que les estimations de l’exposition cumulative individuelle fondées sur de courtes périodes pourraient être inadéquates. En outre, les valeurs observées à la station la plus proche du  lieu de résidence sont très différentes des valeurs estimées pour ce lieu de résidence,  ce qui confirme la nécessité de l’interpolation spatiale. L’élaboration de la nouvelle théorie suppose que les champs aléatoires suivent une distribution gaussienne. Il se peut que cette hypothèse soit irréaliste en ce qui concerne les polluants atmosphériques, de sorte qu’il est habituellement nécessaire de procéder à des transformations des champs. Dans certains cas, toutefois, ce n’est pas possible.

Figure 2
Estimations des concentrations moyennes mensuelles d’ozone (µg/m3) entre 1975 et 1995 à trois endroits différents où demeurait le participant l’étude, Sud de la Colombie-Britannique

Les traits tiretés verticaux séparent les trois endroits, alors que la ligne pointillée à droite représente la série d’observations du site de surveillance le plus proche de l’endroit no 3

Une autre approche de l’estimation des taux d’exposition à des lieux de résidence particuliers est l’utilisation d’un modèle de dispersion en conjonction avec des bases  de données sur les émissions et avec le système de données géographiques. Cette approche a été utilisée dans une étude cas-témoins en Suède48b et a donné des estimations qui correspondaient aux mesures de l’air ambiant pour le NO2 à divers sites99a. Les bases de données sur les émissions ne sont généralement pas facilement accessibles, et il peut arriver que l’on doive les construire pour les besoins d’études particulières. La construction de telles bases de données peut se révéler une tâche énorme : elle pourrait, par exemple, nécessiter des données sur la croissance des zones urbaines, le développement des réseaux de chauffage urbains et les sources industrielles locales d’émissions ainsi que les caractéristiques de la circulation routière99b. La construction d’estimations rétrospectives des émissions peut également être impossible à réaliser.

La popularité des méthodes de régression en matière d’utilisation des sols est également en hausse. Ces méthodes prédisent les concentrations de la pollution à un endroit donné en fonction des caractéristiques d’utilisation des sols et de la circulation routière dans les zones avoisinantes. Les concentrations de la pollution sont modélisées comme variable dépendante. Ces méthodes ont été utilisées en Europe dans la modélisation des expositions à une échelle intra-urbaine. Jerrett et coll.100a fournissent le contexte pour diverses méthodes d’évaluation de l’exposition.

Erreur de mesure

Contexte

On reconnaît depuis longtemps que la grande échelle des études d’épidémiologie environnementale rend inévitables les erreurs dans la mesure des attributs et du niveau de l’exposition des individus. De nombreux chercheurs se sont penchés sur cette question, et la majorité des travaux concernant l’erreur de mesure dans l’évaluation de l’exposition professionnelle est applicable ici. Au cours des dernières années, grâce aux innovations dans le domaine de la simulation sur ordinateur, il a été possible d’examiner l’étendue de ces erreurs. Le fait que de nombreux chercheurs ne tiennent pas compte de ce problème pourtant omniprésent s’explique probablement par un manque de vigilance dû à la perception répandue selon laquelle l’erreur de mesure a toujours pour effet de réduire la pente de la droite101a. Cette perception favorise une confiance indue en des résultats qui impliquent le rejet de l’hypothèse nulle, puisqu’on croit que l’erreur de mesure aura « réduit » la pente de la droite de régression, c’est-à-dire qu’elle l’aura ramenée près de zéro. Autrement dit, n’eût été l’erreur de mesure, la valeur p exacte serait encore plus petite.

Le recours de plus en plus fréquent aux modèles de régression non linéaire, phénomène récent en épidémiologie, a peut-être contribué à éveiller l’intérêt des chercheurs pour cette question. Ce phénomène peut s’expliquer par une combinaison de l’évolution de la technologie informatique et d’innovations méthodologiques telles que les modèles linéaires généralisés et les EEG (équations d’estimation généralisée)102a. Les méthodes d’EEG représentent un mécanisme d’ajustement pour les corrélations de données de façon à rendre les erreurs types plus exactes (erreurs plus grandes). La complexité des modèles les plus récents a probablement contribué à remettre en question la conception simpliste que l’on se faisait des modèles de régression linéaire simple.

Ces mêmes innovations expliquent peut-être aussi pourquoi les chercheurs ont accepté de se pencher sur le problème dit des « erreurs dans les variables ». Le modèle de type « erreurs dans les variables » diffère de la régression classique en ce que les variables explicatives « réelles » ne sont pas observées avec exactitude mais plutôt mesurées de façon imprécise. L’ouvrage fondamental de Fuller sur cette question103a a sans nul doute stimulé la recherche, parce qu’il a démontré de façon probante le caractère vraiment complexe et pernicieux de l’erreur de mesure. Depuis la parution de l’ouvrage de Fuller, des progrès remarquables ont été réalisés par plusieurs auteurs101b,104a. Dans cette section, nous présentons une vue d’ensemble très sélective de la problématique, en soulignant notamment l’apport des auteurs.

Types d’erreurs de mesure

En ce qui concerne les variables d’exposition, l’erreur de mesure est généralement définie selon l’une ou l’autre des trois formules suivantes : 1) « classique » ou « de type Berkson »; 2) « différentielle » ou « non différentielle »; 3) « structurelle » ou « fonctionnelle » (annexe I). Pour les différentes catégories d’erreur, des outils méthodologiques différents ont été élaborés. Certains englobent des erreurs mixtes105a.

Cependant, la taxonomie de l’erreur est redondante si l’erreur est traitée dans un cadre bayésien. En effet, tous les éléments d’erreur, et d’autres, sont automatiquement subsumés dans le traitement de toutes les valeurs incertaines (y compris celles associées à une erreur de mesure) comme des variables aléatoires qui peuvent être intégrées à n’importe quelle analyse au moyen de la distribution multidimensionnelle appropriée. Le modèle bayésien se présente donc comme la solution naturelle pour le traitement de l’erreur de mesure. Nous présenterons plus loin les méthodes bayésiennes qui ont été élaborées.

Bien que la statistique moderne s’appuie de plus en plus sur les méthodes bayésiennes, la plupart des théories courantes et même les dernières théories sur le traitement de l’erreur de mesure ont été élaborées suivant le modèle de l’échantillonnage répété. Dans un souci d’exhaustivité, nous décrirons les développements découlant de cette perspective.

Effets de l’erreur de mesure et atténuation

On sait peu de choses de nature qualitative générale sur les effets de l’erreur de mesure, même s’il existe déjà une bonne base méthodologique sur le traitement des erreurs, qui permet d’évaluer les répercussions de l’erreur de mesure dans des contextes particuliers. Toutefois, nous disposons de quelques résultats d’ordre général que nous présentons dans cette sous-section.

En ce qui a trait aux variables binaires d’exposition, Thomas et coll.105b ont montré que dans les études analytiques, les valeurs telles que le risque relatif sont réduites sous l’effet de l’erreur de classement non différentielle. Greenland a obtenu des résultats analogues pour des études cas-témoins par paires106a. De fait, Greenland arrive à une conclusion étonnante : l’erreur de classement non différentielle peut avoir des effets plus nuisibles dans des études avec appariement que dans des études sans appariement, et ces effets sont d’autant plus nuisibles que la qualité de l’appariement est grande. Cette conclusion est d’un grand intérêt pour les chercheurs qui prévoient mener une étude cas-témoins.

Toutefois, on obtient des résultats contraires pour les études écologiques, c’est-à-dire les études fondées sur des grappes. Dans ce genre d’analyses, les populations étudiées sont réparties en groupes et ce sont les valeurs des attributs des groupes qui sont prises en compte dans l’analyse, et non celles des attributs des individus; par exemple, on considère des études écologiques où le degré d’exposition du groupe est mesuré par la proportion des personnes exposées107. L’erreur de classement non différentielle aura généralement pour effet de surestimer les taux (pentes) individuels calculés au moyen d’une analyse de groupe au lieu de les abaisser vers zéro (atténuer) comme c’est le cas pour le modèle de l’erreur classique et la régression linéaire simple. Thomas et coll.105c ont noté les difficultés que posent les variables d’exposition à niveaux multiples (discrètes), qui rendent assez imprévisibles les effets dans les estimations des études écologiques.

Pour ce qui est des variables continues, l’erreur de mesure non différentielle classique tend, dans la régression linéaire simple, à ramener l’effet apparent de l’exposition à la valeur nulle. Par contre, un tel résultat ne se produit pas dans le modèle d’erreur de Berkson, dans lequel l’effet apparent conserve un caractère non biaisé. Gustafson et Le108a ont confirmé ces résultats pour des études plus générales qu’une régression linéaire simple.

En règle générale, le fait de négliger l’erreur de mesure peut créer une foule de problèmes, hormis le biais d’atténuation dont il est question ci-dessus109a. L’annexe II donne des exemples de ce genre de problèmes. Faute d’espace, nous ne pouvons, dans le cadre du présent article, présenter tous les autres problèmes imputables à l’erreur de mesure. Nous invitons plutôt le lecteur à consulter les études exhaustives disponibles dans les ouvrages publiés101c,104b.

Thomas et coll.105d donnent un bon aperçu des méthodes d’ajustement utilisées pour compenser l’erreur de mesure dans le calcul du degré d’exposition. L’annexe III donne un bref aperçu des méthodes le plus directement applicables à l’épidémiologie des cancers dus à des facteurs environnementaux. Carroll et coll.101d présentent un examen plus complet et plus détaillé de ces méthodes. Une analyse plus approfondie sur les développements bayésiens dans les études cas-témoins peut être consultée dans Gustafson104c et Gustafson et coll.114,115.

Épidémiologie des cancers dus à des facteurs environnementaux

Dans cette section, nous décrivons de façon générale une approche de l’épidémiologie du cancer dans le contexte de la santé environnementale. L’évaluation du risque lié à l’environnement dans ce contexte est souvent difficile. On s’attend à ce que les risques relatifs de cancer associés aux facteurs environnementaux soient faibles et difficilement détectables. De plus, pour certains problèmes de santé, l’intervalle entre l’exposition et l’apparition de la maladie peut être très long.

Pour parvenir effectivement à déceler les effets environnementaux, les chercheurs des études en santé de l’environnement peuvent avoir recours à des populations témoins de type « quasi-expérimental » ou « quasi-témoins ». Autrement dit, ils ciblent des sujets appartenant à des sous-populations à forte exposition et à faible exposition, c’est-à-dire des « grappes ». Ces grappes peuvent être établies par sous-régions géographiques, comme dans le cas de l’étude longitudinale à niveaux multiples sur la fonction pulmonaire et la maladie chez l’enfant qui est actuellement menée dans le Sud de la Californie par Duncan Thomas et ses collaborateurs116,117. Dans cette étude, la principale exposition examinée est l’exposition à la pollution atmosphérique, et les grappes sont des sous-populations d’enfants d’âge scolaire dans un certain nombre de régions du Sud de la Californie. Certaines régions très polluées et d’autres peu polluées ont été choisies au hasard pour cette étude. Des données pertinentes sur d’autres facteurs de risque sont recueillies tant pour les « cas » que pour les « témoins ».

Cependant, il existe une difficulté possible : le fait que le classement des grappes prospectives selon le degré d’exposition doive être effectué largement a priori (de façon heuristique). Si les sujets sont ensuite suivis dans le temps, il pourrait bien s’avérer que les différences entre les grappes ne soient pas suffisamment importantes pour permettre d’effectuer des comparaisons utiles. Dans l’épidémiologie du cancer, il ne serait pas réaliste de suivre ainsi les sujets, étant donné que les périodes de latence sont habituellement longues. Cela oblige les chercheurs à recourir à des analyses purement rétrospectives. S’ils utilisent des dossiers administratifs, les chercheurs peuvent être obligés d’intégrer à leur étude un facteur écologique avec toutes les difficultés inhérentes à l’évaluation du risque individuel qu’il comporte. À cet égard, la difficulté fondamentale est l’incapacité à recueillir des données sur les changements de ces facteurs de risque au fil du temps.

Notant les problèmes associés aux études écologiques, Johnson et coll.85b ont plutôt préconisé la réalisation d’une étude cas-témoins afin de tenter d’élucider les causes environnementales du cancer dans un échantillon de Canadiens en population. Le concept d’étude cas-témoins qu’ils proposaient consistait à apparier plutôt sommairement les cas aux témoins (au moyen de l’appariement de fréquence) en fonction de l’âge et de la région de résidence, caractéristique souhaitable de leur plan d’étude si on se réfère aux travaux de Greenland106b cités précédemment. Les auteurs présentent une liste complète des cofacteurs (alimentation, statut socio-économique, exercice, tabagisme et profession), dont il faut, idéalement, tenir compte dans l’analyse. Néanmoins, l’étude cas-témoins présente certaines limites, en particulier le biais de mémoire et le biais de participation. Le biais de participation pourrait essentiellement faire en sorte que les témoins ne soient pas représentatifs de la population à l’origine des cas, tandis que le biais de rappel peut influer sur les estimations du risque lorsqu’il existe des différences entre les cas et les témoins quant au rappel des expositions passées. Ce sont des limites importantes, qui incitent à se fier davantages aux conclusions tirées d’études prospectives (de cohorte).

Johnson et coll.85c soulignent également la nécessité de tenir compte de la « mobilité résidentielle » des participants, étant donné qu’il s’agit d’un facteur important dans la détermination des expositions liées à l’environnement. Les avantages attendus de l’utilisation de grappes de quasi-témoins pourraient bien être amoindris par une variation non prise en compte attribuable à des facteurs comme le passage des sujets d’une grappe à l’autre, ce qui aurait pour effet de créer effectivement une « erreur liée à la classification erronée » importante dans des études analytiques ou écologiques. Le niveau d’activité de chaque individu est également important.

Johnson et coll.85d ont proposé d’utiliser la « Base de données sur la qualité de l’environnement » dans leur étude du rôle des facteurs environnementaux dans le développement du cancer. Ils n’ont guère abordé, toutefois, l’effet probable de l’erreur inévitable dans la mesure de l’exposition. En raison de la période de latence prolongée du cancer et de la difficulté inhérente à la reconstitution des antécédents d’expositions, la taille d’une telle erreur est probablement considérable. En fait, elle peut être considérable même dans les études prospectives, parce qu’il est peu pratique de mesurer le taux d’exposition individuelle par opposition à l’exposition ambiante. Pour donner des résultats convaincants, toute analyse statistique doit donc reconnaître les erreurs de mesure au niveau fondamental et en tenir compte. En outre, pour tenir compte de cette erreur, il faut effectuer une analyse rétrospective des séries spatio-temporelles existantes pour les risques environnementaux pendant des périodes variables, selon la durée de la surveillance des facteurs environnementaux par les diverses stations de surveillance. L’erreur peut provenir non seulement de la base de données environnementale, qui est fondée sur la détermination objective de l’exposition, mais aussi des variables confusionnelles, en raison du recours à des données autodéclarées (remémoration inexacte, biais de mémoire, etc.).

L’annexe IV décrit une stratégie statistique possible pour l’analyse des risques liés à l’environnement, qui tient compte de l’erreur de mesure et concerne un problème de santé chronique comme le cancer. En gros, les expositions cumulatives y sont estimées au moyen de la méthode bayésienne94b,95b récemment développée et présentée dans la section précédente. Ces estimations de l’exposition s’accompagnent d’une mesure associée des incertitudes, y compris les erreurs de mesure, qui peut être intégrée directement à l’analyse des effets sur la santé au moyen de la méthode de l’équation d’estimation généralisée98b,102b,105e. La stratégie comporte également une série spatio-temporelle de covariables environnementales comprenant les facteurs de risque. La formulation abstraite du problème permet d’englober à la fois les études individuelles et écologiques. Cette dimension est obtenue en utilisant la « grappe » comme unité de base. La grappe peut représenter un seul individu suivi de façon prospective ou rétrospective dans le temps ou une grappe de personnes pour lesquelles on dispose d’une série de mesures de l’exposition. Zidek109b propose un examen plus approfondi de cette stratégie statistique.

Mot de la fin

Dans ce chapitre, nous avons examiné les indications d’un lien entre le cancer et la pollution atmosphérique. Nous avons recensé les difficultés méthodologiques qui affectent la précision des éléments de preuve, en particulier la caractérisation inadéquate des expositions à la pollution atmosphérique et la non-prise en compte de la possibilité d’une erreur de classement. Notre analyse a porté spécifiquement sur l’association possible entre la pollution atmosphérique et le cancer, bien que la démarche puisse être appliquée aux maladies chroniques en général. L’étude de la relation entre les facteurs de risque et les résultats chroniques sur la santé s’est avérée difficile, étant donné que les sujets, de par leur mobilité, auront résidé dans des régions où les concentrations de pollution n’ont pas été mesurées, ce qui donne lieu à une erreur de mesure potentielle. Nous avons examiné les effets nuisibles et imprévisibles d’une telle erreur et de la nécessité qui en résulte d’atténuer ces effets à l’aide de prédicteurs des expositions non mesurées. Nous avons décrit aussi une nouvelle approche générale qui peut être adoptée en épidémiologie environnementale afin de parvenir jusqu’à un certain point à surmonter ces difficultés. D’autres recherches sur des méthodes comme celles qui sont abordées ici seront nécessaires, étant donné qu’en épidémiologie environnementale l’identification des facteurs de risque des maladies chroniques s’est révélée plus compliquée que dans le cas des maladies aiguës. Une description plus détaillée et un examen des développements récents se retrouveront dans le prochain livre de Le et Zidek127.

Annexe I. Taxonomie de l’erreur de mesure

Les erreurs de mesure classiques s’observent dans les études « analytiques », c’est-à-dire les études portant sur des individus; on mesure l’exposition au moyen de l’équation W = X + U, où X désigne l’« exposition réelle » et U, le « bruit » indépendant. L’erreur de type Berkson se produit, par exemple, lorsque tous les membres d’une sous-région se voient attribuer une valeur infrarégionale unique, W, qui est obtenue à partir d’un moniteur du milieu ambiant pour cette région et que X = W + U, U représentant un terme d’écart indépendant attribuable à des différences individuelles. Carroll et coll.101e ont utilisé plutôt les termes « étalonnage d’erreur » et « étalonnage de régression », respectivement, pour décrire ces deux catégories de modèles d’erreurs. Ces deux modèles en apparence semblables sont en réalité très différents en pratique au point de vue de leurs répercussions.

Le modèle mixte de Thomas et coll.105f s’observe lorsque W = X + U (classique) tandis que X = Z + V (Berkson), où Z est une variable de l’environnement parasite et V représente une variable résiduelle additive de Berkson.

L’erreur de mesure non différentielle s’observe lorsque les caractéristiques de santé Y et W sont des variables aléatoires indépendantes et que X, l’exposition réelle, est donnée. En d’autres termes, la mesure ne donne aucune information sur la caractéristique autre que celle qui est contenue dans la variable X. Dans ce cas, contrairement au modèle de l’erreur « différentielle », W sert simplement de « substitut » pour l’exposition réelle et rien de plus. Carroll et coll.101f ont souligné que, dans de nombreuses situations, le modèle de l’erreur non différentielle permettrait une meilleure description. En particulier, cette méthode pourrait s’appliquer à l’étude des effets aigus sur la santé des expositions environnementales.

L’erreur de mesure structurelle s’observe lorsque l’exposition réelle est aléatoire, tandis que l’erreur fonctionnelle s’observe lorsque l’exposition réelle est définie comme une valeur fixe (mais inconnue).

Dans le cas (techniquement élémentaire) des variables d’exposition binaires (0 = « faible » et 1 = « élevée », par exemple) l’erreur de mesure est appelée « erreur de classement ». Bien qu’elle soit pertinente théoriquement, la dichotomie « classique-de Berkson » ne peut être utilisée officiellement. En effet, il est à remarquer que l’espérance mathématique E(W | X)  ne peut être égale à X (qui prend les valeurs 0 ou 1 sauf dans les cas dégénérés), comme cela devrait l’être si le modèle classique était utilisé. Néanmoins, les concepts peuvent être exprimés par une reformulation du modèle de l’erreur de mesure en termes de probabilités et de probabilités conditionnelles.

Annexe II. Quelques problèmes associés au fait de ne pas tenir compte de l’erreur de mesure

Zidek109c a démontré, dans le cas de l’erreur de mesure structurelle non différentielle, que la « courbure » des modèles de régression non linéaire peut influer sur la covariance de la structure de covariance  de l’erreur de mesure.

Afin de voir, dans un contexte simple, certaines des difficultés qui se présentent, examinons simplement un vecteur de caractéristiques à trois variables (Y, X, Xg) ayant une distribution normale conjointe multidimensionnelle. Considérons le « modèle d’impact » courant, E[Y | X] = exp[β X]. L’inférence concerne β, et (X, Xg )  suit une distribution normale à deux variables. Or, E[Y | Xg] = E{exp[β X] | Xg} si Y et Xg sont conditionnellement indépendantes, étant donné X. Ainsi  E[Y | Xg]= exp[ββX,Xg Xg+β2σX,Xg/2]. Comme dans le cas du modèle linéaire, l’erreur systématique induite par l’erreur de mesure est exprimée par βX,Xg. Cependant, la « courbure » du modèle suppose ici, avec la variance résiduelle σX,Xg, l’existence d’une mesure du degré de représentativité de la variable instrumentale Xg pour X. Si la variance résiduelle était 0, on pourrait ajuster le modèle simpliste Y= exp[ b Xg ] et ensuite compenser l’erreur systématique dans l’estimateur b de β exactement comme dans le cas linéaire. Néanmoins, si σX,Xg n’est pas nulle, il faudra arbitrer entre la nécessité de majorer b afin de compenser l’erreur systématique et la nécessité de réduire b pour compenser le manque de précision. Pour être précis, si l’on a une importante variance résiduelle et si l’on ajuste le modèle Y sur Xg ci-dessus, la valeur ajustée de β se rapprochera de 0.

L’effet peut donc être supérieur à l’atténuation qui crée l’erreur systématique. L’effet de l’erreur ne peut donc pas être prévu sans une analyse détaillée; l’erreur peut donc grossir ou amoindrir le coefficient qui traduit le degré d’exposition en effet sur la santé.

Zidek et coll.110a ont décrit un problème plus délicat qui peut se poser lorsque l’erreur de mesure structurelle non différentielle et la colinéarité s’observent toutes les deux. Les auteurs considèrent, par hypothèse, qu’une caractéristique étudiée suit une distribution de Poisson ayant une moyenne conditionnelle exp(α0 + α1 x). Ici, x est une réalisation de X, la « cause » de Y. Une deuxième covariable prédictive, w , a été observée, mais x et w sont mesurées en évaluant l’erreur selon le modèle classique non différentiel pour produire X et W. On a démontré, au moyen d’une étude de simulation, que si un chercheur devait ajuster exp(α0 + α1 x + α2W) lorsque l’erreur de mesure pour X est assez importante comparativement à celle pour W, alors que X et W sont assez étroitement corrélés, son analyse peut très bien démontrer que α1 est non significatif et α2, significatif. Ainsi, bien que X représente le facteur causal, c’est W qui, dans les faits, tient ce rôle. La causalité a ainsi été « transférée » par la combinaison de l’erreur de mesure et de la colinéarité. Fuller103b a fait mention de ce phénomène pour les modèles de régression linéaire. Bien qu’il soit hypothétique, le résultat soulève de sérieuses préoccupations en pratique. Serait-il possible d’attribuer toute conclusion significative d’une étude multidimensionnelle des effets des facteurs environnementaux sur la santé au simple jeu des variables? Cette préoccupation est confirmée de nouveau par Fung et Krewski111a, qui ont approfondi et confirmé l’analyse de Zidek et coll.110b en examinant les modèles d’erreur classique et d’erreur de Berkson.

Annexe III. Méthodes de compensation de l’erreur de mesure les mieux adaptées à l’épidémiologie des cancers dus à des facteurs environnementaux

Dans le cadre de l’établissement de l’erreur de mesure structurelle, Carroll et coll.101g désignent par l’expression « étalonnage de régression » la méthode la plus générale (hormis celle qui est offerte par le modèle bayésien) pour traiter l’erreur de mesure. Cette méthode consiste à remplacer la variable X qui a été mesurée erronément par E(X | Z,W) dans le modèle de régression, où W représente la valeur mesurée de X, et Z, d’autres covariables ou prédicteurs qui ont été mesurés sans erreur. On obtient ainsi le « bon » modèle de régression de Y sur Z et W. Cette espérance conditionnelle suppose des paramètres à valeur inconnue qui devront alors être estimés, probablement par la méthode des moindres carrés pondérés ou la méthode du maximum de vraisemblance. Quoi qu’il en soit, les estimations de l’effet de X, telles qu’elles sont exprimées par ces paramètres, seront corrigées en fonction de l’erreur de mesure.

Pierce et coll.112 favorisent cette méthode. De plus, ils préconisent son utilisation pour le calcul de l’erreur de mesure fonctionnelle, et suggèrent une façon de construire et d’interpréter une distribution appropriée pour la variable X non aléatoire.

Une « méthode complémentaire » (selon la terminologie de Carroll et coll.101h) est fournie par Cook et Stefanski113. Cette méthode dite SIMEX utilise le modèle erroné pour une succession d’ensembles de données que l’on constitue en additionnant aux valeurs W des erreurs aléatoires indépendantes dont la variance va en progressant. Les estimations des coefficients de régression qui en résultent peuvent alors être représentées graphiquement et le graphe peut être prolongé à rebours jusqu’à la variance nulle pour connaître l’estimation du coefficient qui aurait été obtenue si X avait été mesurée plutôt que W.

La méthode SIMEX semble prometteuse et très intéressante intuitivement. Néanmoins, Fung et Krewski111b, en se fondant sur leur étude de simulation, lui préfèrent la méthode d’étalonnage de régression. Leurs observations détaillées sur l’efficacité des lectures seront utiles aux chercheurs qui sont confrontés au problème des erreurs de mesure dans la pratique.

Carroll et coll.101i décrivent des méthodes de vraisemblance, des méthodes bayésiennes et des méthodes semi-paramétriques pour traiter l’erreur de mesure. Ils abordent également des méthodes conçues spécialement pour l’erreur de mesure fonctionnelle.

Annexe IV. Une méthode statistique intégrant l’erreur  de mesure pour l’analyse des risques liés à l’environnement

Nous supposons K groupes et T périodes. Pour une paire donnée (k,t), k = 1, … ,K,  t = 1, …, T , Ykt désigne un effet observable sur la santé. Par ailleurs, Xkt est le vecteur des covariables, dont certaines sont aléatoires, d’autres fixes. Elles peuvent inclure l’exposition cumulative dans le temps. Soit Yke le vecteur de toutes les réactions pour le groupe k, et Y, le vecteur pour l’ensemble des groupes.

Examinons l’exemple suivant pour avoir une plus juste idée. Burnett et coll.118a ont exploré les répercussions possibles de la pollution atmosphérique sur la santé en examinant l’association entre la morbidité respiratoire et des facteurs de risque désignés. Les jours d’été, t, (de 1983 à 1988) ont constitué la période visée par leur étude et les sous-régions de l’Ontario, k, les « groupes ». Pour évaluer les effets sur la santé, on a dénombré aléatoirement les admissions quotidiennes à l’hôpital {Ykt}. Les concentrations quotidiennes de polluants atmosphériques de même que les variables météorologiques constituaient les covariables (y compris leurs valeurs décalées), Xkt. Ainsi, les paires (Ykt Xkt) ont fait partie de leur analyse de régression.

Cependant, les covariables dans Xkt n’ont pas été réellement mesurées pour la plupart des k. Ainsi, Burnett et coll.118b ont dû imputer des valeurs en se servant des mesures enregistrées par les appareils de surveillance du milieu ambiant les plus près des sous-régions où se trouvait l’hôpital accueillant les patients. Parallèlement à cela, ils ont fait abstraction de l’erreur d’imputation (erreur de mesure) de type Berkson qui a été introduite par la même occasion. Zidek et coll.119a ont réexaminé cette étude en appliquant de nouvelles méthodes prometteuses qui supposent l’utilisation de mesures imputées, mais reconnaissent officiellement l’erreur d’imputation dans l’analyse. En raison de leurs applications possibles en épidémiologie du cancer, ces méthodes sont maintenant décrites.

En premier lieu, une brève description de l’élaboration d’une méthode d’imputation pour des variables indépendantes non mesurées est fournie. Cette méthode, décrite en détail par Zidek et coll.98c, est une adaptation de la théorie de Le et Zidek91b, qui a été perfectionnée et évaluée par Brown, Le et Zidek92b, Sun120, Sun121 et Sun, Le, Zidek et Burnett96b. Cette théorie admet un ensemble fixe de vecteurs de covariables communes à tous les sites : {zt}, par exemple le moment de l’année ou la température. Alors, sous réserve des paramètres du modèle, on suppose que  E(Xt | zt) = B zt. Conditionnellement à {zt} et à ces mêmes paramètres, on suppose que {Xt} est une suite de vecteurs aléatoires indépendants avec une distribution normale conjointe multidimensionnelle. En outre, un modèle bayésien hiérarchique sert à rendre compte de l’incertitude à propos des paramètres du modèle, qui sont en fait inconnus. Afin d’atteindre un degré raisonnable de résolubilité, on définit une distribution a priori conjuguée pour les paramètres du modèle. On obtient la distribution prédictive des valeurs non mesurées {Xkt}, étant donné les mesures relevées sur les appareils de surveillance existants, en calculant la distribution marginale tirée de la distribution conjointe de toutes les valeurs incertaines, y compris les paramètres du modèle et les effets  non mesurés.

Or, la distribution a priori hiérarchique fait intervenir de nouveaux paramètres, dits « hyperparamètres ». Afin d’ajuster ces  paramètres, la méthode en deux étapes de Brown, Le et Zidek92c peut être utilisée. Cette méthode se fonde d’abord sur l’algorithme EM (selon la manière de Chen122) pour estimer les hyperparamètres associés aux covariables mesurables. Ensuite, la méthode de Sampson et Guttorp93b est utilisée pour élargir le concept de l’hypercovariance estimée, afin d’inclure les hypercovariances relatives à des paires de sites, dont au moins un des éléments n’a pas d’appareil de surveillance. Pour rendre les données conformes aux hypothèses du modèle, les données doivent être « pré-blanchies ».

Comment peut-on utiliser maintenant la distribution prédictive qui a été décrite brièvement ci-dessus? On peut tenter de répondre à cette question en se reportant à l’ouvrage de Duddek et coll.97b. Ces derniers perfectionnent les méthodes de Burnett et Krewski123 et de Lindstrom et Bates124. La méthode de Duddek et coll. est perfectionnée à son tour dans Zidek et coll.119b dans le but de surmonter une lacune technique des théories précédentes. Davidian et Giltinan125 offrent une référence générale récente sur le sujet, mais leur ouvrage ne porte pas sur les progrès qui sont décrits ici.

De fait, la nouvelle analyse de Zidek et coll.98d se sert de la méthode de l’équation d’estimation généralisée (EEG) (voir Liang et Zeger102c), telle qu’elle a été adaptée par Zidek et coll.119c. Un avantage de cette méthode est de n’exiger que les moments d’ordre un et deux tout au plus. Ainsi, on a besoin seulement de E(Xkt) = zkt et de  Cov( Xkt1 , Xkt2 )=Gkt1t2 à partir de la distribution combinée des vecteurs des variables explicatives. Afin de construire une matrice de covariances « provisoire », Duddek et coll.97c et Zidek et coll.98e utilisent Gkt1t2=0 lorsque t1 ≠ t2. Un autre avantage bien connu de la méthode EEG est sa capacité d’« ajuster » la matrice de covariances provisoire et d’estimer la covariance « réelle ».

Afin de terminer la mise en œuvre de la méthode de Zidek et coll.98f, il faut définir les moments de la distribution conditionnelle du nombre quotidien d’admissions à l’hôpital. À cette fin, E (Ykt| Xkt) = mktexp(b’Xkt) peut être prise en considération. Dans ce modèle relatif aux caractéristiques de santé, mkt intègre l’effet du jour de la semaine et de la taille de la population du groupe k (de même que des éléments  de faible fréquence tels que la saisonnalité ou la tendance). Alors mkt est considéré comme un facteur de correction connu qui agit comme un filtre passe-haut sur la série Y.

La covariance conditionnelle de Ykt est  Cov( Ykt1, Ykt2|bk, Xkt1,Xkt2 )= δkt1t2 φ mktexp(b’Xkt) où δ désigne la fonction delta de Dirac et φ est un scalaire inconnu appelé paramètre de surdispersion.

Se servant du modèle ci-dessus, Zidek et coll.119d adoptent, pour les Xkt , la distribution prédictive décrite ci-dessus. En particulier, une distribution t matricielle de Student permet de déterminer la valeur probable et la structure de la covariance pour les valeurs Xkt non mesurées. On introduit ensuite ces moments dans la méthode EEG adaptée de Zidek et coll.119e décrite ci-dessus pour estimer des paramètres tels que δ.

Néanmoins, pour construire des séries de données historiques sur des maladies à longue période de latence, comme le cancer, un perfectionnement de la distribution prédictive spatiale est nécessaire. Le problème à résoudre vient de la manière plutôt irrégulière dont on procède pour ajouter de nouveaux appareils de surveillance dans les réseaux actuels. Ils sont mis en service à des moments très différents. Ainsi, les résultats provenant des appareils de surveillance les plus anciens doivent être utilisés pour imputer des valeurs du niveau d’exposition pour tout le territoire où les sujets sont censés s’être déplacés pendant la période de latence.

Un tel perfectionnement a été effectué, de fait, par Le, Sun et Zidek95c. Ils utilisent, en particulier, une nouvelle distribution a priori conjuguée pour la matrice d’hypercovariances, soit la distribution inverse généralisée de Wishart (voir Brown, Le et Zidek)126. Cela donne beaucoup plus de souplesse pour choisir le nombre de degrés de liberté dans cette distribution pour la matrice de covariance spatiale. Ainsi, on peut associer différents degrés de certitude aux covariances relatives aux données provenant des stations de surveillance des différentes sous-régions.

Références

  1. ^  Logan WP. Mortality in the London fog incident, 1952, Lancet, vol. 1, no. 7, 1953, p. 336-8.
  2. a,b  Fishbein L. Sources, nature and levels of air pollutants, dans : Tomatis L, éd.. Air pollution and human cancer, New York, Springer-Verlag, 1990, p. 9-34.
  3. a,b  Environnement Canada. Base d’informations sur l’état de l’environnement. URL :  http://www.ec.gc.ca/soer-ree/ Francais/Indicator_series/default.cfm (cliquer sur Qualité de l’air urbain)
  4. ^  Comité de rédaction. Les maladies respiratoires au Canada. Santé Canada. Ottawa, Canada, 2001. Catalogue H35-593/ 2001F.
  5. ^  OMS 2001. Air Quality and Health, Air Management Information Systems AMIS 3.0.  Organisation mondiale de la santé, Genève.
  6. ^  Air Quality in Ontario 2005 Report. Imprimeur de la Reine pour l’Ontario; 2006. Publication numéro 6041e. URL : http://www.ene.gov.on.ca/fr/ publications/air/index.php
  7. ^  Environnement Canada. Réseau national de surveillance de la pollution atmosphérique (RNSPA), la qualité de l’air au Canada, sommaire pour 2001 et analyse des tendances pour 1990-2001. Direction générale pour l’avancement des technologies environnementales, Service de la protection de l’environnement, Environnement Canada, mai 2004, no de cat. En84-1/2004F.
  8. ^  Environnement Canada. Rapport d’étape quinquennal. Standards pancanadiens relatifs aux particules et à l’ozone. Janvier 2007. URL : http://www.ec.gc.ca/cleanair-airpur/ caol/pollution_issues/cws/toc_f.cfm
  9. ^  Pope CA, Dockery DW. Acute health effects of PM10 pollution on symptomatic and asymptomatic children. Am Rev Respir Dis 1992;145:1123–8.
  10. ^ Pope CA, Dockery DW, Spengler JD, et al. Respiratory health and PM10 pollution: a daily time series analysis. Am Rev Respir Dis 1991;144:668–74.
  11. ^ Yu O, Sheppard L, Lumley T, Koenig JQ, Shapiro GG. Effects of ambient air pollution on symptoms of asthma in Seattle-area children enrolled in the CAMP study. Environmental Health Perspectives 2001; 108:1209-1214.
  12. ^ Schwartz J, Dockery DW. Increased mortality in Philadelphia associated with daily air pollution concentrations. Am Rev Respir Dis 1992 (145):600–4.
  13. ^ Lippman M. Health effects of tropospheric ozone: review of recent research findings and their implications to ambient air quality standards. J Expos Anal Environ Epidemiol 1993;3:103–29.
  14. a,b Aunan K. Exposure-response functions for health effects of air pollutants based on epidemiological findings. Risk Anal 1996;16:693–709.
  15. ^ Willis A, Jerrett M, Burnett RT, Krewski D.  The association between sulfate air pollution and mortality at the county scale: an exploration of the impact scale on a long-term exposure study. J Toxicol Environ Health 2003; Part A 66:1605-1624.
  16. ^ Karakatsami A, Andreadaki S, Katsouyanni K,  Dimitroulis I, Trichopoulos D, Benetou V, Trichopoulou A. Air pollution in relation to manifestations of chronic pulmonary disease: a nested case-control study in Athens, Greece. Eur J Epidemiol 2003; 18:45-53.
  17. a,b Cohen AJ, Pope CA, Speizer FE. Ambient air pollution as a risk factor for lung cancer. Salud Publica Mex 1997;39:346–55.
  18. ^ Katsouyanni K, Pershagen G. Ambient air pollution exposure and cancer. Cancer Causes Control 1997;8:284–91.
  19. ^ Moran EM. Environment, cancer and molecular epidemiology: air pollution. J Environ Pathol Toxicol Oncol 1996; 15:97–104.
  20. ^ Pershagen G. Air pollution and cancer. In: Vainio H, Sorsa M, McMichael AJ, editors. Complex mixtures and cancer risk. Lyon: IARC; 1990. Publication No. 104.
  21. ^ Tomatis L. Air Pollution and human cancer. New York: Springer-Verlag; 1990.
  22. ^ Cohen AJ. Outdoor air pollution and lung cancer. Environmental Health Perspectives 2000; 108:743-750.
  23. ^ Shy CM. Air pollution. In: Schottenfeld D, Fraumeni JF, editors. Cancer Epidemiology and Prevention. 2nd ed. Philadelphia: W.B. Saunders Company; 1996. 407–417.
  24. ^ Freeman AE, Price PJ, Bryan RJ, et al. Transformation of rat and hamster embryo cells by extracts of city smog. Proc Natl Acad Sci USA 1971;68:445–9.
  25. ^ Seinfeld TH. Urban air pollution: state of the science. Science 1989; 243:745–52.
  26. ^ McElroy MB, Salawitch RJ. Changing composition of the global stratosphere. Science 1989;243:763–70.
  27. ^ Nriagu JO, Pacyna JM. Quantitative assessment of worldwide contamination of air, water and soil by trace metals. Nature 1988;333:134–9.
  28. a,b Cohen AJ, Pope CA. Lung cancer and air pollution. Environ Health Perspect, 1995; 103 (Suppl 8):219–24.
  29. ^ Stone V, Shaw J, Brown DM, MacNee W, Faux SP, Donaldson K. The role of oxidative stress in the prolonged inhibitory effect of ultrafine carbon black on epithelial cell function. Toxicology in vitro 1998;12:649-59.
  30. ^ Pritchard RJ, Ghio AJ, Lehmann JR, Winsett DW, Tepper JS, Park P. Oxident generation and lung injury after particulate air pollutant exposure increase with the concentrations of associated metals. Inhal Toxicol 1996;8:457-77.
  31. ^ Nielsen T, Jorgensen HE, Larsen JC, et al. City air pollution of polycyclic aromatic hydrocarbons and other mutagens: occurrence, sources and health effects. Sci Total Environ 1996;189–190:41–9.
  32. ^ Katsouyanni K, Pershagen G. Ambient air pollution exposure and cancer. Cancer Causes Control 1997 May;8(3):284-91.
  33. ^ Pershagen G, Simonato L. Epidemiologic evidence on air pollution and cancer. In: Air Pollution and Human Cancer. Tomatis L.  (ed.). Berlin: Springer-Verlag;1990. p. 65-74.
  34. a,b Doll R. Atmospheric pollution and lung cancer. Environ Health Perspect 1978; 22:23-31.
  35. ^ Doll R, Peto R. The causes of cancer: quantitative estimates of avoidable risks of cancer in the United States today [review]. J Natl Cancer Inst 1981;66:1191–1308.
  36. ^ U.S. Department of Health and Human Services. Public Health Service. Reducing the health consequences of smoking:  25 years of progress. A Report of the Surgeon General. Washington: DHHS (PHS); 1989. No. 89-8411.
  37. ^ U.S. Department of Health and Human Services. The Health Consequences of Smoking: A Report of the Surgeon General. Atlanta, GA: U.S. Department of Health and Human Services, Centers for Disease Control and Prevention, National Center for Chronic Disease Prevention and Health Promotion, Office on Smoking and Health, 2004. ISBN 0-16-051576-2.
  38. ^ Baliunas D, Patra J, Rehm J, Popova S, Kaiserman M, Taylor B. Mortalité et années potentielles de vie perdues en raison du tabagisme au Canada en 2002 : Conclusions tirées dans l’optique de la prévention et des politiques. Maladies chroniques au Canada. 2007;27:154-162.
  39. a,b Pope CA 3rd, Burnett RT, Thun MJ, Calle EE, Krewski D, Ito K, Thurston GD. Lung cancer, cardiopulmonary mortality, and long-term exposure to fine particulate air pollution. JAMA 2002 Mar 6;287(9):1132-41.
  40. a,b Dockery DW, Pope CA, Xu X, et al. An association between air pollution and mortality in six U.S. cities. N Engl J Med 1993;329:1753–9.
  41. ^ Hoek G, Brunekreef B, Goldbohm S, Fischer P,  van den Brandt PA. Association between mortality and indicators of traffic-related air pollution in the Netherlands: a cohort study. Lancet 2002 Oct 19;360(9341):1203-9.
  42. ^ Nafstad P, Haheim LL, Oftedal B, Gram F,  Holme I, Hjermann I, Leren P. Lung cancer and air pollution: a 27 year follow up of 16 209 Norwegian men. Thorax 2003; 58(12):1071-6.
  43. ^ Boffetta P, Dosemeni M, Gridley G, Bath H,  Moradi T, Silverman D. Occupational exposure to diesel engine emissions and risk of cancer in Swedish men and women. Cancer Causes Control 2001; 12:365-374.
  44. ^ Filleul L, Rondeau V, Vandentorren S et al. Twenty five year mortality and air pollution: results from the French PAARC survey. Occup Environ Med 2005 Jul;62(7):453-60.
  45. ^ Abbey DE, Nishino N,McDonnell WF, Burchette RJ, Knutsen SF, Lawrence Beeson W,  et al. Long-term inhalable particles and other air pollutants related to mortality in non-smokers. Am J Respir Crit Care Med 1999;159:373-82.
  46. ^ McDonnell WF, Nishino-Ishikawa N,  Petersen FF, Chen LH, Abbey DE. Relationships of mortality with the fine and coarse fractions of long-term ambient PM10 concentrations in nonsmokers. J Expo Anal Environ Epidemiol 2000;10:427-36.
  47. a,b Boffetta P, Nyberg F. Contribution of environmental factors to cancer risk. Br Med Bull 2003;68:71-94.
  48. a,b Nyberg F, Gustavsson P, Jarup L, Bellander T,  Berglind N, Jakobsson R, Pershagen G. Urban air pollution and lung cancer in Stockholm. Epidemiology 2000; 11: 487-495.
  49. ^ Pershagen G. Lung cancer mortality among men living near an arsenic-emitting smelter. Am J Epidemiol 1985;122:684–94.
  50. ^ Brown LM, Pottern LM, Blot WJ. Lung cancer in relation to environmental pollutants emitted from industrial sources. Environ Res 1984;34:250–61.
  51. ^ Bhopal RS, Moffatt S, Pless-Mulloli T, Phillimore PR, Foy C, Dunn CE, Tate JA. Does living near a constellation of petrochemical, steel, and other industries impair health? Occup Environ Med 1998;55:812-22.
  52. ^ Smith GH, Williams FL, Lloyd OL. Respiratory cancer and air pollution from iron foundries in a Scottish town: an epidemiological and environmental study. Br J Ind Med 1987 Dec;44(12):795-802.
  53. ^ Williams FL, Lloyd OL. The epidemic of respiratory cancer in the town of Armadale: the use of long-term epidemiological surveillance to test a causal hypothesis. Public Health 1988 Nov;102(6):531-8.
  54. ^ Besso A, Nyberg F, Pershagen G. Air pollution and lung cancer mortality in the vicinity of a nonferrous metal smelter in Sweden. Int J Cancer 2003; 107:448-452.
  55. ^ Parodi S, Stagnaro E, Casella C, Puppo A, Daminelli E, Fontana V, Valerio F, Vercelli M. Lung cancer in an urban area in Northern Italy near a coke oven plant. Lung Cancer 2005 Feb;47(2):155-164.
  56. ^ Lyon JL, Fillmore JL, Klauber MR. Arsenical air pollution and lung cancer. Lancet 1977; 2:869.
  57. ^ Michelozzi P, Fusco D, Forastiere F,  Ancona C,Dell’Orco V, Perucci CA. Small area study of mortality among people living near multiple sources of air pollution. Occup Environ Med 1998; 55:611-615.
  58. ^ Perera FP, Mooney LA, Dickey CP, et al. Molecular epidemiology in environmental carcinogenesis. Environ Health Perspect 1996;104:441–3.
  59. ^ Petruzzelli S, Celi A, Pulera N, et al. Serum antibodies to benzo(a)pyrene diol epoxide-DNA adducts in the general population: effects of air pollution, tobacco smoking, and family history of lung diseases. Cancer Res 1998;58:4122–6.
  60. ^ Whyatt RM, Santella RM, Jedrychowski W,  et al. Relationship between ambient air pollution and DNA damage in Polish mothers and newborns. Environ Health Perspect 1998;106:821–6.
  61. ^ Timblin C, BeruBe K, Churg A, et al. Ambient particulate matter causes activation of the c-jun kinase/stress-activated protein kinase cascade and DNA synthesis in lung epithelial cells. Cancer Res 1998;58:4543–7.
  62. ^ Cislaghi C, Nimis PL. Lichens, air pollution and lung cancer. Nature 1997;387:463–4.
  63. ^ Lewis-Michl EL, Melius JM, Kallenbach LR,  Ju CL, Talbot TO, Orr MF, Lauridsen PE. Breast cancer risk and residence near industry or traffic in Nassau and Suffolk Counties, Long Island, New York. Arch Environ Health 1996 Jul-Aug;51(4):255-65.
  64. ^  Bonner MR, Han D, Nie J, Rogerson P,  Vena JE, Muti P, Trevisan M, Edge SB, Freudenheim JL. Breast cancer risk and exposure in early life to polycyclic aromatic hydrocarbons using total suspended particulates as a proxy measure. Cancer Epidemiol Biomarkers Prev 2005 Jan;14(1):53-60.
  65. a,b Norseth T. Environmental pollution around nickel smelters in the Kola Peninsula (Russia). Sci Total Environ 1994 Jun 6;148(2-3):103-8.
  66. ^ Pearson RL, Wachtel H, Ebi KL. Distance-weighted traffic density in proximity to a home is a risk factor for leukemia and other childhood cancers. J Air Waste Manag Assoc 2000; 50:175-180.
  67. ^ Crosignani P, Tittarelli A, Borgini A, Codazzi T,  Rovelli A, Porro E, Contiero P, Bianchi N, Tagliabue G, Fissi R, Rossitto F, Berrino F.  Childhood leukemia and road traffic: A population-based case-control study. Int  J Cancer 2004; 108:596-599.
  68. ^ McKinney PA, Fear NT, Stockton D; UK Childhood Cancer Study Investigators. Parental occupation at periconception: findings from the United Kingdom Childhood Cancer Study. Occup Environ Med 2003 Dec;60(12):901-9.
  69. ^ Raaschou-Nielsen O, Hertel O, Thomsen BL, Olsen JH. Air pollution from traffic at the residence of children with cancer. Am  J Epidemiol 2001; 153(5):433-443.
  70. ^ Reynolds P, Von Behren J, Gunier RB, Goldberg DE, Hertz A. Residential exposure to traffic in California and childhood cancer. Epidemiology 2004; 15:6-12.
  71. ^ Reynolds P, Von Behren J, Gunier RB, Goldberg DE, Hertz A, Smith D. Traffic patterns and childhood cancer incidence rates in California, United States. Cancer Causes Control 2002; 13:665-673.
  72. ^ Langholz B, Ebi KL, Thomas DC, Peters JM,  London SJ. Traffic density and the risk of childhood leukemia in a Los Angeles case-control study. Ann Epidemiol 2002 Oct;12(7):482-7.
  73. ^ Visser O, van Wijnen JH, van Leeuwen FE.  Residential traffic density and cancer incidence in Amsterdam, 1989-1997. Cancer Causes Control 2004; 15:331-339.
  74. ^ Speizer FE. Overview of the risk of respiratory cancer from airborne contaminations. Environ Health Perspect 1986;70:9–15.
  75. ^ Stocks P, Campbell JM. Lung cancer death rates among non-smokers and pipe and cigarette smokers: an evaluation in relation to air pollution by benzpyrene and other substances. Br Med J 1955;2:923–39.
  76. ^  U.S. Environmental Protection Agency. Cancer Risk from Outdoor Exposure to Air Toxics. Vol. I. Final Report. Research Triangle Park, N.C.: Office of Air Quality Planning and Standards. September 1990. EPA-450/1-90-004a.
  77. ^ National Academy. Effects of Exposure to Radon: BEIR VI. Washington, D.C.: National Academy Press; 1999.
  78. ^ Pope CA, Thun MJ, Namboodiri MM, et al. Particulate air pollution as a predictor of mortality in a prospective study of U.S. adults. Am J Respir Crit Care Med 1995;151:669–74.
  79. ^ Vineis P, Hoek G, Krzyzanowski M, Vigna-Taglianti F, Veglia F, Airoldi L, Overvad K,  Raaschou-Nielsen O, Clavel-Chapelon F,  Linseisen J, Boeing H, Trichopoulou A,  Palli D, Krogh V, Tumino R, Panico S, Bueno-De-Mesquita HB, Peeters PH, Lund E E,  Agudo A, Martinez C, Dorronsoro M, Barricarte A, Cirera L, Quiros JR, Berglund G,  Manjer J, Forsberg B, Day NE, Key TJ, Kaaks R, Saracci R, Riboli E. Lung cancers attributable to environmental tobacco smoke and air pollution in non-smokers in different European countries: a prospective study. Environ Health Feb 2007:15:6-7.
  80. ^ Nikic D and Stankovic A. Air Pollution as a Risk Factor for Lung Cancer. Arch Oncol 2005;13(2)79-82.
  81. ^ Briggs D. Exposure assesssment. In Elliot P,  et al. Spatial Epidemiology: Methods And Applications. Oxford University Press, Oxford, 2000. pp.335-359.
  82. ^ Zhu YF, Hinds WC, Kim S, Shen S, Sioutas C.  Study of ultrafine particles near a major highway with heavy-duty diesel traffic. Atmos Environ 2002: 36:4323-4335.
  83. ^ Statistique Canada.  Mobilité et migration, série Le Pays, Recensement du Canada de 1991, 1993, Catalogue 93-322.
  84. ^ van Donkelaar A, Martin RV, Park RJ. Estimating ground-level PM2.5 with aerosol optical depth determined from satellite  remote sensing. J Geophys Res 2006, 111, D21201, doi:10.1029/2005JD006996. URL : http://fizz.phys.dal.ca/ ~atmos/publications/vanDonkelaar_2006_ JGR.pdf
  85. a,b,c,d Johnson KC, Mao Y, Argo J, et al., the Canadian Cancer Registries Epidemiology Research Group. The National Enhanced Cancer Surveillance System: a case-control approach to environmental-related cancer surveillance in Canada. Environmetrics 1998;9:495–504.
  86. ^ Cressie N. Statistics for spatial data. New York: Wiley; 1991.
  87. ^ Jerrett M, et al. A review and evaluation of intraurban air pollution exposure models. J Expo Anal Environ Epidemiol 2005 Mar;15(2):185-204.
  88. ^ Haas T. Lognormal and moving window methods of estimating acid deposition.  J Amer Statist Assoc 1990;85:950–63.
  89. ^ Handcock MS, Stein ML. A Bayesian analysis of Kriging. Technometrics 1993;35:403–10.
  90. ^ De Oliveria V, Kedem B, Short DA. Bayesian prediction of transformed Gaussian random fields. J Amer Statist Assoc 1997;92:1422–33.
  91. a,b Le ND, Zidek JV. Interpolation with uncertain spatial covariances: a Bayesian alternative to Kriging. J Multivariate Anal 1992;43:351–74.
  92. a,b,c Brown PJ, Le ND, Zidek JV. Multivariate spatial interpolation and exposure to air pollutants. Can J Stat 1994;22:489–510.
  93. a,b Sampson PD, Guttorp P. Nonparametric estimation of nonstationary spatial covariance structure. J Amer Statist Assoc 1992;87:108–19.
  94. a,b Le ND, Sun W, Zidek JV. Bayesian multivariate spatial interpolation with data missing-by-design. J Roy Statist Soc Ser B 1997;59:501–10.
  95. a,b,c Le ND, Sun L, Zidek JV. Spatial prediction and temporal backcasting for environmental fields having monotone data patterns. Can J Stat 2001; 29:516-529.
  96. a,b Sun W, Le ND, Zidek JV, et al. Assessment of a Bayesian Multivariate Interpolation Approach for Health Impact Studies. Environmetrics 1998;9:565–86.
  97. a,b,c Duddek C, Le ND, Zidek JV, et al. Multivariate imputation in cross sectional analysis of health effects associated with air pollution. (with discussion). J Environ Ecol Statist 1995;2:191–2.
  98. a,b,c,d,e,f Zidek JV, White R, Le ND, et al. Imputing unmeasured explanatory variables in environmental epidemiology with application to health impact analysis of air pollution. J Environ Ecol Statist 1998; 2:99–115.
  99. a,b Bellander T, Berglind N, Gustavsson P, Jonson T, Nyberg F, Pershagen G, Jarup L. Using geographic information systems to assess individual historical exposure to air pollution from traffic and house heating in Stockholm. Environ Health Perspect 2001; 109(6): 633-639.
  100. ^  Jerrett M, Burnett R, Goldberg M, Sears M, Krewski D, Catalan R, Kanaroglou P, Giovis C, Finkelstein N. Spatial Analysis for Environmental Health Research: Concepts, Methods, and Examples. Journal of Toxicology and Environmental Health, Part A 2003: 66:1783–1810.
  101. a,b,c,d,e,f,g,h,i  Carroll RJ, Ruppert D, Stefanski LA. Measurement error in nonlinear models. London: Chapman and Hall; 1995.
  102. a,b,c  Liang KY, Zeger SL. Longitudinal data analysis using generalized linear models. Biometrika 1986;73:13–22.
  103. a,b  Fuller W. Measurement error models. New York: Wiley; 1987.
  104. a,b,c  Gustafson P. Measurement Error and Misclassification in Statistics and Epidemiology. Chapman & Hall/CRC. 2004.
  105. a,b,c,d,e,f  Thomas D, Stram D, Dwyer J. Exposure measurement error: influence of exposure-disease relationships and methods of correction. Annu Rev Public Health 1993; 14:69–93.
  106. a,b  Greenland S. The effect of misclassification in matched-pair case-control studies. Am  J Epidemiol 1982;116:402–6.
  107. ^  Brenner H, Savitz DA, Jockel KH, et al. Effects of non-differential exposure misclassification in ecologic studies. Am  J Epidemiol 1992;135:85–95.
  108. ^  Gustafson P, Le ND. Comparing the effects of continuous and discrete covariate mismeasurement, with emphasis on the dichtomization of mismeasured predictors. Biometrics 2002; 58:878-887.
  109. a,b,c  Zidek JV. Interpolating air pollution for health impact assessment. In: Barnett V, Feridun Turkman K, editors. Statistics for the environment 3: pollution assessment and control. New York: Wiley; 1997. p. 251–68.
  110. a,b  Zidek JV, Wong H, Le ND, et al. Causality, measurement error and multicollinearity in epidemiology. Environmetrics 1996; 7:441–51.
  111. a,b  Fung K, Krewski D. On measurement error adjustment methods in Poisson regression. Environmetrics, 1999;10:213–24.
  112. ^  Pierce DA, Stram DO, Vaeth M, et al. The errors-in-variables problem: considerations provided by radiation dose-response analyses of the A-bomb survivor data.  J Amer Statist Assoc 1992;87:351–9.
  113. ^  Cook J, Stefanski LA. Simulation extrapolation method for parametric measurement error models. J Amer Statist Assoc 1995;89:1314–28.
  114. ^  Gustafson P, Le ND, Vallee M. A Bayesian approach to case-control studies with errors in covariables. Biostatistics 2002; 3:229-243.
  115. ^  Gustafson P, Le ND, Saskin R. Case-control analysis with partical knowledge of exposure misclassification probabilities. Biometrics 2001; 57:598-609.
  116. ^ Peters JM, Avol E, Navidi W, London SJ,  Gauderman WJ, Lurmann F, Linn WS, Margolis H, Rappaport E, Gong H,  Thomas DC. A study of twelve Southern California communities with differing levels and types of air pollution. I. Prevalence of respiratory morbidity. Am J Respir Crit Care Med 1999 Mar;159(3):760-7.
  117. ^  Peters JM, Avol E, Gauderman WJ, Linn WS, Navidi W, London SJ, Margolis H,  Rappaport E, Vora H, Gong H Jr,  Thomas DC. A study of twelve Southern California communities with differing levels and types of air pollution. II. Effects on pulmonary function. Am J Respir Crit Care Med 1999 Mar;159(3):768-75.
  118. a,b  Burnett RT, Dales RE, Raizenne MR, et al. Effects of low ambient levels of ozone and sulfates on the frequency of respiratory admissions to Ontario hospitals. Environ Res 1994;65:172–94.
  119. a,b,c,d,e  Zidek JV, Le ND, Wong H, et al. Including structural measurement errors in the nonlinear regression analysis of clustered data. Can J Stat 1998;26:537–48.
  120. ^ Sun W. Bayesian multivariate interpolation with missing data and its applications [thèse]. Vancouver (BC): University of British Columbia; 1994.
  121. ^  Sun W. Comparison of a cokriging method with a Bayesian alternative. Environmetrics 1998;9:445–57.
  122. ^  Chen CF. Bayesian inference for a normal dispersion matrix and its application to Stochastic multiple regression analysis.  J Roy Statist Soc Ser B 1979;41:235–48.
  123. ^  Burnett R, Krewski D. Air pollution effects on hospital admission rates: a random effects modelling approach. Can J Stat 1994;22:441–58.
  124. ^ Lindstrom MJ, Bates DM. Nonlinear mixed effects models for repeated measures data. Biometrics 1990;46:673–87.
  125. ^ Davidian M, Giltinan DM. Nonlinear models for repeated measurement data. London: Chapman and Hall; 1995.
  126. ^  Brown PJ, Le ND, Zidek JV. Inference for a covariance matrix. In: Smith AFM, Freeman PR,  editors. Aspects of uncertainty: a tribute to D.V. Lindley. Chichester: Wiley; 1994.
  127. ^  Le ND, Zidek JV. Statistical Analysis  of Environmental Space-Time Processes. Springer, 2006, ISBN 978-0-387-26209-3.

Détails de la page

Date de modification :