ARCHIVÉ - Maladies chroniques au Canada

 

Volume 30, no 1, décembre 2009

Utilisation des données tirées des registres du cancer : concordance des données sur les causes de décès entre le Registre d’inscription des cas de cancer de l’Ontario et une étude longitudinale chez les patientes atteintes d’un cancer du sein

D. R. Brenner, M.Sc. (1,2); M. C. Tammemägi, Ph. D. (3); S. B. Bull, Ph. D. (1,2); D. Pinnaduwaje, Ph. D. (1); I. L. Andrulis, Ph. D. (1,4)

https://doi.org/10.24095/hpcdp.30.1.04f

Coordonnées des auteurs

  1. Samuel Lunenfeld Research Institute, Mount Sinai Hospital, Toronto (Ontario)
  2. Dalla Lana School of Public Health, University of Toronto, Toronto (Ontario)
  3. Department of Community Health Sciences, Brock University, St. Catharines (Ontario)
  4. Department of Molecular Genetics, University of Toronto, Toronto (Ontario)

Correspondance : Darren Brenner, Prosserman Centre for Health Research, Samuel Lunenfeld Research Institute, 60, rue Murray, Toronto (Ontario)  M5T 1X5; tél. : 416-586-4800, poste 8110; téléc. : 416-586-5800; courriel : brenner@lunenfeld.ca

 

Résumé

Une comparaison a été faite entre les données tirées du Registre d’inscription des cas de cancer de l’Ontario (RICCO) et les données d’une cohorte prospective multicentrique formée de 1 655 patientes atteintes d’un cancer du sein sans envahissement ganglionnaire faisant l’objet d’un suivi clinique rigoureux. La concordance des causes de décès a été évaluée au moyen des statistiques Kappa. L’exactitude de la classification du RICCO a été évaluée par rapport à l’interprétation, par l’oncologue de l’étude du Mount Sinai Hospital (étude MSH), des données de cohorte rigoureusement suivies et servant d’étalon de référence. Les deux sources montraient un degré de concordance élevé (valeur Kappa [κ] de 0,88; intervalle de confiance [IC] à 95 % : 0,86 à 0,90) concernant le statut vital et la cause de décès. Lorsque les deux sources faisaient état d’un décès, le RICCO avait une sensibilité de 95 % (IC à 95 % : 90,5 à 98,8) et une spécificité de 88 % (IC à 95 % : 79,6 à 92,4). Le RICCO est un outil utile dans le cadre d’études épidémiologiques sur le cancer du sein, car il permet d’obtenir de l’information adaptée et facilement accessible concernant les causes de décès.

Mots clés : méthodes épidémiologiques, collecte de données, registres de données, statistiques démographiques, tumeurs du sein, cause du décès, Registre d’inscription des cas de cancer de l’Ontario

Introduction

L’utilisation de données sur la mortalité et de données de suivi tirées de registres du cancer est pratique courante dans le cadre d’études épidémiologiques1. Toutefois, il n’est pas clair dans quelle mesure des biais peuvent être introduits en raison de données sur les causes de décès incomplètes ou inexactes dans les registres2,3.

Le Registre d’inscription des cas de cancer de l’Ontario (RICCO), administré et mis à jour par Action Cancer Ontario depuis 1964, recueille des renseignements essentiels concernant tous les nouveaux cas de cancer dans la province, à l’exception des cancers de la peau avec mélanome bénin. Des études de validation ont montré que le registre était efficace pour établir le nombre de cas de cancer dans la province (sensibilité de 98 %)4. Le registre recueille les données des rapports de pathologie, des dossiers de patients, des dossiers de congé de l’hôpital et des certificats de décès du Registraire général de l’Ontario. Une méthode de couplage probabiliste est ensuite utilisée pour faire le rapprochement des sources de données dans une base de données centrale5. Le registre évalue régulièrement la qualité des données internes, mais les données du registre sont rarement comparées aux dossiers médicaux détaillés à proprement parler et aux données provenant de sources externes. Une étude comparative sur l’évolution des cancers de la tête et du cou indiquait que le RICCO présentait une excellente concordance en ce qui concerne la désignation du siège du cancer, le statut vital et la date de décès; en revanche, le taux d’erreurs était de 31 % pour la cause de décès (liée au cancer ou non)6. À notre connaissance, aucune étude n’a examiné la concordance entre les données du RICCO sur les causes de décès chez les patientes atteintes de cancer du sein et les causes de décès déterminées dans une étude indépendante avec suivi rigoureux.

Le recrutement des participantes pour l’étude des cohortes prospective multicentrique du Mount Sinai Hospital (étude MSH), à Toronto, a débuté en 1987. Dans le cadre de l’étude MSH, les nouveaux cas confirmés sur le plan pathologique de cancer du sein sans envahissement ganglionnaire ont été recensés dans huit sites participants de la région du Grand Toronto. Le but de l’étude était d’évaluer les liens entre les altérations génétique et moléculaire d’une tumeur et la récurrence de la maladie et le décès causé par le cancer du sein7. Les gestionnaires de l’étude ont systématiquement recueilli les données provenant de dossiers d’hospitalisation, de dossiers médicaux, d’entrevues auprès de patients, de rapports de pathologie, de dossiers de patients, de rapports du coroner et de certificats de décès. L’oncologue de l’étude, un spécialiste du cancer du sein, a classifié de façon définitive la cause de décès après avoir examiné l’information recueillie.

Le but de notre étude était d’évaluer la concordance entre les données sur la cause de décès tirées du RICCO et celles provenant de l’étude MSH, qui offre un suivi régulier et systématique des patients et dans laquelle un spécialiste détermine les résultats en se basant en grande partie sur des données relativement complètes et justes. D’autres études ont montré que la classification de l’issue du cancer par un spécialiste était plus précise que la classification d’un registre, probablement en raison d’une plus grande disponibilité des données ou à l’expérience, ou au deux8. Pour cette raison, notre étude évalue aussi l’exactitude des données sur les causes de décès du RICCO en utilisant les données de l’étude MSH comme étalon de référence.

Méthodes

Un lien a été établi entre les données du RICCO et les patientes de l’étude MSH en fonction des procédures normalisées du RICCO et selon un couplage probabiliste au moyen des identificateurs personnels de la base de données de l’étude MSH. Les codes de la CIM-9* et de la CIM-10 décrivaient les causes de décès, et ces derniers étaient ensuite classés comme étant attribuables 1) au cancer du sein ou 2) à des causes concurrentes ou à d’autres causes. Les personnes pour lesquelles aucune information sur la cause de décès ne figurait ni dans l’étude MSH, ni dans les données tirées du RICCO étaient considérées en vie. Dans le cadre de l’étude MSH, les patientes étaient suivies à partir du moment du diagnostic et de l’inscription, depuis 1987 jusqu’au printemps 2005. Bien que les données tirées du RICCO faisaient état d’événements survenus jusqu’en 2006, la qualité des données n’a été vérifiée que jusqu’à la fin de l’année 2004, ce qui a entraîné des divergences quant à la durée du suivi. Tous les décès divergents ont donc été examinés afin d’obtenir la date de décès et de résoudre les divergences.

La concordance de la classification des causes de décès entre les deux sources a été déterminée au moyen de statistiques Kappa9. Nous avons calculé le Kappa pondéré avec la justification que l’omission d’un décès lié au cancer revêt une importance majeure pour l’étude MSH et pour le RICCO. Les statistiques ont été calculées à l’aide du Statistical Analysis System (SAS®) (SAS V9.1; SAS Institute Inc., Cary, NC) et tous les IC à 95 % étaient bilatéraux. Le Kappa pondéré a été déterminé au moyen du système de pondération par défaut du SAS, selon l’ordre de classification qui figure au tableau 1. L’exactitude de la classification du RICCO a été évaluée en estimant la sensibilité et la spécificité au moyen de la classification du MSH comme étalon de référence. Cette étude a été approuvée par le comité d’éthique de la recherche du Mount Sinai Hospital.

Résultats

La population à l’étude était constituée des 1 655 patientes de l’étude en milieu hospitalier dont les ganglions axillaires n’étaient pas atteints au moment du diagnostic (stade I [72 %] et stade II [28 %]). Il n’y avait pas de couplage de dossier pour l’une de ces patientes (aucune information dans le RICCO), et six d’entre elles étaient inscrites comme étant décédées dans le RICCO, sans renseignement sur la cause de décès. Ces patientes n’ont pas fait partie de l’analyse, car les données ne permettaient pas de faire des comparaisons. Les analyses de sensibilité ont montré qu’une classification erronée de ces décès avait peu d’effet sur les résultats : la valeur des statistiques Kappa diminuait de 0,87 à 0,86 lorsque toutes ces patientes étaient considérées comme étant encore en vie, et le pourcentage d’accord diminuait de 90,0 % à 87,6 % lorsque les sept décès étaient considérés comme erronés.

 

Tableau 1
Concordance entre la cause de décès et le statut vital entre une étude des cohortes
et le Registre d’inscription des cas de cancer de l’Ontario
    Étude MSH
    Aucune info sur le décès ni sur la perte de vue en cours de suivi Cause de décès concurrente Décès causé par le cancer du sein Total
Registre d’inscription des cas de cancer de l’Ontario Aucune info sur le décès 1 331 6 6 1 343
Cause de décès concurrente 19 129 7 155
Décès causé par le cancer du sein 5 21 124 150
Total 1 355 156 137 1 648

KappaSimple : 0,87 (0,85; 0,90)

Pondéré : 0,90 (0,88; 0,92)

Décès supplémentaires fournis par le Registre d’inscription des cas de cancer de l’Ontario

 

Tableau 2
Comparaison de la cause de décès entre une étude des cohortes avec suivi rigoureux et le
Registre d’inscription des cas de cancer de l’Ontario (étalon de référence : cause de décès de l’étude MSH)
    Étude MSH (étalon de référence)
    Décès causé par le cancer du sein Cause concurrente Total
Registre d’inscription des cas de cancer de l’Ontario Décès causé par le cancer du sein 124 21 145
Cause concurrente 7 129 136
Total   131 150 281

Sensibilité : 95 % (90,5 à 98,8)

Spécificité : 86 % (79,6 à 92,4)

 

Les deux sources présentaient un degré de concordance élevé (valeur Kappa de 0,88;IC à 95 % : 0,86 à 0,90) et une valeur Kappa pondérée de 0,90 (IC à 95 % : 0,80 à 0,92). Des 87 patientes qui n’ont pas fait l’objet d’un suivi dans le cadre de l’étude MSH, 11 étaient décédées et ont été repérées par l’entremise du RICCO. Treize autres décès n’ayant pas été enregistrés au départ par l’étude MSH ont été détectés par le RICCO, tandis que 12 décès qui n’avaient pas été enregistrés dans le RICCO avaient été enregistrés par l’étude MSH. Les 12 décès divergents ont été examinés lors de l’étude afin de déterminer les dates de décès. Dans trois de ces cas, le décès est survenu début 2005, mais il semblerait que dans les neuf autres cas, les décès ont eu lieu avant 2000 et n’avaient pas encore été détectés par le RICCO. Le tableau 1 montre la répartition des causes de décès rapportées par l’étude et par le RICCO.

Lors de la comparaison de cas où les deux sources faisaient état d’un décès, le pourcentage de concordance de la classification des décès entre le RICCO et l’étude MSH était de 90 % (tableau 2, [(124+129)/281]). Le RICCO présentait une sensibilité de 95 % (IC à 95 % : 90,5 à 98,8) et une spécificité de 88 % (IC à 95 % : 79,6 à 92,4) lorsque les données de l’étude MSH étaient utilisées comme étalon de référence.

Analyse

Ces résultats mettent en lumière plusieurs points importants. Premièrement, la cause de décès tirée du système d’extraction et de collecte des données du RICCO présentait une forte concordance avec celle provenant d’une étude des cohortes avec suivi rigoureux, où la cause de décès était déterminée par un oncologue médical. Cela démontre que les données du RICCO pourraient être utiles dans le cadre d’études où le suivi du patient est incomplet ou non disponible et souligne que le RICCO serait utile pour les études épidémiologiques où il est impossible d’obtenir l’expertise clinique nécessaire pour interpréter la cause de décès. En pareil cas, particulièrement pour les études sur le cancer du sein, le RICCO peut être utilisé en tant que source relativement précise et facilement accessible pour connaître la cause de décès. Deuxièmement, plusieurs décès ont été omis lors de l’étude MSH, puisque des patientes n’ont pas fait l’objet d’un suivi. Dans ces cas, le RICCO a enregistré les décès, ce qui, en raison de la couverture à l’échelle de la province, a amélioré les données de suivi de l’étude MSH. Troisièmement, notre étude a permis de démontrer que les techniques d’abstraction du RICCO offrent un degré d’exactitude élevé : nous avons observé une sensibilité et une spécificité élevées lors d’une comparaison des résultats avec les décisions d’un oncologue médical chevronné prises à partir des données de cohorte.

Notre étude présentait un taux d’erreurs beaucoup plus bas que les analyses antérieures des causes de décès du RICCO6. Cependant, cela peut s’expliquer en raison des sièges de cancer différents comparés. Par conséquent, nos résultats ne s’appliquent pas forcément à tous les sièges de cancer. Cependant, nous soutenons qu’une classification erronée de la cause de décès se produit plus souvent dans les cas de cancers où le pronostic est favorable, comme le cancer du sein ou de la prostate, car la probabilité que le décès soit lié au cancer ou à des causes concurrentes est presque égale, beaucoup plus que pour les cancers très agressifs, tels que le cancer du poumon ou du pancréas. De plus, l’évolution de la maladie des cancers agressifs est habituellement plus dramatique et mieux définie sur le plan clinique, permettant habituellement une classification plus exacte du décès. Si notre raisonnement est juste, les résultats que nous présentons peuvent rassurer les chercheurs qui s’intéressent à d’autres types de cancers ou au cancer du sein de stade avancé.

Nos résultats pourraient ne pas s’appliquer à tous les registres du cancer. En raison de la nature centralisée du système de soins de santé de l’Ontario, le RICCO permet de recueillir toute la documentation médicale pertinente pour fournir les données épidémiologiques pour ce type d’étude. Les autres registres ne possèdent peut-être pas les infrastructures ou la capacité pour être aussi complets et riches que le RICCO. Par contre, nos résultats pourraient s’appliquer aux registres vérifiés qui incluent toute la population.

Quelques problèmes d’ordre méthodologique mis en évidence dans cette étude doivent être résolus. Sept patientes ont été omises de l’analyse, car elles étaient déclarées décédées dans le RICCO sans qu’aucune cause de décès ait été fournie. Cependant, les analyses de sensibilité montraient qu’une classification erronée de ces décès, d’un côté comme de l’autre, n’aurait eu qu’un effet minime sur nos conclusions.

Le suivi rigoureux pour l’étude MSH s’est terminé au printemps 2005, lorsque le financement du suivi clinique de l’étude a pris fin. La demande pour l’obtention des données du RICCO a été présentée en août 2006, à un moment où la qualité des données n’était garantie que jusqu’à fin 2004. Par conséquent, il y avait une légère divergence dans la fin du suivi, qui n’a cependant pas semblé entraîner de conséquences sur les résultats. Lors de nos analyses, nous avons utilisé comme étalon de référence les décisions de l’oncologue médical de l’étude, prises à partir des données recueillies. Il est possible qu’un faible pourcentage de diagnostics aient été classés de façon erronée par l’oncologue médical de l’étude MSH, ce qui aurait eu pour effet de réduire la concordance entre les sources de données. Cependant, la valeur Kappa élevée démontre une bonne concordance en l’absence d’une norme absolue.

Cette étude a utilisé les statistiques Kappa pour évaluer la concordance entre deux sources de données sur les causes de décès, puisqu’il n’existait pas de norme absolue définie (p. ex. le RICCO contenait des décès liés au cancer omis par l’étude MSH). Ainsi, nous avons pu établir l’exactitude de la classification en terme de sensibilité et de spécificité, ainsi que la fiabilité par rapport à la valeur Kappa. Ces données fournissent des renseignements complémentaires et viennent appuyer les conclusions concernant l’utilité du RICCO.

En conclusion, les résultats de notre étude démontrent qu’il existe une forte concordance entre les données sur la cause de décès tirées d’une étude des cohortes longitudinale de patientes atteintes d’un cancer du sein, avec interprétation par un oncologue médical basée sur une collecte prospective rigoureuse de données, et le système de collecte de données passif du RICCO. Cette information est importante pour les conclusions d’études réalisées avec des données extraites de registres, car elle peut renforcer leur validité. Elle peut aussi encourager les chercheurs à se servir des données tirées de registres du cancer lorsque les données de suivi du cancer qui sont propres à l’étude sont incomplètes, manquantes ou de piètre qualité. De plus, nos résultats indiquent que les chercheurs devraient couramment utiliser les données extraites de registres pour vérifier les renseignements sur le suivi des études en cours.

Notes de bas de page

 *^ Classification statistique internationale des maladies et des problèmes de santé connexes, 9e révision.

 †^ Classification statistique internationale des maladies et des problèmes de santé connexes, 10e révision.

Références

  1. ^ Marrett LD, Clarke EA, Hatcher J, Weir HK. Epidemiologic research using the Ontario Cancer Registry. Can J Public Health. 1986;77 Suppl 1:79-85.
  2. ^ Hilsenbeck SG. Quality control practices in centralized tumor registries in North America. J Clin Epidemiol. 1990;43(11):1201-12.
  3. ^ Robles SC, Marrett LD, Clarke EA, Risch HA. An application of capture-recapture methods to the estimation of completeness of cancer registration. J Clin Epidemiol. 1988;41(5):495-501.
  4. ^ McLaughlin JR, Kreiger N, Marrett LD, Holowaty EJ. Cancer incidence registration and trends in Ontario. Eur J Cancer. 1991;27(11):1520-4.
  5. ^ Holowaty E. « Summarization of information from multiple data sources, » dans Black R, Simonato, L, Storm, H, Automated data collection in cancer registries, IARC Technical Report 32, Lyon, IART, 1998.
  6. ^ Hall S, Schulze K, Groome P, Mackillop W, Holowaty E. Using cancer registry data for survival studies: the example of the Ontario Cancer Registry. J Clin Epidemiol. 2006;59(1):67-76.
  7. ^ Andrulis IL, Bull SB, Blackstein ME, Sutherland D, Mak C, Sidlofsky S, Pritzker KP, Hartwick RW, Hanna W, Lickley L, Wilkinson R, Qizilbash A, Ambus U, Lipa M, Weizel H, Katz A, Baida M, Mariz S, Stoik G, Dacamara P, Strongitharm D, Geddie W, McCready D. neu/erbB-2 amplification identifies a poor-prognosis group of women with node-negative breast cancer. Toronto Breast Cancer Study Group. J Clin Oncol. 1998;16(4):1340-9.
  8. ^ Schouten LJ, Jager JJ, van den Brandt PA. Quality of cancer registry data: a comparison of data provided by clinicians with those of registration personnel. Br J Cancer. 1993;68(5):974-7.
  9. ^ Landis JR, Koch GG. The measurement of observer agreement for categorical data. Biometrics. 1977;33(1):159-74.
Signaler un problème ou une erreur sur cette page
Veuillez sélectionner toutes les cases qui s'appliquent :

Merci de votre aide!

Vous ne recevrez pas de réponse. Pour toute question, contactez-nous.

Date de modification :