Maladies chroniques et blessures au Canada

Volume 33 · numéro 3 · juin 2013

Repérage des cas d'insuffisance cardiaque congestive à partir de données administratives : étude de validation utilisant des dossiers de patients en soins primaires

S. E. Schultz, M.A., M. Sc. (1); D. M. Rothwell, M. Sc. (2); Z. Chen, M.D. (1); K. Tu, M.D. (1, 3, 4)

https://doi.org/10.24095/hpcdp.33.3.06f

Cet article a fait l'objet d'une évaluation par les pairs.

Rattachement des auteurs :

  1. Institut de recherche en services de santé, Toronto (Ontario), Canada
  2. Institut de recherche de l'Hôpital d'Ottawa, Ottawa (Ontario), Canada
  3. Département de médecine familiale et communautaire, Université de Toronto, Toronto (Ontario), Canada
  4. Équipe de santé familiale de l'Hôpital Toronto Western, Réseau universitaire de santé, Toronto (Ontario), Canada

Correspondance : Susan E. Schultz, Institut de recherche en services de santé, G1-06, 2075, avenue Bayview, Toronto (Ontario) M4N 3M5; tél. : 416-480-4055, poste 1-3788; téléc. : 416-480-6048; courriel : sue.schultz@ices.on.ca

Résumé

Introduction : En vue de déterminer si l'utilisation conjuguée des données administratives hospitalières et des factures présentées par les médecins au titre des soins ambulatoires pouvait permettre de repérer avec exactitude les patients souffrant d'insuffisance cardiaque congestive (ICC), nous avons mis à l'essai neuf algorithmes pour repérer à partir de données administratives les personnes souffrant d'ICC.

Méthodologie : La cohorte de validation par rapport à laquelle les essais ont été effectués combinait des données provenant d'un échantillon aléatoire de patients adultes inscrits dans la base de données EMRALD de dossiers médicaux électroniques des médecins de premier recours en Ontario, au Canada, et des données recueillies en 2004-2005 à partir d'un échantillon aléatoire de patients en soins primaires pour une étude sur l'hypertension. On a évalué la sensibilité, la spécificité, la valeur prédictive positive, l'aire sous la courbe ROC et la combinaison des rapports de vraisemblance positif et négatif des algorithmes.

Résultats : Nous avons constaté qu'un dossier d'hospitalisation ou de facturation de médecin suivi d'un second dossier provenant de l'une ou l'autre de ces sources dans la même année produisait les meilleurs résultats, avec une sensibilité de 84,8 % et une spécificité de 97,0 %.

Conclusion : La prévalence de l'ICC dans la population peut être mesurée avec exactitude à partir de données administratives issues de l'hospitalisation et des soins ambulatoires.

Mots-clés : insuffisance cardiaque congestive, études de validation, méthodes épidémiologiques, prévalence dans la population

Introduction

Les dossiers de congé des hôpitauxFootnote 1Footnote 2 servent depuis longtemps à repérer les patients souffrant d'insuffisance cardiaque congestive (ICC) qui se présentent à l'hôpital, ou qui sont hospitalisés pour d'autres problèmes de santé mais dont le dossier mentionne l'ICC à titre d'affection comor-bide. Dans leur examen systématique récent des études de validation des algorithmes utilisés pour repérer les patients atteints d'ICC à partir de données administratives, Saczynski et collab.Footnote 3 ont observé que cela était vrai pour 25 des 35 études répertoriées.

Il a été démontré que l'utilisation des dossiers de congé des hôpitaux par rapport à celle des dossiers d'hospitalisation pour repérer les patients atteints d'ICC donnait des résultats d'une grande exactitudeFootnote 4Footnote 5. Toutefois, compte tenu de l'amélioration des traitements et de la raréfaction des ressourceshospitalières, une prise en charge efficace dans la collectivité des patients souffrant d'insuffisance cardiaque est de plus en plus fréquente. Par conséquent, ces patients n'apparaîtront probablement pas dans les données sur les congés des hôpitaux, ou alors uniquement lorsque leur maladie aura atteint un stade avancé. En n'utilisant que les données sur les hospitalisations, on sous-estime donc probablement l'incidence et la prévalence de l'ICC.

On a mis au point et validé des algorithmes faisant appel à la fois aux données de facturation des médecins et aux dossiers de congé des hôpitaux en vue de repérer les patients présentant une affection chronique qui n'exige pas d'hospitalisation, comme l'hypertension, le diabète, la cardiopathie ischémique et l'asthmeFootnote 6Footnote 9. Toutefois, parmi les 35 études répertoriées dans l'examen systématique effectué par Saczynski et collab.Footnote 3, neuf seulement utilisaient des données provenant à la fois des dossiers de congé des hôpitaux et des demandes de paiement des soins ambulatoires, et deux seulement utilisaient également des données sur une population, même si cette population était limitée aux patients affiliés à un important organisme de gestion de soinsFootnote 10Footnote 11.

L'objet de notre étude était de déterminer l'algorithme de données administratives le plus approprié pour repérer les patients atteints d'ICC en Ontario (Canada). Nous avons utilisé l'information disponible dans les dossiers médicaux électroniques (DME) des patients vus par des médecins de premier recours en consultation externe et dans les dossiers des médecins de premier recours payés à l'acte afin d'évaluer la validité et la fiabilité de différentes combinaisons de données de facturation des médecins et des données des hôpitaux sur les congés.

Méthodologie

Sources des données

Cohorte de validation

La cohorte de validation utilisée dans cette étude comprenait des données provenant de deux sources. La première était celle des données recueillies par l'Équipe canadienne de recherche sur les résultats des interventions en santé cardiovasculaire (Canadian Cardiovascular Outcomes Research Team, ou CCORT), par l'intermédiaire de 17 médecins ayant utilisé le logiciel de DME de Solutions cliniquesH et ayant transmis les dossiers de leurs patients à la base de données EMRALD (Electronic Medical Record Administrative data Linked Database). Les médecins participant à cette étude devaient avoir utilisé les DME depuis au minimum deux ans afin que tous leurs patients possèdent un DME. Les données des DME ont été extraites entre juin et décembre 2007, puis ont été anonymisées, chiffrées, et transférées par voie électronique sécurisée à l'Institut de recherche en services de santé (IRSS). L'IRSS est une entité visée par la Loi sur la protection des renseignements personnels sur la santé de l'Ontario, ce qui signifie que cette organisation peut, sans obtenir de consentement, recevoir et utiliser des renseignements sur la santé à des fins d'analyse et de compilation de données statistiques sur le système de soins de santé de l'Ontario. La collecte des données se fait à partir d'un large éventail de sources, dont le ministère de la Santé et des Soins de longue durée, les hôpitaux et les médecins, dans la mesure où l'IRSS a mis en place des politiques, des pratiques et des procédures qui ont été vérifiées et approuvées par le Commissaire à l'information et à la protection de la vie privée de l'Ontario. Les données utilisées dans la présente étude ont été traitées conformément à la méthode de fonctionnement uniformisée de l'organisme visant à assurer le respect de la vie privée et de la confidentialité des données des patients.

La population totale admissible de patients ayant un DME était constituée de 19 376 patients adultes actifs de 20 ans ou plus. Le terme « actif » signifie ici inscrit auprès d'un des médecins participants, ayant consulté au moins deux fois au cours des trois dernières années et possédant une carte valide de l'Assurance-santé de l'Ontario. Trois analystes spécialistes de l'extraction de données ont extrait les données à partir d'un échantillon aléatoire de 5 % de ces patients (n=969). La fidélité inter-observateurs touchant la concordance globale de la présence ou de l'absence d'ICC était très satisfaisante (indice kappa [κ]>0,80).

La seconde source de données était un échantillon aléatoire de dossiers de patients de 76 cabinets de médecins de famille rémunérés à l'acte dont les données avaient été extraites entre décembre 2004 et août 2005 pour valider un algorithme faisant appel aux données administratives afin de repérer les cas d'hypertensionFootnote 6.Dans cette étude, l'extraction des données des dossiers a été effectuée à partir d'un échantillon aléatoire de tous les patients admissibles (n=2 472). Étaient admissibles les patients réguliers du cabinet médical qui étaient venus en consultation au moins deux fois au cours des trois années précédentes, qui étaient âgés d'au moins 38 ans et qui possédaient un numéro de carte santé de l'Ontario. Deux spécialistes ont extrait les données des dossiers, ici encore avec une très bonne fidélité inter-observateurs à l'égard de la concordance globale de la présence ou de l'absence d'ICC (κ>0,80).

Nous avons repéré par la même méthode les patients atteints d'ICC à partir des deux sources de données : des spécialistes de l'extraction des données des dossiers ont examiné toutes les entrées figurant dans le DME ou, durant les trois années précédentes, dans le dossier médical des patients. Pour chaque entrée, on a indiqué s'il y avait présence d'ICC, possibilité d'ICC, antécédents familiaux d'ICC ou absence d'ICC. Une entrée pour laquelle on notait la présence d'ICC signifiait que le médecin avait explicitement indiqué dans le dossier que le patient était atteint d'ICC ou d'insuffisance ventriculaire, de décompensation cardiaque, d'insuffisance cardiaque (droite ou gauche), de dysfonctionnement de la pompe cardiaque, d'insuffisance ventriculaire ou d'œdème pulmonaire, qui sont autant de synonymes de l'ICC. Pour les résultats des tests diagnostiques compatibles avec une conclusion d'ICC, on a indiqué qu'il y avait possibilité d'ICC. S'il n'y avait aucune mention de l'ICC ou de l'un de ses synonymes dans le dossier, on a considéré que le patient n'était pas atteint d'ICC. Lors de la compilation des données, le patient n'était considéré comme atteint d'ICC que si une ou plusieurs entrées confirmaient la présence de cette affection.

Pour assurer la cohérence entre les deux sources de données, seuls les individus appartenant à la cohorte de DME âgés d'au moins 38 ans ont été inclus. Nous ne nous attendions pas à ce que cela introduise un biais quelconque, car l'échantillon de DME était un simple échantillon aléatoire de chaque cabinet médical. Pour permettre l'analyse de ces données, on a chiffré le numéro de la carte santé de chaque patient afin d'obtenir un numéro d'identification unique pouvant être apparié avec les fonds de données administratives de l'Ontario hébergées à l'IRSS.

Sources de données administratives

Les sources des données administratives utilisées pour repérer les cas d'ICC dans la population étaient la Base de données sur les congés des patients (BDCP) et la Base de données sur les chirurgies d'un jour (SDS), hébergées par l'Institut canadien d'information sur la santé (ICIS), ainsi que la base de données de l'Assurance santé de l'Ontario des factures des médecins rémunérés à l'acte ou des factures pro forma. Dans les bases de données BDCP et SDS, les diagnostics sont classifiés à l'aide des codes de la Classification internationale des maladies, 9e révision (CIM-9) s'ils sont antérieurs à 2002 et à l'aide des codes de la 10e révision s'ils sont postérieurs à 2002; la base de données de l'Assurancesanté de l'Ontario utilise une version modifiée de la CIM-8. La base de données sur la facturation des médecins de l'Assurancesanté de l'Ontario consigne plus de 95 % des consultations de médecins de premier recours exerçant en cabinet par les résidants de l'Ontario. Le code de diagnostic correspondant à l'ICC dans la base de données de l'sssurance-santé de l'Ontario sur la facturation des médecins ou dans les bases de données de l'ICIS sur l'hospitalisation (BDCP ou SDS) était le code du diagnostic principal; à défaut de ce code, une affection comor-bide était considérée comme une indication positive de la présence d'ICC.

Codes de diagnostic utilisés pour définir l'ICC

Les codes de diagnostic utilisés pour définir l'ICC varient considérablement. Dans la CIM-9, l'ICC est le plus souvent définie par le code 428. Lee et collab.Footnote 4 ont validé le code 428 de la CIM-9 par rapport à deux ensembles de critères cliniques en utilisant les données des dossiers des hôpitaux sur les patients et ont conclu qu'il était hautement prédictif. Vermeulen et collab.Footnote 13 ont eux aussi comparé l'utilité des codes 428 de la CIM-9 et I50 de la CIM-10 et ont conclu qu'ils étaient comparables. Ces deux résultats répondent à la question de savoir si les codes 428 de la CIM-9 et I50 de la CIM-10 permettent de repérer correctement les cas d'insuffisance cardiaque. Toutefois, ils ne permettent pas de déterminer si ces codes sont suffisants pour repérer tous les cas d'ICC. Dans des études effectuées ailleursFootnote 5Footnote 14Footnote 15, on a utilisé une palette plus large de codes de diagnostic pour repérer les cas d'ICC à partir des données administratives. Nous avons décidé de comparer deux définitions de l'ICC : une définition étroite utilisant uniquement le code 428 de la CIM-9 et les codes I500, I501 et I509 de la CIM-10, et une définition plus large incluant également les codes correspondant à la myocardiopathie (codes 425 de la CIM-9 et I42 de la CIM-10) et à l'œdème pulmonaire (codes 514 et 518.4 de la CIM-9 et J81 de la CIM-10).

Algorithmes évalués

Nous avons évalué neuf algorithmes, qui variaient du point de vue des sources de données utilisées et de la durée du suivi. La performance des différents algorithmes de données administratives a été évaluée par rapport au statut à l'égard de l'ICC obtenu par extraction manuelle des données du dossier ou du DME des patients. Ces algorithmes peuvent être divisés en trois grands groupes. Le premier, constitué des algorithmes 1 à 3, ne nécessite qu'un dossier pour le diagnostic d'ICC, mais permet une évaluation comparative de l'utilisation de différentes sources de données. Les algorithmes 4 à 6 nécessitent soit un dossier d'hospitalisation, soit un dossier de soins ambulatoires et un dossier additionnel de l'une ou l'autre source à l'intérieur d'une période donnée pouvant être de un, de deux ou de trois ans. Les algorithmes 7 à 9, qui constituent le troisième groupe, sont similaires aux algorithmes 4 à 6, mais utilisent uniquement des données sur les soins ambulatoires et nécessitent deux dossiers de cette catégorie à l'intérieur d'une période de suivi de un, de deux ou de trois ans (tableau 1).

TABLEAU 1
Algorithmes fondés sur des données administratives évalués par rapport au statut à l'égard de l'ICC obtenu par extraction manuelle des données du dossier ou du DME des patients
Algorithme Description
1 1 dossier d'hospitalisation
2 1 dossier de soins ambulatoires
3 1 dossier d'hospitalisation ou de soins ambulatoires
4 1 dossier d'hospitalisation seulement OU 1 dossier de soins ambulatoires suivi d'un autre dossier dans l'année suivante
5 1 dossier d'hospitalisation seulement OU 1 dossier de soins ambulatoires suivi d'un autre dossier dans les 2 années suivantes
6 1 dossier d'hospitalisation seulement OU 1 dossier de soins ambulatoires suivi d'un autre dossier dans les 3 années suivantes
7 2 dossiers de soins ambulatoires en 1 an
8 2 dossiers de soins ambulatoires en 2 ans
9 2 dossiers de soins ambulatoires en 3 ans

Abréviations : DME, dossier médical électronique; ICC, insuffisance cardiaque congestive.

Nous avons évalué chaque algorithme en ce qui concerne sa sensibilité, sa spécificité et sa valeur prédictive positive (VPP) et avons calculé les intervalles de confiance (IC) à 95 % par la méthode d'approximation binomiale. Toutes les analyses ont été effectuées à l'aide du logiciel SAS, version 9.2 (SAS Institute, Cary, Caroline du Nord, États-Unis).

Nous avons également estimé deux mesures sommaires, la courbe caractéristique de la performance du test (courbe ROC) et les rapports de vraisemblance positif et négatif (RV+ et RV2) afin de préciser l'évaluation du diagnostic. La courbe ROC, d'abord élaborée pour évaluer la détection des signaux par les opérateurs de radars, est une représentation graphique de la relation entre le taux de vrais positifs (sensibilité) et celui de faux positifs (1 – spécificité). Plus l'aire sous la courbe (ASC) se rapproche de la valeur de 1,00, meilleur est le test.

La représentation graphique du rapport de vraisemblance indique la relation entre le RV+, qui est le rapport du taux de vrais positifs (sensibilité) sur celui de faux positifs (1 – spécificité), et le RV2, qui est le rapport du taux de faux négatifs (1 – sensibilité) sur celui de vrais négatifs (spécificité)Footnote 16.Le RV+ mesure la capacité d'un test d'inclure les personnes atteintes de la maladie visée, tandis que le RV2 mesure sa capacité d'exclure les personnes qui n'en sont pas atteintes. Si l'on utilise les seuils proposés pour la première fois par Jaeschke et collab.Footnote 17, les tests dont le RV+ est supérieur à 10 et dont le RV2 est inférieur à 0,1 sont considérés comme étant très utiles, tandis que ceux dont le RV+ est compris entre 5 et 10 et dont le RV2 est compris entre 0,1 et 0,2 sont considérés comme modérément utiles, et ceux dont le RV+ est compris entre 2 et 5 et le RV2 est compris entre 0,2 et 0,5 ne sont que peu utiles. Les tests dont le RV+ est inférieur à 2 et dont le RV2 est supérieur à 0,5 ne sont d'aucune utilité.

Résultats

La cohorte de validation combinée comptait 2 338 patients, dont 99 atteints d'ICC d'après leur dossier médical ou leur DME et 2 239 non atteints (prévalence : 4,2 %).

La distribution selon l'âge et le sexe des patients dans la cohorte de validation était similaire à celle de la population de l'Ontario en 2006Footnote 18 âgée d'au moins 38 ans, avec une légère surreprésentation des femmes (56 % dans la cohorte comparativement à 52 % dans la population générale) et des personnes âgées de 65 ans et plus (32 % dans la cohorte comparativement à 26 % dans la population de l'Ontario âgée de 38 ans et plus). Cette situation était attendue, car notre cohorte de validation était composée de personnes qui consultent régulièrement un médecin de famille, et l'on sait que tant les femmes que les personnes âgées sont plus susceptibles de consulter un médecinFootnote 19.L'âge moyen de notre cohorte d'adultes actifs était de 57,9 ans, soit un peu plus que l'âge moyen (56,1 ans) des Ontariens adultes âgés de 38 ans et plus.

Si l'on considère les trois groupes d'algorithmes de façon générale (voir le tableau 2), deux caractéristiques se détachent nettement. La première est que la durée du suivi n'a que peu d'effet. Les résultats pour les algorithmes 4, 5 et 6 sont pratiquement identiques et, de même, il n'y a qu'une légère différence entre la performance des algorithmes 7, 8 et 9. Ce qui semble avoir plus d'effets est le choix des sources de données. Par exemple, la sensibilité des algorithmes 4, 5 ou 6, qui utilisent à la fois les données sur l'hospitalisation et celles sur les soins ambulatoires, est supérieure d'au moins 10 points de pourcentage à celle des algorithmes 7, 8 ou 9, qui ne font appel qu'aux données sur les soins ambulatoires, et supérieure de 20 points de pourcentage aux algorithmes utilisant seulement les données sur l'hospitalisation.

L'incidence de la source des données sur la performance des algorithmes est particulièrement évidente dans les résultats donnés par les algorithmes 1, 2 et 3. L'algorithme 3, qui ne requiert qu'un dossier de l'une ou l'autre des deux sources pour établir un diagnostic d'ICC, affiche la sensibilité la plus élevée (89,9 %), mais la spécificité la plus faible (93,5 %) et la VPP la plus basse (38,0 %). L'utilisation des seules données sur l'hospitalisation (algorithme 1) est la méthode la moins sensible, ne permettant de repérer que 60,6 % des cas d'ICC, mais présente également la plus grande spécificité (98,6 %) et la VPP la plus élevée (65,9 %; tableau 2). La valeur prédictive négative (données non présentées) est dans tous les cas élevée, allant de 99,6 % pour l'algorithme 3 à 98,2 % pour l'algorithme 1.

TABLEAU 2
Sensibilité, spécificité et VPP de neuf algorithmes utilisés pour estimer le statut à l'égard de l'ICC à partir de données administratives et de données de médecins de premier recours extraites manuellement
Numéro de l'algorithme Description Définition de l'ICC Sensibilité % (IC à 95 %) Spécificité % (IC à 95 %) VPP
% (IC à 95 %)
1 1 dossier ICIS Étroite 60,6 (50,8 à 70,4) 98,6 (98,1 à 99,1) 65,9 (56,0 à 75,9)
Large 60,6 (50,8 à 70,4) 98,3 (97,8 à 98,8) 61,2 (51,4 à 71,0)
2 1 dossier de paiement RASO Étroite 82,8 (75,3 à 90,4) 95,8 (94,9 à 96,6) 46,3 (51,4 à 71,0)
Large 82,8 (75,3 à 90,4) 95,8 (94,9 à 96,6) 46,3 (38,9 à 53,7)
3 1 dossier ICIS ou un dossier de paiement RASO Étroite 89,9 (83,9 à 95,9) 93,5 (92,5 à 94,5) 38,0 (31,8 à 44,3)
Large 90,9 (85,1 à 96,7) 93,3 (92,3 à 94,4) 37,7 (31,5 à 43,8)
4 1 dossier ICIS ou RASO + 2e dossier (n'importe quelle source) en 1 an Étroite 84,8 (77,7 à 92,0) 97,0 (96,3 à 97,7) 55,6 (47,6 à 63,6)
Large 84,8 (77,7 à 92,0) 96,8 (96,1 à 97,5) 53,8 (45,9 à 61,8)
5 1 dossier ICIS ou RASO + 2e dossier (n'importe quelle source) en 2 ans Étroite 84,8 (77,7 à 92,0) 97,0 (96,1 à 97,5) 55,3 (47,3 à 63,3)
Large 84,8 (77,7 à 92,0) 96,7 (96,0 à 97,5) 53,5 (45,6 à 61,4)
6 1 dossier ICIS ou RASO + 2e dossier (n'importe quelle source) en 3 ans Étroite 84,8 (77,7 à 92,0) 96,9 (96,2 à 97,6) 54,9 (46,9 à 62,9)
Large 84,8 (77,7 à 92,0) 96,7 (96,0 à 97,4) 53,2 (45,0 à 61,0)
7 2 dossiers RASO/ SNISA en 1 an Étroite 72,7 (63,8 à 81,7) 97,8 (97,2 à 98,4) 59,5 (50,6 à 68,4)
Large 72,7 (63,8 à 81,7) 97,8 (97,2 à 98,4) 59,5 (50,6 à 68,4)
8 2 dossiers RASO/ SNISA en 2 ans Étroite 74,8 (66,0 à 83,5) 97,8 (97,2 à 98,4) 60,2 (51,4 à 68,9)
Large 74,8 (66,0 à 83,5) 97,8 (97,2 à 98,4) 60,2 (51,4 à 68,9)
9 2 dossiers RASO/ SNISA en 3 ans Étroite 75,8 (67,2 à 84,4) 97,8 (97,2 à 98,4) 60,0 (51,3 à 68,7)
Large 75,8 (67,2 à 84,4) 97,8 (97,2 à 98,4) 60,0 (51,3 à 68,7)

Abréviations : IC, intervalle de confiance; ICC, insuffisance cardiaque congestive; ICIS, Institut canadien d'information sur la santé; RASO, Régime d'Assurance maladie de l'Ontario; SNISA, Système national d'information sur les soins ambulatoires; VPP, valeur prédictive positive.

En ce qui concerne les résultats des mesures sommaires, il est intéressant de noter que les algorithmes les plus utiles sont là aussi ceux qui utilisent à la fois les données sur l'hospitalisation et celles sur les soins ambulatoires. Les algorithmes qui n'utilisent qu'un de ces types de données, qu'il s'agisse de celles sur l'hospitalisation ou de celles sur les soins ambulatoires, sont tous situés à un point inférieur de la courbe ROC ou dans la région « faible utilité » du graphique du RV (figure 1). En ce qui concerne la courbe ROC (figure 2), l'algorithme 3 puis les algorithmes 4, 5 et 6 présentent les meilleures performances parmi les neuf. L'ASC est égale à 0,917 pour l'algorithme 3 et à 0,909 pour les algorithmes 4, 5 et 6. Si l'on compare les résultats sur le plan du RV (figure 2), les algorithmes 3, 4, 5, 6 et 2 se situent tous dans la section « utilité moyenne » du graphique, l'algorithme 3 étant le plus proche de la section « grande utilité », et l'algorithme 2, le plus éloigné de celle-ci.

FIGIURE 1
Représentation sous forme de courbe ROC des résultats de neuf algorithmes visant à repérer les cas d'insuffisance cardiaque congestive (ICC)

FIGURE 1
[FIGURE 1, texte équivalent]

Les algorithmes qui n'utilisent qu'un type de données, qu'il s'agisse de celles sur l'hospitalisation ou de celles sur les soins ambulatoires, sont tous situés à un point inférieur de la courbe ROC ou dans la région « faible utilité » du graphique du RV.

Abréviations : ICC, insuffisance cardiaque congestive; ROC, receiver operating characteristic (caractéristique de la performance d'un test).

FIGURE 2
Rapports de vraisemblance (RV) pour neuf algorithmes visant à repérer les cas d'insuffisance cardiaque congestive (ICC)

FIGURE 2

[FIGURE 2, texte équivalent]

En ce qui concerne la courbe ROC, l'algorithme 3 puis les algorithmes 4, 5 et 6 présentent les meilleures performances parmi les neuf. L'ASC est égale à 0,917 pour l'algorithme 3 et à 0,909 pour les algorithmes 4, 5 et 6. Si l'on compare les résultats sur le plan du RV (figure 2), les algorithmes 3, 4, 5, 6 et 2 se situent tous dans la section « utilité moyenne » du graphique, l'algorithme 3 étant le plus proche de la section « grande utilité », et l'algorithme 2, le plus éloigné de celle-ci.

Abréviation : RV, rapport de vraisemblance.

Choix du meilleur algorithme

Le choix final du meilleur algorithme pour repérer les cas d'ICC devait se faire entre les algorithmes 3 et 4 (les algorithmes 5 et 6 ayant été exclus en raison de l'inutilité de la longue période de suivi qui leur est associée). D'après les résultats des mesures sommaires, l'algorithme 3 semblait être supérieur. De surcroît, si ce test devait être utilisé dans un cadre clinique, il serait en général le plus performant, principalement parce que sa sensibilité élevée réduit au minimum le nombre de cas susceptibles d'être manqués. Toutefois, pour les études représentatives de la population, la proportion de faux positifs est un critère beaucoup plus important. Comme cet algorithme doit être utilisé pour l'ensemble d'une population, et pas simplement pour certains patients qui choisissent volontairement de consulter un médecin, et comme il s'agit d'une affection relativement rare, une légère diminution de la spécificité peut suffire pour produire un grand nombre de faux positifs. Les faux positifs, à leur tour, mènent à des résultats de recherche biaisés en faveur de l'hypothèse nulle. Par conséquent, l'algorithme 3 a été écarté en raison de sa spécificité et de son RV+ relativement faibles. Le meilleur algorithme pour repérer les cas d'ICC est finalement l'algorithme 4.

En plus d'évaluer les différents algorithmes, nous avons également mis à l'épreuve deux définitions différentes de l'ICC. Dans la plupart des cas, il n'y a eu que peu de différences dans les résultats. Dans les cas où une différence a été observée, la définition étroite avait une meilleure performance, principalement parce que l'utilisation de la définition plus large tendait à engendrer un plus grand nombre de faux positifs (tableau 3).

TABLEAU 3
Comparaison du statut à l'égard de l'insuffisance cardiaque obtenu à partir de données administratives et de données de médecins de premier recours extraites manuellement à l'aide de neuf algorithmes (nombre)
Algorithme Description Définition de l'ICC Vrais positifs N Faux positifs N Vrais négatifs N Faux négatifs N
1 1 dossier ICIS Étroite 60 31 2 208 39
Large 60 38 2 201 39
2 1 dossier de paiement RASO Étroite 82 95 2 144 17
Large 82 95 2 144 17
3 1 dossier ICIS ou RASO Étroite 89 145 2 094 10
Large 90 149 2 090 9
4 1 dossier ICIS ou RASO + 2e dossier (n'importe quelle source) en 1 an Étroite 84 67 2 172 15
Large 84 72 2 167 15
5 1 dossier ICIS ou RASO + 2e dossier (n'importe quelle source) en 2 ans Étroite 84 68 2 171 15
Large 84 73 2 166 15
6 1 dossier ICIS ou RASO + 2e dossier (n'importe quelle source) en 3 ans Étroite 84 69 2 170 15
Large 84 74 2 165 15
7 2 dossiers RASO/ SNISA en 1 an Étroite 72 49 2 190 27
Large 72 49 2 190 27
8 2 dossiers RASO/ SNISA en 2 ans Étroite 74 49 2 190 25
Large 74 49 2 190 25
9 2 dossiers RASO/ SNISA en 3 ans Étroite 75 50 2 189 24
Large 75 50 2 189 24

Abréviations : ICC, insuffisance cardiaque congestive; ICIS, Institut canadien d'information sur la santé; RASO, Régime d'Assurance maladie de l'Ontario; SNISA, Système national d'information sur les soins ambulatoires.

Analyse

Dans cette étude, nous avons mis à l'épreuve neuf algorithmes de données administratives variant du point de vue du nombre de dossiers requis pour un diagnostic d'ICC, de la durée de la période de suivi autorisée et des sources des données utilisées. Nous avons également mis à l'épreuve deux ensembles différents de codes de diagnostic utilisés pour repérer les individus atteints d'ICC dans les données administratives.

Dans les études précédentes portant sur la comparaison de l'information figurant dans les dossiers des hôpitaux et des données sur les congés, on avait conclu que le codage des diagnostics d'ICC donnait des résultats d'une grande exactitude par rapport à des critères cliniques comme le score de Framingham ou les critères de BostonFootnote 4Footnote 5.Toutefois, nous avons constaté que les données sur les hospitalisations seules étaient insuffisantes pour estimer la prévalence de l'ICC et risquaient d'entraîner l'omission de 40 % des cas positifs. Cela laisse à penser qu'une proportion appréciable d'Ontariens atteints d'ICC reçoivent leur diagnostic et sont pris en charge à l'extérieur de l'hôpital.

Une autre observation générale est que le fait de fonder un diagnostic d'ICC sur un seul dossier contenant un code de diagnostic d'ICC peut permettre de repérer les individus atteints de cette affection dans la mesure où l'on utilise à la fois les données sur l'hospitalisation et celles sur les soins ambulatoires. Toutefois, cette méthode donne lieu à un nombre de faux positifs beaucoup trop élevé pour être acceptable. Il est possible qu'un médecin inscrive le code de l'ICC alors qu'il exclut cette maladie, auquel cas un second code de diagnostic serait nécessaire pour confirmer qu'il s'agit bien d'un cas d'ICC.

Nous avons trouvé que le meilleur algorithme pour repérer les cas d'ICC est l'utilisation d'un dossier d'hospitalisation seul, ou d'un dossier de soins ambulatoires s'il est suivi d'un second dossier de l'une ou l'autre source en l'espace d'un an; cette méthode permet de repérer environ 85 % des patients atteints d'ICC, tout en maintenant le taux de faux positifs à environ 3 %, ce qui est relativement peu élevé. Cette observation est similaire à celle faite dans des études portant sur d'autres maladies chroniques comme le diabèteFootnote 7, l'hypertensionFootnote 6 et la cardiopathie ischémiqueFootnote 8, ainsi que dans des études de validation antérieures portant sur l'utilisation de données administratives pour repérer les cas d'ICCFootnote 10Footnote 11.

L'absence quasi totale d'effet de la durée de la période de suivi jusqu'au second dossier d'ICC a un peu surpris, car elle n'avait pas été observée dans des études similaires portant sur l'hypertension et le diabèteFootnote 6Footnote 7.Ce phénomène peut s'expliquer par le fait que la plupart des personnes réellement atteintes d'ICC prennent des médicaments, ce qui les amène selon toute vraisemblance à consulter un médecin à des intervalles de quelques mois. Par conséquent, un suivi d'un an est suffisant pour que notre algorithme permette de repérer les cas d'ICC, même si les patients ne sont pas hospitalisés. En revanche, l'hypertension et le diabète peuvent au départ être pris en charge sans médicament, ce qui peut amener les personnes atteintes à consulter moins fréquemment leur médecin; dans de telles circonstances, une période de suivi plus longue est requise avant l'obtention d'un second dossier.

Pour tous les algorithmes, la VPP semble plutôt faible, variant de 37,7 à 65,9. Cela tient au fait que la VPP est étroitement liée à la prévalence : plus la prévalence est faible, plus la VPP est faible. L'ICC étant relativement rare dans notre population, avec une prévalence de 4,3 % seulement, les valeurs de la VPP sont elles aussi peu élevées.

L'ICC est étroitement liée à l'âge : alors qu'elle est extrêmement rare chez les moins de 40 ans et rare chez les individus de 40 à 65 ans, sa prévalence augmente graduellement après 65 ans. Cela nous incite à recommander que l'algorithme ne soit pas utilisé pour les populations où l'on sait que l'ICC est très rare (c'est-à-dire chez les moins de 40 ans). On peut s'attendre à ce que l'algorithme donne de très bons résultats chez les personnes âgées, en particulier chez celles de plus de 75 ans.

En ce qui concerne les codes de la CIM-9 et de la CIM-10 utilisés pour définir l'ICC, nous n'avons trouvé aucune preuve indiquant que l'utilisation d'une liste élargie de codes de diagnostic donnait de meilleurs résultats que la définition étroite de la maladie par le code 428 de la CIM-9 et les codes I500, I501 et I509 de la CIM-10.

Limites

Les limites de cette étude tiennent surtout au fait que la plupart des données utilisées ont été recueillies à des fins administratives et non à des fins de recherche. Une limite importante des données de l'assurance maladie de l'Ontario est qu'un seul code de diagnostic figure sur chaque facture. Si l'ICC n'est pas la raison principale de la consultation du médecin, elle peut ne pas être consignée. Cette limite est compensée par le fait que les Ontariens consultent assez fréquemment leur médecin, en particulier s'ils ont plus de 65 ans, ce qui offre au médecin plusieurs occasions de noter l'ICC sur une facture en l'espace d'une année, comme le montre la constatation que la durée du suivi n'a aucun effet sur la capacité de nos algorithmes de repérer les cas d'ICC.

Si nous reconnaissons que nous n'avons pas pu appliquer les critères diagnostiques de la New York Heart Association (NYHA) à l'ICC pour déterminer la présence d'une insuffisance cardiaque, nous avons cependant utilisé des données du « monde réel » produites par les actes de diagnostic et de prise en charge des médecins en fonction de leur propre acuité diagnostique. Cet aspect ne s'évalue pas facilement selon des critères structurés et formels, mais nous sommes d'avis que si un médecin traite un patient pour une ICC, il est raisonnable de considérer que le patient est atteint de cette affection pour ce qui concerne le calcul de son incidence et de sa prévalence dans une population importante.

Conclusion

Dans cette étude, nous avons montré qu'il est possible de repérer les cas d'ICC avec un degré d'exactitude élevé à partir de données administratives, dans la mesure où l'on utilise à la fois les dossiers sur les hospitalisations et ceux sur les soins ambulatoires. Un algorithme s'appuyant sur un dossier d'hospitalisation ou sur un dossier de soins ambulatoires suivi d'un second dossier de l'une ou l'autre source dans l'année, l'ICC étant définie par le code de diagnostic 428 de la CIM-9 et les codes I500, I501 et I509 de la CIM-10, permet de repérer les patients atteints d'ICC avec une sensibilité de 84,8 % et une spécificité de 97,0 %.

Remerciements

Cette étude a bénéficié de l'appui de l'Institut de recherche en services de santé (IRSS), qui est financé par une subvention annuelle du ministère de la Santé et des Soins de longue durée de l'Ontario. Les opinions, résultats et conclusions de l'étude n'engagent que ses auteurs et sont indépendants des sources de financement. Ils ne sont nullement le reflet de la position de l'IRSS ou du ministère de la Santé et des Soins de longue durée de l'Ontario.

La Dre Karen Tu est récipiendaire d'une bourse de recherche en soins de santé primaires des Instituts de recherche en santé du Canada (IRSC).

Cette étude a bénéficié d'une subvention de l'Agence de la santé publique du Canada et d'une subvention d'équipe pour la recherche sur les maladies vasculaires attribuée par les IRSC à l'Équipe canadienne de recherche sur les résultats des interventions en santé cardiovasculaire.

Conflit d'intérêts : aucun.

Références

Détails de la page

Date de modification :