Publié le 11 juillet 2023

Dans le cadre de ce programme, un algorithme cancer SNDS a été construit et validé pour repérer un certain nombre de localisations de cancers en lien avec les expositions professionnelles.

Afin de valider ces algorithmes, une étude de validation a été mise en place avec les registres Français de cancers. 

Trois algorithmes développés

Trois algorithmes génériques ont été développés pour identifier les retraités ESPrI présentant des localisations cancéreuses spécifiques dans le Système National des Données de Santé de l'assurance maladie. L'objectif de cette étude était de valider les algorithmes à partir des données de la cohorte ESPrI et des Registres Français du cancer. Sept registres généraux de cancers et un spécialisé couvrants 10 départements communs à ESPrI (Somme, Gironde, Lille et sa région, Poitou-Charentes, Manche, Calvados, Haute-Vienne) ont été sollicités et tous ont accepté de participer.

Résultats

La cohorte ESPrI est composée d'artisans retraités âgés en moyenne de 73 ans en 2020. Entre 2011 et 2016, les données de 7 544 participants enregistrées dans un questionnaire auto-administré ont été couplées au SNDS. Les données des registres français de cancer ont été utilisées comme gold standard. Les indicateurs de performance tels que la sensibilité, la spécificité, les valeurs prédictives positives et négatives (PPV, NPV) ont été estimés pour les trois algorithmes basés sur le code CIM-10 et l'année la plus ancienne des Affections Longue Durée (A) et des données Programme de Médicalisation des Systèmes d'Information (PMSI) (B) ont été développés. Le premier algorithme, nommé « PMSI », issu des données d’hospitalisations en MCO figurant dans le PMSI, il était construit à partir de la date de début de séjour, des codes CIM-101 des pathologies du patient et des actes médicaux réalisés (chimiothérapie, radiothérapie, etc.) en lien avec les diagnostics principaux, reliés ou associés  (respectivement DP, DR, DAS) relatifs aux séjours. Le troisième algorithme résulte du croisement de ALD & PMSI (C). Par ailleurs, les faux positifs et les faux négatifs ont été décrits pour voir si de meilleurs algorithmes pouvaient être développés. 

Leurs sensibilités variaient de 50% à 93% avec l'algorithme A, de 71% à 100% avec l'algorithme B et de 92% à 100% avec l'algorithme C respectivement. Le meilleur algorithme était l'algorithme C basé sur deux sources de données combinées ALD et PMSI, avec les meilleures sensibilités et VPP selon certains sites de cancers. La majorité des faux positifs étaient en fait des cancers in situ et des sites d'organes voisins (œsophage et estomac par exemple). La majorité des faux négatifs étaient probablement dus à une sous-déclaration d'ALD. 

Les performances des algorithmes étaient élevées. Le SNDS et les algorithmes validés peuvent être utilisés pour le suivi épidémiologique passif de certains sites de cancers spécifiques dans la cohorte ESPrI. Un article a été soumis.

1 Le diagnostic principal (DP) est défini comme étant la pathologie, comme principalement responsable de l'hospitalisation du patient. Les diagnostics associés nécessaires à la classification, (DAS) sont en fait les diagnostics, symptômes et autres motifs de recours significatifs d’un effort de soins ou de consommation de ressources.