Un abonnement à JoVE est nécessaire pour voir ce contenu. Connectez-vous ou commencez votre essai gratuit.
Method Article
* Ces auteurs ont contribué à parts égales
Le présent protocole décrit les codes en R pour évaluer les capacités de discrimination et d’étalonnage d’un modèle de risque concurrent, ainsi que les codes pour la validation interne et externe de celui-ci.
Le modèle à risques proportionnels de Cox est largement appliqué pour les analyses de survie en milieu clinique, mais il n’est pas en mesure de faire face à de multiples résultats de survie. Différent du modèle traditionnel à risques proportionnels de Cox, les modèles de risque concurrents tiennent compte de la présence d’événements concurrents et de leur combinaison avec un nomogramme, un dispositif de calcul graphique, qui est un outil utile pour les cliniciens pour effectuer une prédiction pronostique précise. Dans cette étude, nous présentons une méthode pour établir le nomogramme de risque concurrent, c’est-à-dire l’évaluation de ses capacités de discrimination (c.-à-d. indice de concordance et aire sous la courbe) et d’étalonnage (c.-à-d. courbes d’étalonnage), ainsi que l’avantage net (c.-à-d. analyse de la courbe de décision). De plus, une validation interne à l’aide de rééchantillonnages bootstrap de l’ensemble de données original et une validation externe à l’aide d’un ensemble de données externe du nomogramme de risque concurrent établi ont également été effectuées pour démontrer sa capacité d’extrapolation. Le nomogramme du risque concurrent devrait être un outil utile pour les cliniciens afin de prédire le pronostic en tenant compte des risques concurrents.
Au cours des dernières années, des facteurs pronostiques émergents ont été identifiés avec le développement de la médecine de précision, et les modèles pronostiques combinant des facteurs moléculaires et clinicopathologiques attirent de plus en plus l’attention dans les milieux cliniques. Cependant, les modèles non graphiques, tels que le modèle à risques proportionnels de Cox, avec les résultats des valeurs des coefficients, sont difficiles à comprendre pour les cliniciens1. En comparaison, un nomogramme est un outil de visualisation de modèles de régression (incluant le modèle de régression de Cox, le modèle de risque concurrent, etc.), un diagramme bidimensionnel conçu pour le calcul graphique approximatif d’une fonction mathématique2. Il permet d’évaluer différents niveaux de variables dans un modèle clinique et de calculer des scores de risque (RS) pour prédire le pronostic.
L’évaluation du modèle est essentielle dans la construction du modèle, et deux caractéristiques sont généralement acceptées pour l’évaluation : la discrimination et l’étalonnage. Dans les modèles cliniques, la discrimination fait référence à la capacité d’un modèle à séparer les personnes qui développent des événements de celles qui n’en développent pas, comme les patients qui meurent par rapport à ceux qui restent en vie, et l’indice de concordance (indice C) ou l’aire sous la courbe des caractéristiques opératoires du récepteur (ASC) sont généralement utilisés pour la caractériser 3,4. L’étalonnage est un processus de comparaison des probabilités prédites d’un modèle avec les probabilités réelles, et les courbes d’étalonnage ont été largement utilisées pour le représenter. De plus, la validation du modèle (validation interne et externe) est une étape importante dans la construction du modèle, et seuls les modèles validés peuvent être extrapolés5.
Le modèle à risques proportionnels de Cox est un modèle de régression utilisé en recherche médicale pour étudier les associations entre les facteurs pronostiques et le statut de survie. Cependant, le modèle à risques proportionnels de Cox ne tient compte que de deux statuts de résultat [Y (0, 1)], tandis que les sujets de l’étude font souvent face à plus de deux statuts et que des risques concurrents surviennent [Y (0, 1, 2)]1. La survie globale (SG), qui est définie comme le temps écoulé entre la date d’origine (p. ex. le traitement) et la date du décès, quelle qu’en soit la cause, est le critère d’évaluation le plus important dans l’analyse de la survie. Cependant, le système d’exploitation ne parvient pas à différencier les décès spécifiques au cancer des décès non spécifiques au cancer (par exemple, les événements cardiovasculaires et autres causes non liées), ignorant ainsi les risques concurrents6. Dans ces situations, le modèle de risque concurrent est préféré pour la prédiction du statut de survie avec la prise en compte des risques concurrents7. La méthodologie de construction et de validation des modèles à risques proportionnels de Cox est bien établie, alors qu’il y a eu peu de rapports concernant la validation de modèles de risque concurrents.
Dans notre étude précédente, un nomogramme de risque concurrent spécifique, une combinaison d’un nomogramme et d’un modèle de risque concurrent, et une estimation du score de risque basée sur un modèle de risque concurrent ont été établis8. Cette étude vise à présenter différentes méthodes d’évaluation et de validation du nomogramme de risque concurrent établi, qui devrait servir d’outil utile aux cliniciens pour prédire le pronostic en tenant compte des risques concurrents.
La base de données Surveillance, Epidemiology, and End Results (SEER) est une base de données sur le cancer en libre accès qui ne contient que des données anonymisées sur les patients (ID SEER : 12296-Nov2018). Par conséquent, cette étude a été exemptée de l’approbation du comité d’examen de l’hôpital affilié Jinhua, École de médecine de l’Université du Zhejiang.
1. Préparation des données et des emballages R
2. Établir des nomogrammes de risque concurrents selon deux méthodes distinctes
3. Capacité de discrimination du nomogramme du risque concurrent
4. Capacité d’étalonnage des modèles de risque concurrents
5. Analyse de la courbe de décision des modèles de risque concurrents
6. Validation interne à l’aide de la méthode bootstrap
7. Validation externe du modèle de risque concurrent
Dans cette étude, les données des patientes atteintes d’un cancer du sein ont été extraites de la base de données SEER et ont servi d’exemple. La base de données SEER fournit des données sur le cancer représentant environ 34,6% de la population des États-Unis, et l’autorisation d’accéder à la base de données a été obtenue (numéro de référence 12296-Nov2018).
Deux nomogrammes (figure 1), tous deux comprenant le type histologique, le grade d...
Cette étude a comparé des nomogrammes de risque concurrents établis par deux méthodes distinctes et a procédé à l’évaluation et à la validation des nomogrammes établis. Plus précisément, cette étude a fourni un tutoriel étape par étape pour établir le nomogramme basé sur une méthode directe, ainsi que pour calculer l’indice C et tracer les courbes d’étalonnage.
Le progiciel efficace du logiciel R est largement utilisé pour la construction et l’évaluation d...
Les auteurs déclarent qu’ils n’ont pas d’intérêts concurrents.
L’étude a été financée par des subventions du Medical Science & Technology Plan Project de la province du Zhejiang (numéros de subvention 2013KYA212), du programme général de la Fondation des sciences naturelles de la province du Zhejiang (numéro de subvention Y19H160126) et du programme clé du Bureau municipal des sciences et technologies de Jinhua (numéro de subvention 2016-3-005, 2018-3-001d et 2019-3-013).
Name | Company | Catalog Number | Comments |
R software | None | Not Applicable | Version 3.6.2 or higher |
Computer system | Microsoft | Windows 10 | Windows 10 or higher |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon