JoVE Logo

S'identifier

Un abonnement à JoVE est nécessaire pour voir ce contenu. Connectez-vous ou commencez votre essai gratuit.

Dans cet article

  • Résumé
  • Résumé
  • Introduction
  • Protocole
  • Résultats
  • Discussion
  • Déclarations de divulgation
  • Remerciements
  • matériels
  • Références
  • Réimpressions et Autorisations

Résumé

Nous décrivons une méthode à plusieurs étapes pour mesurer un effet de cohorte avec des données sur l’âge, ce qui permet d’éliminer les données dans de nombreuses situations sans sacrifier la qualité des données. Le protocole démontre la stratégie et fournit un modèle de régression pondéré pour l’analyse des données sur le carcinome hépatocellulaire.

Résumé

Afin d’éliminer l’influence de l’âge et de la période dans les données du tableau de contingence du cycle d’âge, une méthode en plusieurs étapes a été adoptée pour évaluer l’effet de cohorte. La tumeur maligne primitive la plus générale du foie est le carcinome hépatocellulaire (CHC). Le CHC est associé à une cirrhose du foie avec des étiologies alcooliques et virales. En épidémiologie, les tendances à long terme de la mortalité du CHC ont été délimitées (ou prévues) à l’aide d’un modèle de cohorte d’âge, de période et de cohorte (APC). Les décès par CHC ont été déterminés pour chaque cohorte avec son influence pondérée. L’intervalle de confiance (IC) de la moyenne pondérée est assez étroit (comparé aux estimations équipondérées). En raison de l’IC assez étroit avec moins d’incertitude, l’estimation de la moyenne pondérée a été utilisée comme moyen de prévision. Avec la méthode à plusieurs degrés, il est recommandé d’utiliser une estimation moyenne pondérée basée sur un modèle de régression pour évaluer l’effet de cohorte dans les données du tableau de contingence âge-période.

Introduction

La tumeur maligne primitive la plus courante du foie est le carcinome hépatocellulaire (CHC). Son taux de mortalité se classe au cinquième rang chez les hommes et au huitième rang chez les femmes (6 % des hommes et 3 % des femmes) 1 parmi toutes les tumeurs malignes dans le monde. À Taïwan, c’est le cancer le plus fréquent chez les hommes et le deuxième cancer le plus fréquent chez les femmes (21,8 % des hommes et 14,2 % des femmes) 2. On estime que depuis 2000, le nombre annuel de CHC diagnostiqués dans le monde est de 564 000, dont 398 000 hommes et 166 000 femmes3. En épidémiologie, la façon la plus courante d’expliquer la relation entre les variables de l’âge, de la période et de la cohorte (APC) est que l’âge et la période s’influencent mutuellement pour créer une expérience générationnelle unique pour la tendance de la maladie étudiée.

Même si cette conceptualisation a toujours un lien linéaire précis entre l’âge et la cohorte = la période, l’exposition (prédicteur) n’est pas un facteur inhérent à une cohorte de naissance. Au lieu de cela, nous proposons que lorsque les changements entraînent des distributions différentes de la maladie, il y a un effet de cohorte. Néanmoins, puisque l’âge + la cohorte = la période, ces trois variables sont linéairement liées ; ce n’est que si d’autres restrictions sont appliquées qu’il est impossible de générer un modèle d’estimation de l’âge, de la période et de la cohorte (APC) en utilisant les effets linéaires de l’âge, de la période et de la cohorte. Dans cette étude, nous avons clarifié ce problème et les restrictions potentielles que nous avons imposées dans nos publications précédentes 4,5,6,7.

À la moindre conjecture sur les données du tableau de contingence, la méthode en plusieurs étapes 8 propose trois étapes pour évaluer l’effet de cohorte. De plus, comme le polissage médian ne dépend pas d’une distribution ou d’un cadre spécifique, il a été utilisé pour divers types de données, tels que les ratios, les rapports logarithmiques et les dénombrements. Le polissage médian est la principale technique utilisée dans la méthode multiphasique.

Les données d’un tableau de contingence à deux facteurs 9 ont été utilisées pour générer le développement de la médiane polie. La procédure de polissage de la médiane est utilisée pour éliminer les effets cumulatifs de l’âge (c’est-à-dire la rangée) et de la période (c’est-à-dire la colonne) en soustrayant itérativement la médiane de chaque ligne et de chaque colonne. Cette procédure est souvent utilisée dans l’analyse des données épidémiologiques 10. L’un des avantages de cette technique est qu’il n’est pas nécessaire d’émettre des hypothèses sur la distribution ou la structure des données dans le tableau de contingence bidirectionnel. Par conséquent, cette technique a été largement utilisée pour tout type de données contenues dans le tableau, telles que les données sur le suicide 11. Le modèle APC a également été utilisé pour décrire les tendances à long terme de l’incidence ou de la mortalité des maladies 5. Les modèles APC supposent souvent que l’âge, la période et la cohorte ont des effets additifs sur la transformation logarithmique de la maladie/mortalité. Pour évaluer les effets de cohorte, le protocole décrit génère un modèle APC pour l’analyse complète de la mortalité par carcinome hépatocellulaire (CHC) avec régression pondérée, ce qui permet des prédictions fiables et une évaluation modérée des effets du traitement.

Protocole

1. Sources des données

Pour démontrer les calculs, nous avons utilisé des données annuelles sur la mortalité par CHC de 1976 à 2015 pour les hommes et les femmes à Taïwan. Le progiciel statistique pour les sciences sociales (SPSS) version 24.0 pour Windows et Microsoft Excel a été utilisé pour exécuter les protocoles de cette étude.

  1. Demandez au médecin du CHC de classer les symptômes cliniques des patients, les tests de laboratoire et les résultats d’imagerie médicale afin de donner un code de diagnostic selon le code de la Classification internationale des maladies (CIM), CIM 150.
  2. Assurez-vous que le fichier de données (sauvegardé au format CSV) contient l’année (c.-à-d. la période), l’âge, la cohorte, le nombre de décès, le nombre de population au milieu de l’année et la mortalité sous forme de colonnes.
    1. Cliquez sur Fichier | Importer des données | Données CSV | Ouvrez. Assurez-vous que la case Lire les noms des variables de la première ligne des données est cochée, puis cliquez sur OK. Assurez-vous que le fichier de données est importé dans SPSS.
  3. Construire des données de tableau de contingence croisées par groupes d’âge-période à l’aide de SPSS. En général, nous définissons les variables de ligne comme l’âge et les variables de colonne comme la période. Si les données comportaient des données d’une seule période, d’une seule année (ou d’une seule année d’âge), il était nécessaire de les intégrer dans un groupe de périodes (ou de groupes d’âge). Ensuite, nous avons croisé les attitudes d’un groupe d’âge au cours des années d’enquête.
    1. Cliquez sur Analyser | Statistiques descriptives | Tableaux croisés et sélectionnez la variable d’âge dans la zone à côté de la ou des lignes et la variable de période dans la case à côté de la ou des colonnes. Cliquez sur Cellules et assurez-vous que la case Observé est cochée. Un tableau d’urgence du nombre de décès (ou du nombre de population en milieu d’année, ou de la mortalité) peut être effectué dans SPSS en procédant comme suit.
    2. Exportez les données du tableau de contingence qui ont été saisies au format CSV pour analyse à l’aide d’autres logiciels. Cliquez sur Fichier | Exporter des données | Assurez-vous que le format de données souhaité est au format CSV | Emplacement. Ce champ non modifiable affiche l’emplacement sécurisé du fichier exporté.
    3. Nom de fichier : cliquez sur Sélectionner pour modifier le nom du fichier.
    4. Exporter en tant que type : sélectionnez un type de fichier CSV dans le menu déroulant. Cliquez sur variables pour afficher les variables disponibles et pour sélectionner les tables de variables. Par défaut, toutes les variables de l’ensemble de données source sont conservées pour le fichier exporté. Les chercheurs peuvent utiliser les tables pour spécifier les variables sources à inclure dans le fichier exporté. Cliquez sur Exporter.

2. Réglage du modèle

REMARQUE : La méthode en plusieurs étapes a été proposée par Keys et Li 8 avec une investigation graphique. Une analyse du polissage médian a été effectuée afin d’éliminer les effets cumulatifs de l’âge et de la période ; Enfin, ces résidus de la phase de polissage médian dans la catégorie de cohorte du modèle de régression linéaire ont été régressés, et les effets de cohorte à l’aide des données du tableau de contingence ont été évalués.

  1. La représentation graphique comme première phase
    1. Créez un graphique linéaire des groupes d’âge et des groupes de périodes. Pour inspecter les cohortes de naissance de tous les groupes d’âge ou de toutes les cohortes de naissance, dessinez des cohortes de naissance paires de tous les âges ou de tous les cycles dans les graphiques linéaires.
    2. Importez un fichier CSV avec les données de mortalité de la table de contingence. Cliquez sur Fichier | Ouvrir | Sélectionnez un fichier CSV dans un dossier. N’oubliez pas de choisir Tous les fichiers dans la liste déroulante à côté de la zone Nom du fichier.
    3. Cliquez sur Ouvrir pour ouvrir le fichier CSV. Mettez en surbrillance les lignes et les colonnes des données d’urgence en matière de mortalité et cliquez sur Insérer | Graphiques | Graphique linéaire.
  2. L’analyse du polissage médian comme deuxième phase
    1. Soustrayez de manière itérative la médiane de chaque ligne et de chaque colonne pour éliminer l’effet cumulatif de l’âge et de la période. Après la phase de polissage médian, conservez les résidus pour la procédure de régression afin d’évaluer les effets de cohorte.
    2. Calculez le tableau médian et résiduel global. Importez un fichier CSV avec les données de mortalité du tableau de contingence (voir 2.1.1.2).
    3. LN a été utilisé pour chaque cellule des données de mortalité du tableau de contingence. Cliquez sur Formules | Fonction mathématique et trigonométrie et sélectionnez LN.
    4. Numéro : Entrez l’étiquette d’emplacement pour chaque cellule. Assurez-vous que chaque cellule des données de mortalité du tableau de contingence a pris LN. Cliquez sur Formules | Plus de fonctions | Statistiques et sélectionnez MÉDIANE.
    5. Numéro1 : Entrez l’étiquette d’emplacement de la première cellule.
    6. Numéro 2 : Entrez l’étiquette d’emplacement de la dernière cellule. Assurez-vous que la valeur médiane résultante est stockée dans la marge supérieure gauche du tableau de contingence. Assurez-vous qu’une table résiduelle est créée en prenant la différence entre la valeur d’origine (c’est-à-dire les données de mortalité LN) et la médiane globale.
    7. Calculez les médianes des rangées (c.-à-d. les médianes de chaque groupe d’âge) et assurez-vous qu’il a calculé les valeurs médianes des rangées pour le groupe d’âge de réponse. Cliquez sur Formules | Plus de fonctions | Statistiques | Sélectionnez MÉDIANE.
      1. Numéro 1 : Entrez l’étiquette de la première cellule de l’échantillon brut.
      2. Numéro 2 : Entrez l’étiquette de la dernière cellule de la matière première. Assurez-vous que les valeurs médianes de ligne résultantes sont stockées dans la marge de gauche de la table de contingences.
    8. Créez une nouvelle table résiduelle après avoir soustrait des médianes de ligne. Assurez-vous qu’un nouvel ensemble de valeurs résiduelles est créé à partir des médianes de ligne, où chaque cellule prend la valeur de la soustraction de la médiane de ligne de chaque variable de réponse de cette ligne. Cliquez sur = et assurez-vous que l’étiquette d’emplacement global de la cellule de chaque ligne a soustrait l’étiquette de la médiane de la marge de gauche.
    9. Calculez les médianes des colonnes (c’est-à-dire les médianes de chaque groupe de périodes) et assurez-vous qu’il calcule les valeurs médianes des colonnes pour le groupe de périodes de réponse. Cliquez sur Formules | Plus de fonctions | Statistiques | Sélectionnez MÉDIANE.
      1. Numéro 1 : Entrez le premier libellé d’emplacement de cellule de la colonne. Numéro 2 : Entrez le dernier libellé d’emplacement de cellule de la colonne. Assurez-vous que les valeurs médianes de colonne résultantes sont stockées dans la marge supérieure de la table de contingence.
    10. Créez une nouvelle table résiduelle après avoir soustrait des médianes de colonne. Assurez-vous qu’un nouvel ensemble de valeurs résiduelles est créé à partir des médianes de colonne, où chaque cellule prend la valeur de la soustraction de la médiane de colonne de chaque variable de réponse de cette colonne. Cliquez sur = et assurez-vous que l’étiquette d’emplacement de la cellule globale de chaque colonne a soustrait l’étiquette de la médiane de la marge supérieure.
    11. Répétez les étapes 2.1.2.7 à 2.1.2.10 jusqu’à ce que les médianes des lignes et des colonnes soient proches de zéro. Cliquez sur Formules | Plus de fonctions | Statistiques | Sélectionnez MÉDIANE. Assurez-vous que les médianes des lignes et des colonnes sont approximativement nulles. Enregistrez le tableau résiduel final au format CSV.
  3. Procédure de régression avec le poids comme troisième phase
    REMARQUE : Nous avons calculé la variable dépendante sous forme de résidus pour chaque cohorte avec le nombre de décès comme poids. Ensuite, nous avons effectué des régressions linéaires pour calculer les effets de cohorte.
    1. Assurez-vous que Kutools pour Excel a été installé et utilisez son outil Transposer les dimensions du tableau pour convertir rapidement les tableaux croisés en listes plates. Importez un fichier CSV avec les données résiduelles de la table de contingence (voir 2.1.2.11).
    2. Sélectionnez la table à convertir en liste. Cliquez sur le bouton Kutools | Modifier | Transposer la dimension de la table. Dans la boîte de dialogue Transposer les dimensions de la table, assurez-vous que la case en regard de la liste Table croisée à sélectionner est cochée et sélectionnez la plage Résultats pour stocker les valeurs résiduelles au format de liste.
    3. Insérer dans le fichier de données initial une colonne (voir 1.2) avec les données résiduelles du format de liste (voir 2.1.3.1). Assurez-vous qu’il a inséré une colonne de support dans les données du format de liste résiduelle (reportez-vous à 2.1.3.1). Cliquez sur = variables d’âge et de période, puis cliquez sur Entrée. Utilisez une colonne de support pour rechercher les étiquettes de groupe d’âge et de période des données de format de liste résiduelle pour insérer une colonne résiduelle de réponse dans le fichier de données initial (reportez-vous à 1.2).
    4. Cliquez sur Formules | Recherche et référence | Sélectionnez RECHERCHEV. Définissez VLOOKUP (étiquette d’emplacement de cellule d’âge et d’emplacement de cellule de la période, première étiquette d’emplacement de cellule de la colonne de support : l’étiquette de la dernière cellule de la colonne résiduelle, 4, 0). Assurez-vous que la plage sélectionnée comprend les colonnes de support, d’âge, de période et résiduelles (c’est-à-dire la 4ecolonne en tant que liste résiduelle).
    5. Assurez-vous que les résidus sont insérés dans le fichier de données initial (reportez-vous à la section 1.2) et recherchez les données du format de liste résiduelle (reportez-vous à la section 2.1.3.1) pour l’étape suivante. Ajustez le modèle de régression à l’aide des moindres carrés non pondérés et analysez les résidus.
    6. Cliquez sur Analyser | Régression | Linéaire. Transférez la variable indépendante, catégorie de cohorte (c.-à-d. 17 cohortes de naissance), dans la case Indépendant(s) et la variable dépendante, Résidus, dans la case Dépendant :. Cliquez sur OK. Assurez-vous de générer les résultats des effets de cohorte non pondérés.
    7. Assurez-vous que les valeurs résiduelles sont insérées dans le fichier de données Excel initial (reportez-vous à la section 1.2) et recherchez les données du format de liste résiduelle (reportez-vous à la section 2.1.3.1) pour l’étape suivante. Ajustez le modèle de régression par les moindres carrés pondérés et analysez les résidus. Cliquez sur Analyser | Régression | Linéaire.
    8. Transférez la variable indépendante et la catégorie de cohorte (c.-à-d. 17 cohortes de naissance) dans la case « indépendant » et la variable dépendante et les résidus dans la case « dépendant : ». Transférez le numéro de décès dans la case de poids WLS. Cliquez sur OK. Assurez-vous qu’il génère les résultats de la moyenne pondérée de l’effet de cohorte.

Résultats

Les données sur la mortalité ont été présentées pour 10 groupes d’âge de cinq ans (40-44 ans, 45-49, 50-54, 55-59, 60-64, 65-69, 70-74, 75-79, 80-84 et 85+) et 8 périodes de cinq ans (1976-1980, 1981-1985, 1986-1990, 1991-1995, 1996-2000, 2001-2005, 2006-2010 et 2011-2015). Le nombre de groupes de cohortes a été sélectionné en soustrayant un du nombre total de groupes d’âge-périodes : 10 (groupes d’âge de cinq ans) + 8 (périodes de cinq ans) -1 = 17 cohortes de nais...

Discussion

En raison de la tendance temporelle de la mortalité du CHC, les modèles conventionnels sous-estiment certaines caractéristiques importantes cachées dans les données (telles que les effets de cohorte), et les analyses conventionnelles qui utilisent une simple extrapolation linéaire du taux de correction logarithmique de l’âge observé montrent une précision significativement réduite dans leurs prédictions. Il est clair que cette tendance s’est poursuivie pendant 35 ans et qu...

Déclarations de divulgation

Les auteurs n’ont rien à divulguer.

Remerciements

Ce travail a été soutenu par l’hôpital Taipei Tzu Chi TCRD-TPE-109-RT-8 (2/3) et TCRD-TPE-109-39 (2/2).

matériels

NameCompanyCatalog NumberComments
not applicablenot applicablenot applicablenot applicable

Références

  1. Kuntz, E., Kuntz, H. D. . Hepatology: Principles and Practice. , 774 (2006).
  2. McGlynn, K. A., et al. International trends and patterns of primary liver cancer. International Journal of Cancer. 94 (2), 290-296 (2001).
  3. Bosch, F. X., Ribes, J., Diaz, M., Cleries, R. Primary liver cancer: worldwide incidence and trends. Gastroenterology. 127, 5-16 (2004).
  4. Tzeng, I. S., Ng, C. Y., Chen, J. Y., Chen, L. S., Wu, C. C. Using weighted regression model for estimating cohort effect in age-period contingency table data. Oncotarget. 9 (28), 19826-19835 (2018).
  5. Tzeng, I. S., Lee, W. C. Forecasting hepatocellular carcinoma mortality in Taiwan using an age-period-cohort model. Asia-Pacific Journal of PublicHealth. 27, 65-73 (2015).
  6. Tzeng, I. S., et al. Predicting emergency departments visit rates from septicemia in Taiwan using an age-period-cohort model, 1998 to 2012. Medicine. 95, 5598 (2016).
  7. Chen, S. H., et al. Period and Cohort Analysis of Rates of Emergency Department Visits Due to Pneumonia in Taiwan, 1998-2012. Risk Management and Healthcare Policy. 13, 1459-1466 (2020).
  8. Keyes, K. M., Li, G. A multiphase method for estimating cohort effects in age-period contingency table data. Annals of Epidemiology. 20, 779-785 (2010).
  9. Tukey, J. . Exploratory data analysis Reading: MS. , (1977).
  10. Selvin, S. . Statistical analysis of epidemiologic data. , (1996).
  11. Légaré, G., Hamel, D. An age-period-cohort approach to analyzing trends in suicide in Quebec between 1950 and 2009. Canadian Journal of Public Health. 104, 118-123 (2013).
  12. Lavanchy, D. Hepatitis B virus epidemiology, disease burden, treatment, and current and emerging prevention and control measures. Journal of Viral Hepatitis. 11, 97-107 (2004).
  13. Chang, M. H., et al. Universal hepatitis B vaccination in Taiwan and the incidence of hepatocellular carcinoma in children. Taiwan Childhood Hepatoma Study Group. New England Journal of Medicine. 336, 1855-1859 (1997).
  14. Lu, F. T., Ni, Y. H. Elimination of mother-to-infant transmission of hepatitis B virus: 35 years of experience. Pediatric Gastroenterology, Hepatology & Nutrition. 23 (4), 311-318 (2020).
  15. Chien, Y. C., Jan, C. F., Kuo, H. S., Chen, C. J. Nationwide hepatitis B vaccination program in Taiwan: effectiveness in the 20 years after it was launched. Epidemiologic Reviews. 28, 126-135 (2006).
  16. Ahmad, O. B., et al. Age standardization of rates: a new WHO standard. Geneva: GPE Discussion Paper Series. World Health Organization. , 31 (2005).
  17. da Silva, C. P., Emídio, E. S., de Marchi, M. R. Method validation using weighted linear regression models for quantification of UV filters in water samples. Talanta. 131, 221-227 (2015).
  18. Dawes, R. M. The robust beauty of improper linear models in decision making. American Psychologist. 34, 571-582 (1979).
  19. Dawes, R. M., Corrigan, B. Linear models in decision making. Psychological Bulletin. 81, 95-106 (1974).
  20. Einhorn, H. J., Hogarth, R. M. Unit weighting schemes for decision making. Organizational Behavior and Human Performance. 13, 171-192 (1975).
  21. Wang, W., et al. Association of hepatitis B virus DNA level and follow-up interval with hepatocellular carcinoma recurrence. JAMA Network Open. 3 (4), 203707 (2020).
  22. Holford, T. R. The estimation of age, period and cohort effects for vital rates. Biometrics. 39, 311-324 (1983).

Réimpressions et Autorisations

Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE

Demande d’autorisation

Explorer plus d’articles

Carcinome h patocellulaireCHCPr vision de la mortalitMod le de r gression pond r eEffet de cohorteM thode en plusieurs tapesMod le ge p riode cohorteCirrhose du foiepid miologieIntervalle de confianceEstimation de la moyenne pond r eDonn es du cycle de l ge

This article has been published

Video Coming Soon

JoVE Logo

Confidentialité

Conditions d'utilisation

Politiques

Recherche

Enseignement

À PROPOS DE JoVE

Copyright © 2025 MyJoVE Corporation. Tous droits réservés.