JoVE Logo

Iniciar sesión

Se requiere una suscripción a JoVE para ver este contenido. Inicie sesión o comience su prueba gratuita.

En este artículo

  • Resumen
  • Resumen
  • Introducción
  • Protocolo
  • Resultados
  • Discusión
  • Divulgaciones
  • Agradecimientos
  • Materiales
  • Referencias
  • Reimpresiones y Permisos

Resumen

Describimos un método multietápico para medir un efecto de cohorte con datos de edad, lo que permite eliminar los datos en muchas situaciones sin sacrificar la calidad de los datos. El protocolo demuestra la estrategia y proporciona un modelo de regresión ponderada para analizar los datos del carcinoma hepatocelular.

Resumen

Para eliminar la influencia de la edad y el período en los datos de la tabla de contingencia del ciclo de edad, se adoptó un método polietápico para evaluar el efecto de cohorte. El tumor maligno primario más general del hígado es el carcinoma hepatocelular (CHC). El CHC se asocia con cirrosis hepática con alcohol y etiologías virales. En epidemiología, se delinearon (o pronosticaron) las tendencias a largo plazo de la mortalidad por CHC mediante un modelo de cohorte por edad (APC). Las muertes por CHC se determinaron para cada cohorte con su influencia ponderada. El intervalo de confianza (IC) de la media ponderada es bastante estrecho (en comparación con las estimaciones igualmente ponderadas). Debido al IC bastante estrecho y con menor incertidumbre, se utilizó la estimación de la media ponderada como medio para la predicción. Con el método polietápico, se recomienda utilizar una estimación de la media ponderada basada en un modelo de regresión para evaluar el efecto de la cohorte en los datos de la tabla de contingencia por edad-período.

Introducción

El tumor maligno primario más común del hígado es el carcinoma hepatocelular (CHC). Su tasa de mortalidad ocupa el quinto lugar en los hombres y el octavo en las mujeres (6% de los hombres y 3% de las mujeres) 1 entre todos los tumores malignos del mundo. En Taiwán, es el cáncer más común en los hombres y el segundo cáncer más común en las mujeres (21,8% de los hombres y 14,2% de las mujeres) 2. Se estima que desde el año 2000, el número anual de CHC diagnosticados en todo el mundo es de 564.000, de los cuales 398.000 son hombres y 166.000 son mujeres 3. En epidemiología, la forma más común de explicar la relación entre las variables edad, período y cohorte (APC) es que la edad y el período se influyen mutuamente para crear una experiencia generacional única para la tendencia de la enfermedad investigada.

A pesar de que esta conceptualización todavía tiene una conexión lineal precisa de edad + cohorte = período, la exposición (predictor) no es un factor inherente en una cohorte de nacimiento. En cambio, proponemos que cuando los cambios causan diferentes distribuciones de la enfermedad, hay un efecto de cohorte. Sin embargo, dado que edad + cohorte = período, estas tres variables están relacionadas linealmente; solo si se aplican otras restricciones es imposible generar un modelo de cohorte de edad-período (APC) estimado utilizando los efectos lineales de la edad, el período y la cohorte. En este estudio, esclarecimos esta problemática y las posibles restricciones que impusimos en nuestras publicaciones anteriores 4,5,6,7.

Con las más mínimas conjeturas sobre los datos de la tabla de contingencia, el método multietápico 8 proporciona tres etapas para evaluar el efecto de cohorte. Además, dado que el pulido de la mediana no depende de una distribución o marco específico, se utilizó para varios tipos de datos, como proporciones, razones logarítmicas y recuentos. El pulido mediano es la técnica principal utilizada en el método multifásico.

Se utilizaron los datos de una tabla de contingencia bidireccional 9 para generar el desarrollo de la mediana pulida. El procedimiento de pulido de la mediana se utiliza para eliminar los efectos acumulativos de la edad (es decir, la fila) y el período (es decir, la columna) restando iterativamente la mediana de cada fila y cada columna. Este procedimiento es frecuentemente utilizado en el análisis de datos epidemiológicos 10. Una ventaja de esta técnica es que no se requieren suposiciones sobre la distribución o estructura de los datos en la tabla de contingencia bidireccional. Por lo tanto, esta técnica fue ampliamente utilizada para cualquier tipo de datos contenidos en la tabla, como los datos de suicidio 11. El modelo APC también se ha utilizado para describir las tendencias a largo plazo de la incidencia de enfermedades o la mortalidad 5. Los modelos APC a menudo asumen que la edad, el período y la cohorte tienen efectos aditivos en la transformación logarítmica de la enfermedad y la mortalidad. Para evaluar los efectos de cohorte, el protocolo descrito genera un modelo APC para el análisis de la mortalidad por carcinoma hepatocelular (CHC) completo con regresión ponderada, lo que respalda predicciones confiables y una evaluación moderada de los efectos del tratamiento.

Protocolo

1. Fuentes de datos

Para demostrar los cálculos, utilizamos datos anuales sobre la mortalidad por CHC de 1976 a 2015 para hombres y mujeres en Taiwán. Para la ejecución de los protocolos de este estudio se utilizaron los programas SPSS versión 24.0 para Windows y Microsoft Excel.

  1. Hacer que el médico del CHC clasifique los síntomas clínicos, las pruebas de laboratorio y los resultados de las imágenes médicas de los pacientes para dar un código de diagnóstico de acuerdo con el Código de la Clasificación Internacional de Enfermedades (CIE), CIE 150.
  2. Asegúrese de que el archivo de datos (guardado como CSV) contenga el año (es decir, el período), la edad, la cohorte, el número de defunciones, el número de población de mitad de año y la mortalidad como columnas.
    1. Haga clic en Archivo | Importar datos | Datos CSV | Abierto. Asegúrese de que haya una marca de verificación en la casilla junto a Leer nombres de variables de la primera fila de los datos y haga clic en Aceptar. Asegúrese de que el fichero de datos se ha importado en SPSS.
  3. Construir datos de tablas de contingencia cruzados por grupos de edad a través de SPSS. En general, definimos las variables de fila como edad y las variables de columna como período. Si los datos presentaban datos de un solo período de año (o de un solo año de edad), era necesario integrarlos en un grupo de período (o grupo de edad). A continuación, hicimos una tabulación cruzada de las actitudes hacia un grupo de edad a lo largo de los años de la encuesta.
    1. Haga clic en Analizar | Estadística Descriptiva | Tablas de referencias cruzadas y seleccione la variable de edad en el cuadro junto a las filas y la variable de período en el cuadro junto a las columnas. Haga clic en Celdas y asegúrese de que haya una marca de verificación en la casilla junto a Observado. Una tabla de contingencia del número de defunciones (o número de población a mitad de año, o mortalidad) se puede realizar en SPSS mediante los pasos anteriores.
    2. Exporte los datos de la tabla de contingencia que se ingresaron en formato CSV para su análisis a través de otro software. Haga clic en Archivo | Exportar datos | Asegúrese de que el formato de datos deseado sea CSV | Ubicación. Este campo no editable muestra la ubicación segura del archivo exportado.
    3. Nombre de archivo: haga clic en Seleccionar para cambiar el nombre del archivo.
    4. Exportar como tipo: selecciona un tipo de archivo CSV en el menú desplegable. Haga clic en Variables para mostrar las variables disponibles y seleccionar las tablas de variables. De forma predeterminada, todas las variables del conjunto de datos de origen se conservan para el archivo exportado. Los investigadores pueden utilizar las tablas para especificar qué variables de origen incluir en el archivo exportado. Haga clic en Exportar.

2. Configuración del modelo

NOTA: El método multietápico fue propuesto por Keys y Li 8 con investigación gráfica. Se realizó un análisis de la mediana de pulido para eliminar los efectos acumulativos de la edad y el período; Finalmente, se regresión de estos residuos de la fase de pulido mediano en la categoría de cohorte en el modelo de regresión lineal y se evaluaron los efectos de cohorte utilizando los datos de la tabla de contingencia.

  1. La representación gráfica como primera fase
    1. Cree un diagrama de líneas de grupos de edad y grupos de período. Para inspeccionar cohortes de nacimiento en todos los grupos de edad o cohortes de nacimiento, dibuje incluso cohortes de nacimiento en todas las edades o ciclos en los gráficos de líneas.
    2. Importe un archivo CSV con los datos de mortalidad de la tabla de contingencia. Haga clic en Archivo | Abierto | Busque para seleccionar un archivo CSV de una carpeta. Recuerde elegir Todos los archivos en la lista desplegable junto al cuadro Nombre de archivo.
    3. Haga clic en Abrir para abrir el archivo CSV. Resalte las filas y columnas de los datos de contingencia de mortalidad y haga clic en Insertar | Gráficos | Gráfico de líneas.
  2. Análisis de la mediana del pulido como segunda fase
    1. Reste iterativamente la mediana de cada fila y cada columna para eliminar el efecto acumulativo de la edad y el período. Después de la fase de pulido de la mediana, guarde los residuos para el procedimiento de regresión con el fin de evaluar los efectos de la cohorte.
    2. Calcule la mediana general y la tabla residual. Importe un archivo CSV con los datos de mortalidad de la tabla de contingencia (consulte 2.1.1.2).
    3. Para cada celda de la tabla de contingencia se utilizó la LN de datos de mortalidad. Haga clic en Fórmulas | Función Matemática y Trigonometría y seleccione LN.
    4. Número: Introduzca la etiqueta de ubicación de cada celda. Asegúrese de que cada celda de los datos de mortalidad de la tabla de contingencia tomó LN. Haga clic en Fórmulas | Más funciones | Estadísticas y seleccione MEDIANA.
    5. Número 1: Introduzca la primera etiqueta de ubicación de celda.
    6. Número 2: Introduzca la etiqueta de ubicación de la última celda. Asegúrese de que el valor mediano resultante se almacene en el margen superior izquierdo de la tabla de contingencia. Asegúrese de crear una tabla de residuos tomando la diferencia entre el valor original (es decir, los datos de mortalidad por LN) y la mediana general.
    7. Calcule las medianas de las filas (es decir, las medianas de cada grupo de edad) y asegúrese de que calculó los valores de la mediana de las filas para el grupo de edad de la respuesta. Haga clic en Fórmulas | Más funciones | Estadísticas | Seleccione MEDIANA.
      1. Número 1: Introduzca la primera etiqueta de ubicación de celda de la muestra sin procesar.
      2. Número 2: Introduzca la última etiqueta de ubicación de celda del material en bruto. Asegúrese de que los valores medianos de fila resultantes se almacenen en el margen izquierdo de la tabla de contingencia.
    8. Cree una nueva tabla residual después de restar de las medianas de fila. Asegúrese de que se crea un nuevo conjunto de valores residuales a partir de las medianas de fila en el que cada celda toma el valor de la resta de la mediana de fila de cada variable de respuesta de esa fila. Haga clic en = y asegúrese de que la etiqueta de ubicación de celda general de cada fila haya restado la etiqueta de la mediana del margen izquierdo.
    9. Calcule las medianas de las columnas (es decir, las medianas de cada grupo de períodos) y asegúrese de que calcula los valores de las medianas de las columnas para el grupo de períodos de respuesta. Haga clic en Fórmulas | Más funciones | Estadísticas | Seleccione MEDIANA.
      1. Número 1: Introduzca la primera etiqueta de ubicación de celda de la columna. Número 2: Introduzca la última etiqueta de ubicación de celda de la columna. Asegúrese de que los valores medianos de columna resultantes se almacenen en el margen superior de la tabla de contingencia.
    10. Cree una nueva tabla de residuos después de restar de las medianas de las columnas. Asegúrese de que se crea un nuevo conjunto de valores residuales a partir de las medianas de las columnas, donde cada celda toma el valor de la resta de la mediana de la columna de cada variable de respuesta de esa columna. Haga clic en = y asegúrese de que la etiqueta de ubicación general de la celda de cada columna haya restado la etiqueta de la mediana del margen superior.
    11. Repita los pasos 2.1.2.7 a 2.1.2.10 hasta que las medianas de fila y columna se aproximen a cero. Haga clic en Fórmulas | Más funciones | Estadísticas | Seleccione MEDIANA. Asegúrese de que las medianas de fila y columna sean aproximadamente cero. Guarde la tabla final de residuos en formato CSV.
  3. Procedimiento de regresión con el peso como tercera fase
    NOTA: Calculamos la variable dependiente como residuales para cada cohorte con el número de muertes como peso. A continuación, se realizaron regresiones lineales para calcular los efectos de cohorte.
    1. Asegúrese de que Kutools para Excel se instaló y use su herramienta Transponer dimensiones de tabla para convertir rápidamente tablas cruzadas en listas planas. Importe un archivo CSV con datos residuales de la tabla de contingencia (consulte 2.1.2.11).
    2. Seleccione la tabla que desea convertir en una lista. Haga clic en el botón Kutools | Modificar | Dimensión de la tabla de transposición. En el cuadro de diálogo Transponer dimensiones de tabla, asegúrese de que haya una marca de verificación en la casilla situada junto a la tabla cruzada a la lista y seleccione el rango de resultados para almacenar los valores residuales en formato de lista.
    3. Inserto de columna en el archivo de datos inicial (consulte 1.2) con los datos de formato de lista residual (consulte 2.1.3.1). Asegúrese de que ha insertado una columna de apoyo en los datos de formato de lista residual (consulte 2.1.3.1). Haga clic en = variables de edad y período y haga clic en Intro. Utilice una columna de apoyo para buscar las etiquetas de grupo de edad y período de los datos de formato de lista residual para insertar una columna residual de respuesta en el archivo de datos inicial (consulte 1.2).
    4. Haga clic en Fórmulas | Búsqueda y referencia | Seleccione BUSCARV. Establezca BUSCARV (etiqueta de ubicación de celda de edad y etiqueta de ubicación de celda del período, primera etiqueta de ubicación de celda de la columna de soporte: la última etiqueta de ubicación de celda de la columna residual, 4, 0). Asegúrese de que el rango de selección incluya columnas de soporte, edad, período y residuales (es decir, la columna como la lista de residuales).
    5. Asegúrese de que los residuos estén insertados en el archivo de datos inicial (consulte 1.2), busque los datos del formato de lista residual (consulte 2.1.3.1) para el siguiente paso. Ajuste el modelo de regresión por mínimos cuadrados no ponderados y analice los residuos.
    6. Haga clic en Analizar | Regresión | Lineal. Transfiera la variable independiente, categoría de cohorte (es decir, 17 cohortes de nacimiento), al cuadro Independiente(s), y la variable dependiente, Residuales, al cuadro Dependiente:. Haga clic en Aceptar. Asegúrese de generar los resultados de los efectos de cohorte no ponderados.
    7. Asegúrese de que los residuos estén insertados en el archivo de datos inicial de Excel (consulte 1.2), busque los datos de formato de lista residual (consulte 2.1.3.1) para el siguiente paso. Ajuste el modelo de regresión por mínimos cuadrados ponderados y analice los residuos. Haga clic en Analizar | Regresión | Lineal.
    8. Transfiera la variable independiente y la categoría de cohorte (es decir, 17 cohortes de nacimiento) a la casilla independiente(s) y la variable dependiente y los residuales a la casilla dependiente:. Transfiera el número de defunción a la caja de peso WLS. Haga clic en Aceptar. Asegúrese de que genera los resultados de la media ponderada del efecto de cohorte.

Resultados

Los datos de mortalidad se demostraron para 10 grupos de edad de cinco años (40-44, 45-49, 50-54, 55-59, 60-64, 65-69, 70-74, 75-79, 80-84 y 85+) y 8 períodos de cinco años (1976-1980, 1981-1985, 1986-1990, 1991-1995, 1996-2000, 2001-2005, 2006-2010 y 2011-2015). El número de grupos de cohorte se seleccionó restando uno del número total de grupos de edad: 10 (grupos de edad de cinco años) + 8 (períodos de tiempo de cinco años) -1 = 17 cohortes de nacimiento, con los grupos de co...

Discusión

Debido a la tendencia temporal de la mortalidad por CHC, los modelos convencionales subestiman algunas características importantes ocultas en los datos (como los efectos de cohorte), y los análisis convencionales que utilizan la extrapolación lineal simple de la tasa de corrección de la edad logarítmica observada muestran una precisión significativamente menor en sus predicciones. Está claro que esta tendencia ha continuado durante 35 años y tenderá al alza en los próximos año...

Divulgaciones

Los autores no tienen nada que revelar.

Agradecimientos

Este trabajo fue apoyado por el Hospital Tzu Chi de Taipei TCRD-TPE-109-RT-8 (2/3) y TCRD-TPE-109-39 (2/2).

Materiales

NameCompanyCatalog NumberComments
not applicablenot applicablenot applicablenot applicable

Referencias

  1. Kuntz, E., Kuntz, H. D. . Hepatology: Principles and Practice. , 774 (2006).
  2. McGlynn, K. A., et al. International trends and patterns of primary liver cancer. International Journal of Cancer. 94 (2), 290-296 (2001).
  3. Bosch, F. X., Ribes, J., Diaz, M., Cleries, R. Primary liver cancer: worldwide incidence and trends. Gastroenterology. 127, 5-16 (2004).
  4. Tzeng, I. S., Ng, C. Y., Chen, J. Y., Chen, L. S., Wu, C. C. Using weighted regression model for estimating cohort effect in age-period contingency table data. Oncotarget. 9 (28), 19826-19835 (2018).
  5. Tzeng, I. S., Lee, W. C. Forecasting hepatocellular carcinoma mortality in Taiwan using an age-period-cohort model. Asia-Pacific Journal of PublicHealth. 27, 65-73 (2015).
  6. Tzeng, I. S., et al. Predicting emergency departments visit rates from septicemia in Taiwan using an age-period-cohort model, 1998 to 2012. Medicine. 95, 5598 (2016).
  7. Chen, S. H., et al. Period and Cohort Analysis of Rates of Emergency Department Visits Due to Pneumonia in Taiwan, 1998-2012. Risk Management and Healthcare Policy. 13, 1459-1466 (2020).
  8. Keyes, K. M., Li, G. A multiphase method for estimating cohort effects in age-period contingency table data. Annals of Epidemiology. 20, 779-785 (2010).
  9. Tukey, J. . Exploratory data analysis Reading: MS. , (1977).
  10. Selvin, S. . Statistical analysis of epidemiologic data. , (1996).
  11. Légaré, G., Hamel, D. An age-period-cohort approach to analyzing trends in suicide in Quebec between 1950 and 2009. Canadian Journal of Public Health. 104, 118-123 (2013).
  12. Lavanchy, D. Hepatitis B virus epidemiology, disease burden, treatment, and current and emerging prevention and control measures. Journal of Viral Hepatitis. 11, 97-107 (2004).
  13. Chang, M. H., et al. Universal hepatitis B vaccination in Taiwan and the incidence of hepatocellular carcinoma in children. Taiwan Childhood Hepatoma Study Group. New England Journal of Medicine. 336, 1855-1859 (1997).
  14. Lu, F. T., Ni, Y. H. Elimination of mother-to-infant transmission of hepatitis B virus: 35 years of experience. Pediatric Gastroenterology, Hepatology & Nutrition. 23 (4), 311-318 (2020).
  15. Chien, Y. C., Jan, C. F., Kuo, H. S., Chen, C. J. Nationwide hepatitis B vaccination program in Taiwan: effectiveness in the 20 years after it was launched. Epidemiologic Reviews. 28, 126-135 (2006).
  16. Ahmad, O. B., et al. Age standardization of rates: a new WHO standard. Geneva: GPE Discussion Paper Series. World Health Organization. , 31 (2005).
  17. da Silva, C. P., Emídio, E. S., de Marchi, M. R. Method validation using weighted linear regression models for quantification of UV filters in water samples. Talanta. 131, 221-227 (2015).
  18. Dawes, R. M. The robust beauty of improper linear models in decision making. American Psychologist. 34, 571-582 (1979).
  19. Dawes, R. M., Corrigan, B. Linear models in decision making. Psychological Bulletin. 81, 95-106 (1974).
  20. Einhorn, H. J., Hogarth, R. M. Unit weighting schemes for decision making. Organizational Behavior and Human Performance. 13, 171-192 (1975).
  21. Wang, W., et al. Association of hepatitis B virus DNA level and follow-up interval with hepatocellular carcinoma recurrence. JAMA Network Open. 3 (4), 203707 (2020).
  22. Holford, T. R. The estimation of age, period and cohort effects for vital rates. Biometrics. 39, 311-324 (1983).

Reimpresiones y Permisos

Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos

Solicitar permiso

Explorar más artículos

Carcinoma hepatocelularCHCPron stico de mortalidadModelo de regresi n ponderadaEfecto de cohorteM todo multiet picoModelo de cohorte por per odo de edadCirrosis hep ticaEpidemiolog aIntervalo de confianzaEstimaci n media ponderadaDatos del ciclo de edad

This article has been published

Video Coming Soon

JoVE Logo

Privacidad

Condiciones de uso

Políticas

Investigación

Educación

ACERCA DE JoVE

Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados