JoVE Logo

Войдите в систему

Для просмотра этого контента требуется подписка на Jove Войдите в систему или начните бесплатную пробную версию.

В этой статье

  • Резюме
  • Аннотация
  • Введение
  • протокол
  • Результаты
  • Обсуждение
  • Раскрытие информации
  • Благодарности
  • Материалы
  • Ссылки
  • Перепечатки и разрешения

Резюме

Мы описываем многоступенчатый метод измерения когортного эффекта с помощью данных о возрасте, что позволяет устранять данные во многих ситуациях без ущерба для качества данных. Протокол демонстрирует стратегию и предоставляет взвешенную регрессионную модель для анализа данных о гепатоцеллюлярной карциноме.

Аннотация

Для исключения влияния возраста и периода в данных таблицы сопряженности возрастного цикла был принят многоступенчатый метод оценки когортного эффекта. Наиболее распространенной первичной злокачественной опухолью печени является гепатоцеллюлярная карцинома (ГЦК). ГЦК ассоциирован с циррозом печени с алкогольной и вирусной этиологией. В эпидемиологии долгосрочные тенденции смертности от ГЦК были очерчены (или спрогнозированы) с использованием модели «возраст-период-когорта» (APC). Смертность от ГЦК определялась для каждой когорты с ее взвешенным влиянием. Доверительный интервал (ДИ) взвешенного среднего довольно узок (по сравнению с равновзвешенными оценками). Из-за достаточно узкой ДИ с меньшей неопределенностью в качестве средства прогнозирования использовалась оценка взвешенного среднего. При использовании многоступенчатого метода рекомендуется использовать оценку взвешенного среднего на основе регрессионной модели для оценки когортного эффекта в данных таблицы сопряженности возрастного периода.

Введение

Наиболее распространенной первичной злокачественной опухолью печени является гепатоцеллюлярная карцинома (ГЦК). Его смертность занимает пятое место среди мужчин и восьмое место среди женщин (6% мужчин и 3% женщин) 1 среди всех злокачественных опухолей мира. На Тайване это самый распространенный вид рака у мужчин и второй по распространенности рак у женщин (21,8% мужчин и 14,2% женщин) 2. По оценкам, с 2000 года ежегодное число ГЦК, диагностированных во всем мире, составляет 564 000, из которых 398 000 мужчин и 166 000 женщин . В эпидемиологии наиболее распространенным способом объяснения взаимосвязи между возрастом, периодом и когортными переменными (APC) является то, что возраст и период влияют друг на друга, создавая уникальный опыт поколений для исследуемой тенденции заболевания.

Несмотря на то, что эта концептуализация по-прежнему имеет четкую линейную связь возраст + когорта = период, воздействие (предиктор) не является неотъемлемым фактором когорты рождения. Вместо этого мы предполагаем, что когда изменения вызывают различное распределение заболеваний, возникает когортный эффект. Тем не менее, поскольку возраст + когорта = период, эти три переменные связаны линейно; Только при введении других ограничений невозможно создать модель оценки возраст-период-когорта (APC) с использованием линейных эффектов возраста, периода и когорты. В данном исследовании мы прояснили эту проблему и потенциальные ограничения, которые мы наложили в наших предыдущих публикациях 4,5,6,7.

При малейших предположениях о данных таблицы сопряженности, многоступенчатый метод 8 предусматривает три этапа для оценки когортного эффекта. Кроме того, поскольку медианная полька не зависит от конкретного распределения или фреймворка, она использовалась для различных типов данных, таких как отношения, логарифмические отношения и подсчеты. Срединная полировка является основным методом, используемым в многофазном методе.

Данные из двусторонней таблицы сопряженности 9 были использованы для построения полированной медианы. Процедура полировки медианы используется для устранения кумулятивных эффектов возраста (т.е. строки) и периода (т.е. столбца) путем итеративного вычитания медианы из каждой строки и каждого столбца. Эта процедура часто используется при анализе эпидемиологических данных 10. Одно из преимуществ этого метода заключается в том, что не требуется никаких предположений о распределении или структуре данных в двунаправленной таблице сопряженности. Таким образом, этот метод широко использовался для любого типа данных, содержащихся в таблице, таких как данные о самоубийствах 11. Модель APC также использовалась для описания долгосрочных тенденций заболеваемости или смертности 5. Модели APC часто предполагают, что возраст, период и когорта оказывают аддитивное влияние на логарифмическое преобразование заболеваемости/смертности. Для оценки когортных эффектов описанный протокол генерирует модель APC для полного анализа смертности от гепатоцеллюлярной карциномы (ГЦК) с взвешенной регрессией, тем самым поддерживая надежные прогнозы и умеренную оценку эффектов лечения.

Access restricted. Please log in or start a trial to view this content.

протокол

1. Источники данных

Для демонстрации расчетов мы использовали ежегодные данные о смертности от ГЦК с 1976 по 2015 год среди мужчин и женщин на Тайване. Для выполнения протоколов данного исследования использовались Statistical Package for Social Sciences (SPSS) версии 24.0 для Windows и Microsoft Excel.

  1. Попросите врача ГЦК классифицировать клинические симптомы пациента, лабораторные анализы и результаты медицинской визуализации, чтобы дать код диагноза в соответствии с кодом Международной классификации болезней (МКБ), МКБ 150.
  2. Убедитесь, что файл данных (сохраненный в формате CSV) содержит в столбцах год (т. е. период), возраст, когорту, число умерших, численность населения в середине года и смертность.
    1. Нажмите «Файл» | Импорт данных | Данные CSV | Открыть. Убедитесь, что рядом с пунктом Чтение имен переменных из первой строки данных установлен флажок, и нажмите OK. Убедитесь, что файл данных импортирован в SPSS.
  3. Построение данных таблицы сопряженности, перечеркнутых по возрастным группам с помощью SPSS. В общем случае мы определили переменные строки как возраст, а переменные столбцов — как период. Если данные содержали данные за один период (или один возрастной год), необходимо было интегрировать их в группу периодов (или возрастную группу). Затем мы свели перекрестную таблицу отношения к возрастной группе по годам опроса.
    1. Нажмите «Анализировать» | Описательная статистика | Перекрестные таблицы и выберите переменную age в поле рядом со строками и переменную period в поле рядом со столбцами (столбцами). Нажмите «Ячейки » и убедитесь, что рядом с полем «Наблюдается» стоит флажок. Таблица сопряженности числа смертей (или численности населения на середину года, или смертности) может быть выполнена в SPSS с помощью описанных выше шагов.
    2. Экспортируйте данные таблицы сопряженности, которые были введены в формате CSV, для анализа с помощью другого программного обеспечения. Нажмите «Файл» | Экспорт данных | Обеспечение желаемого формата данных в формате CSV | Расположение. В этом нередактируемом поле отображается безопасное местоположение для экспортируемого файла.
    3. Имя файла: нажмите кнопку Выбрать , чтобы изменить имя файла.
    4. Экспортировать как тип: выберите тип файла CSV в раскрывающемся меню. Щелкните переменные , чтобы отобразить доступные переменные и выбрать таблицы переменных. По умолчанию все переменные из исходного набора данных сохраняются для экспортируемого файла. Исследователи могут использовать таблицы, чтобы указать, какие исходные переменные следует включить в экспортируемый файл. Нажмите «Экспорт».

2. Настройка модели

Примечание: Многоступенчатый метод был предложен Кейсом и Ли 8 с графическим исследованием. Был проведен медианный анализ полировки для исключения кумулятивных эффектов возраста и периода; Наконец, эти остатки от медианной польской фазы в категории когорты в модели линейной регрессии были регрессированы, и были оценены эффекты когорты с использованием данных в таблице сопряженности.

  1. Графическое представление на первом этапе
    1. Создайте линейный график возрастных групп и групп периодов. Чтобы изучить когорты рождения по возрастным группам или когортам рождения, нарисуйте на линейных диаграммах ровные когорты рождения по возрасту или циклу.
    2. Импортируйте CSV-файл с данными о смертности из таблицы непредвиденных обстоятельств. Нажмите «Файл» | Открыть | Перейдите к выбору CSV-файла из папки. Не забудьте выбрать «Все файлы » в раскрывающемся списке рядом с полем «Имя файла».
    3. Нажмите кнопку Открыть , чтобы открыть файл CSV. Выделите строки и столбцы данных о смертности и нажмите Вставить | Чарты | Линейный график.
  2. Медианный анализ полировки как вторая фаза
    1. Итерационно вычитайте медиану из каждой строки и каждого столбца, чтобы исключить кумулятивный эффект возраста и периода. После фазы медианной полировки сохраните остатки для процедуры регрессии для оценки когортных эффектов.
    2. Вычислите общую медианную и остаточную таблицу. Импортируйте CSV-файл с данными о смертности из таблицы непредвиденных обстоятельств (см. раздел 2.1.1.2).
    3. LN использовался для каждой ячейки данных о смертности в таблице сопряжений. Нажмите «Формулы» | Математическая и тригонометрическая функция и выберите LN.
    4. Число: Введите метку местоположения для каждой ячейки. Убедитесь, что в каждой ячейке таблицы сопряженности данные о смертности взяты LN. Нажмите «Формулы» | Дополнительные функции | Статистика и выберите МЕДИАНА.
    5. Number1: Введите метку местоположения первой ячейки.
    6. Number2: Введите метку местоположения последней ячейки. Убедитесь, что полученное медианное значение сохранено в верхнем левом поле таблицы сопряженности. Убедитесь, что таблица остаточных значений создана путем взятия разницы между исходным значением (т.е. данными о смертности LN) и общей медианой.
    7. Вычислите медианы строк (т. е. медианы каждой возрастной группы) и убедитесь, что были вычислены медианные значения строк для возрастной группы ответа. Нажмите «Формулы» | Дополнительные функции | Статистика | Выберите МЕДИАНА.
      1. Номер 1: Введите первую метку местоположения ячейки исходного образца.
      2. Номер 2: Введите метку последнего местоположения ячейки сырья. Убедитесь, что полученные значения медианы строки хранятся в левом поле таблицы сопряженности.
    8. Создайте новую таблицу остатков после вычитания из медиан строк. Убедитесь, что новый набор невязочных значений создается из медиан строк, где каждая ячейка принимает значение вычитания медианы строки из каждой переменной отклика в этой строке. Нажмите = и убедитесь, что общая метка местоположения ячейки каждой строки вычла метку медианы левого поля.
    9. Вычислите медианы столбцов (т. е. медианы каждой группы периодов) и убедитесь, что они вычислили медианные значения столбца для группы периодов реагирования. Нажмите «Формулы» | Дополнительные функции | Статистика | Выберите МЕДИАНА.
      1. Номер 1: Введите метку местоположения первой ячейки столбца. Номер 2: Введите метку местоположения последней ячейки столбца. Убедитесь, что полученные значения медианы столбца хранятся в верхнем поле таблицы сопряженности.
    10. Создайте новую таблицу остатков после вычитания из медиан столбцов. Убедитесь, что новый набор невязочных значений создается из медиан столбца, где каждая ячейка принимает значение вычитания медианы столбца из каждой переменной отклика в этом столбце. Нажмите = и убедитесь, что из метки общего местоположения ячейки в каждом столбце вычтена метка медианы верхнего поля.
    11. Повторяйте шаги с 2.1.2.7 по 2.1.2.10 до тех пор, пока медиана строк и столбцов не приблизится к нулю. Нажмите «Формулы» | Дополнительные функции | Статистика | Выберите МЕДИАНА. Убедитесь, что медианы строк и столбцов близки к нулю. Сохраните итоговую остаточную таблицу в формате CSV.
  3. Процедура регрессии с весом в качестве третьей фазы
    ПРИМЕЧАНИЕ: Мы рассчитали зависимую переменную как остатки для каждой когорты с числом смертей в качестве веса. Затем мы запустили линейную регрессию для расчета когортных эффектов.
    1. Убедитесь, что Kutools для Excel установлен, и используйте его инструмент «Транспонировать размеры таблицы» для быстрого преобразования перекрестных таблиц в плоские списки. Импортируйте CSV-файл с остаточными данными из таблицы сопряженностей (см. пункт 2.1.2.11).
    2. Выберите таблицу, которую нужно преобразовать в список. Нажмите на значок Kutools | Изменить | Транспонировать размер таблицы. В диалоговом окне Транспонирование размеров таблицы убедитесь, что установлен флажок рядом со списком Перекрестная таблица для перечисления, и выберите диапазон Результаты, чтобы сохранить невязки в формате списка.
    3. Вставка столбцов в исходный файл данных (см.. 1.2) с данными в формате списка невязок (см.. 2.1.3.1). Убедитесь, что в формат списка невязок вставлен вспомогательный столбец (см. раздел 2.1.3.1). Нажмите кнопку = переменные age & period и нажмите клавишу Enter. Используйте вспомогательный столбец для поиска меток возрастных и периодических групп данных формата списка остаточных значений, чтобы вставить столбец ответа в исходный файл данных (см. раздел 1.2).
    4. Нажмите «Формулы» | Поиск и справка | Выберите ВПР. Установите функцию ВПР (метка местоположения ячейки возраста и метка местоположения ячейки периода, метка местоположения первой ячейки вспомогательного столбца: последняя метка местоположения ячейки остаточного столбца, 4, 0). Убедитесь, что выбранный диапазон включает поддерживающие столбцы, столбцы возраста, периода и остаточные столбцы (т. е.4-й столбец в качестве списка остаточных значений).
    5. Убедитесь, что остатки вставлены в исходный файл данных (см.. 1.2), найдите данные в формате списка невязок (см.. 2.1.3.1) для следующего шага. Аппроксимируйте регрессионную модель по невзвешенному методу наименьших квадратов и проанализируйте невязки.
    6. Нажмите «Анализировать» | Регрессия | Линейный. Перенесите независимую переменную, категорию когорты (т.е. 17 когорт рождения), в поле Независимые, а зависимую переменную, Остатки, в поле Зависимые: Нажмите OK. Убедитесь, что сгенерированы результаты невзвешенных когортных эффектов.
    7. Убедитесь, что остатки вставлены в исходный файл данных Excel (см.. 1.2), найдите данные в формате списка невязок (см.. 2.1.3.1) для следующего шага. Подгонка регрессионной модели по взвешенному методу наименьших квадратов и анализ остатков. Нажмите «Анализировать» | Регрессия | Линейный.
    8. Перенесите независимую переменную и категорию когорты (т.е. 17 когорт рождения) в поле независимых, а зависимую переменную и остатки — в поле dependent:. Перенесите число смерти в весовую коробку WLS. Нажмите OK. Убедитесь, что он генерирует результаты средневзвешенного эффекта когорты.

Access restricted. Please log in or start a trial to view this content.

Результаты

Данные о смертности были продемонстрированы для 10 пятилетних возрастных групп (40-44, 45-49, 50-54, 55-59, 60-64, 65-69, 70-74, 75-79, 80-84, 85+) и 8 пятилетних периодов (1976-1980, 1981-1985, 1986-1990, 1991-1995, 1996-2000, 2001-2005, 2006-2010 и 2011-2015). Количество когортных групп отбиралось путем вычитания одного из общего числ?...

Access restricted. Please log in or start a trial to view this content.

Обсуждение

Из-за временной тенденции смертности от ГЦК традиционные модели недооценивают некоторые важные особенности, скрытые в данных (такие как когортные эффекты), а традиционные анализы, использующие простую линейную экстраполяцию наблюдаемой логарифмической коррекции в?...

Access restricted. Please log in or start a trial to view this content.

Раскрытие информации

Авторам нечего раскрывать.

Благодарности

Эта работа была поддержана больницей Тайбэй Цзу Чи TCRD-TPE-109-RT-8 (2/3) и TCRD-TPE-109-39 (2/2).

Access restricted. Please log in or start a trial to view this content.

Материалы

NameCompanyCatalog NumberComments
not applicablenot applicablenot applicablenot applicable

Ссылки

  1. Kuntz, E., Kuntz, H. D. Hepatology: Principles and Practice. , Springer. New York. 774(2006).
  2. McGlynn, K. A., et al. International trends and patterns of primary liver cancer. International Journal of Cancer. 94 (2), 290-296 (2001).
  3. Bosch, F. X., Ribes, J., Diaz, M., Cleries, R. Primary liver cancer: worldwide incidence and trends. Gastroenterology. 127, 5-16 (2004).
  4. Tzeng, I. S., Ng, C. Y., Chen, J. Y., Chen, L. S., Wu, C. C. Using weighted regression model for estimating cohort effect in age-period contingency table data. Oncotarget. 9 (28), 19826-19835 (2018).
  5. Tzeng, I. S., Lee, W. C. Forecasting hepatocellular carcinoma mortality in Taiwan using an age-period-cohort model. Asia-Pacific Journal of PublicHealth. 27, 65-73 (2015).
  6. Tzeng, I. S., et al. Predicting emergency departments visit rates from septicemia in Taiwan using an age-period-cohort model, 1998 to 2012. Medicine. 95, 5598(2016).
  7. Chen, S. H., et al. Period and Cohort Analysis of Rates of Emergency Department Visits Due to Pneumonia in Taiwan, 1998-2012. Risk Management and Healthcare Policy. 13, 1459-1466 (2020).
  8. Keyes, K. M., Li, G. A multiphase method for estimating cohort effects in age-period contingency table data. Annals of Epidemiology. 20, 779-785 (2010).
  9. Tukey, J. Exploratory data analysis Reading: MS. , Addison-Wesley Publishing Company. (1977).
  10. Selvin, S. Statistical analysis of epidemiologic data. , University Press. New York: Oxford. (1996).
  11. Légaré, G., Hamel, D. An age-period-cohort approach to analyzing trends in suicide in Quebec between 1950 and 2009. Canadian Journal of Public Health. 104, 118-123 (2013).
  12. Lavanchy, D. Hepatitis B virus epidemiology, disease burden, treatment, and current and emerging prevention and control measures. Journal of Viral Hepatitis. 11, 97-107 (2004).
  13. Chang, M. H., et al. Universal hepatitis B vaccination in Taiwan and the incidence of hepatocellular carcinoma in children. Taiwan Childhood Hepatoma Study Group. New England Journal of Medicine. 336, 1855-1859 (1997).
  14. Lu, F. T., Ni, Y. H. Elimination of mother-to-infant transmission of hepatitis B virus: 35 years of experience. Pediatric Gastroenterology, Hepatology & Nutrition. 23 (4), 311-318 (2020).
  15. Chien, Y. C., Jan, C. F., Kuo, H. S., Chen, C. J. Nationwide hepatitis B vaccination program in Taiwan: effectiveness in the 20 years after it was launched. Epidemiologic Reviews. 28, 126-135 (2006).
  16. Ahmad, O. B., et al. Age standardization of rates: a new WHO standard. Geneva: GPE Discussion Paper Series. World Health Organization. , 31(2005).
  17. da Silva, C. P., Emídio, E. S., de Marchi, M. R. Method validation using weighted linear regression models for quantification of UV filters in water samples. Talanta. 131, 221-227 (2015).
  18. Dawes, R. M. The robust beauty of improper linear models in decision making. American Psychologist. 34, 571-582 (1979).
  19. Dawes, R. M., Corrigan, B. Linear models in decision making. Psychological Bulletin. 81, 95-106 (1974).
  20. Einhorn, H. J., Hogarth, R. M. Unit weighting schemes for decision making. Organizational Behavior and Human Performance. 13, 171-192 (1975).
  21. Wang, W., et al. Association of hepatitis B virus DNA level and follow-up interval with hepatocellular carcinoma recurrence. JAMA Network Open. 3 (4), 203707(2020).
  22. Holford, T. R. The estimation of age, period and cohort effects for vital rates. Biometrics. 39, 311-324 (1983).

Access restricted. Please log in or start a trial to view this content.

Перепечатки и разрешения

Запросить разрешение на использование текста или рисунков этого JoVE статьи

Запросить разрешение

Смотреть дополнительные статьи

This article has been published

Video Coming Soon

JoVE Logo

Исследования

Образование

О JoVE

Авторские права © 2025 MyJoVE Corporation. Все права защищены