JoVE Logo

로그인

JoVE 비디오를 활용하시려면 도서관을 통한 기관 구독이 필요합니다. 전체 비디오를 보시려면 로그인하거나 무료 트라이얼을 시작하세요.

기사 소개

  • 요약
  • 초록
  • 서문
  • 프로토콜
  • 결과
  • 토론
  • 공개
  • 감사의 말
  • 자료
  • 참고문헌
  • 재인쇄 및 허가

요약

연령 데이터로 코호트 효과를 측정하는 다단계 방법을 묘사하여 데이터 품질을 희생하지 않고 많은 상황에서 데이터를 제거할 수 있습니다. 이 프로토콜은 전략을 보여주고 간세포 암종 데이터를 분석하기 위한 가중 회귀 모델을 제공합니다.

초록

연령 주기 분할표 데이터에서 연령과 기간의 영향을 제거하기 위해 다단계 방법을 채택하여 코호트 효과를 평가했습니다. 간에서 가장 흔한 원발성 악성종양은 간세포암종(HCC)이다. 간세포암은 간경변과 알코올 및 바이러스 병인과 관련이 있습니다. 역학에서는 간암 사망률의 장기 추세를 연령-기간-코호트(APC) 모델을 사용하여 기술(또는 예측)했습니다. 간세포암 사망률은 가중 영향도에 따라 각 코호트에 대해 결정되었다. 가중 평균의 신뢰 구간(CI)은 (동일 가중 추정치와 비교하여) 상당히 좁습니다. CI가 상당히 좁고 불확실성이 적기 때문에 가중 평균 추정이 예측 수단으로 사용되었습니다. 다단계 방법을 사용하는 경우, 회귀 모델을 기반으로 한 가중 평균 추정을 사용하여 연령-기간 분할표 데이터의 코호트 효과를 평가하는 것이 좋습니다.

서문

간에서 가장 흔한 원발성 악성 종양은 간세포암종(HCC)입니다. 사망률은 전 세계 모든 악성 종 양 중 남성 에서 5위, 여성에서 8위(남성 6%, 여성 3%)1입니다. 대만에서는 남성에게 가장 흔한 암이며 여성에게 두 번째로 흔한 암이다(남성 21.8%, 여성 14.2 %)2. 2000년 이후 전 세계적으로 연간 진단된 간세포암 환자 수는 564,000명으로 추산되며, 이 중 남성은 398,000명, 여성은 166,000명이다 3. 역학에서 연령, 기간 및 코호트(APC) 변수 간의 관계를 설명하는 가장 일반적인 방법은 연령과 기간이 서로 영향을 미쳐 조사된 질병 추세에 대한 고유한 세대 경험을 생성한다는 것입니다.

이 개념화는 여전히 연령 + 코호트 = 기간의 정확한 선형 연결을 가지고 있지만, 노출(예측 변수)은 출생 코호트의 고유한 요소가 아닙니다. 대신, 우리는 변화가 질병의 다른 분포를 야기할 때 코호트 효과가 있다고 제안합니다. 그럼에도 불구하고 연령 + 코호트 = 기간이므로 이 세 변수는 선형적으로 관련되어 있습니다. 다른 제한이 적용되는 경우에만 연령, 기간 및 코호트의 선형 효과를 사용하여 추정된 APC(Age-Period-Cohort) 모델을 생성할 수 없습니다. 이 연구에서는 이 문제와 이전 출판물 4,5,6,7에서 부과한 잠재적 제한 사항을 명확히 했습니다.

분할표 데이터에 대한 약간의 추측과 함께 다단계 방법 8 은 코호트 효과를 평가하기 위한 세 단계를 제공합니다. 또한 median polish는 특정 분포나 프레임워크에 의존하지 않기 때문에 ratios, logarithmic ratios, counts 등 다양한 유형의 데이터에 사용되었습니다. 중간 연마는 다상 방법에 사용되는 주요 기술입니다.

양방향 분할표 9 의 데이터를 사용하여 연마된 중앙값의 전개를 생성했습니다. median polishing 절차는 각 행과 각 열에서 중앙값을 반복적으로 빼서 age(즉, 행)와 마침표(즉, column)의 누적 효과를 제거하는 데 사용됩니다. 이 절차는 역학 데이터 분석 10에 자주 사용된다. 이 기술의 한 가지 장점은 양방향 분할표에 있는 데이터의 분포 또는 구조에 대한 가정이 필요하지 않다는 것입니다. 따라서 이 기술은 자살 데이터 11과 같이 테이블에 포함된 모든 유형의 데이터에 광범위하게 사용되었습니다. APC 모델은 질병 발병률 또는 사망률의 장기적인 추세를 설명하기 위해서도 사용되어 왔다 5. APC 모델은 종종 연령, 기간 및 코호트가 질병/사망률의 로그 변환에 부가적인 영향을 미친다고 가정합니다. 코호트 효과를 평가하기 위해 설명된 프로토콜은 가중 회귀를 사용하여 완전한 간세포 암종(HCC) 사망률 분석을 위한 APC 모델을 생성함으로써 신뢰할 수 있는 예측과 치료 효과에 대한 중간 정도의 평가를 지원합니다.

프로토콜

1. 데이터 소스

계산을 입증하기 위해 1976년부터 2015년까지 대만 남성과 여성의 간암 사망률에 대한 연간 데이터를 사용했다. 본 연구의 프로토콜을 실행하기 위해 Windows 및 Microsoft Excel용 SPSS(Statistical Package for Social Sciences) 버전 24.0을 사용했습니다.

  1. 간세포암 의사가 환자의 임상 증상, 실험실 검사 및 의료 영상 결과를 분류하여 국제 질병 분류(ICD) 코드, ICD 150에 따라 진단 코드를 제공하도록 합니다.
  2. 데이터 파일(CSV로 저장됨)에 연도(즉, 기간), 연령, 코호트, 사망 수, 중반 인구 수 및 사망률이 열로 포함되어 있는지 확인합니다.
    1. File(파일) | 데이터 가져오기 | CSV 데이터 | 열기. Read variable names from the first row of the data(데이터의 첫 번째 행에서 변수 이름 읽기) 옆의 상자에 확인 표시가 선택되어 있는지 확인하고 OK(확인)를 클릭합니다. 데이터 파일을 SPSS로 가져왔는지 확인하십시오.
  3. SPSS를 통해 연령-기간 그룹별로 교차하는 분할표 데이터를 구성합니다. 일반적으로 행 변수는 age로, 열 변수는 period로 정의했습니다. 데이터가 단일 기간 연도(또는 단일 연령 연도) 데이터를 포함하는 경우 이를 기간 그룹(또는 연령 그룹)으로 통합해야 했습니다. 그런 다음, 설문조사 연도에 걸쳐 특정 연령대에 대한 태도를 교차 분석했습니다.
    1. Analyze(분석) | 기술 통계량 | 크로스탭을 클릭하고 row(s) 옆의 상자에서 연령 변수를 선택하고 column(s) 옆의 상자에서 기간 변수를 선택합니다. Cells(셀)를 클릭하고 Observed(관찰됨) 옆의 상자에 확인 표시가 있는지 확인합니다. 사망자 수(또는 연중 인구 수 또는 사망률)의 분할표는 위의 단계를 통해 SPSS에서 수행할 수 있습니다.
    2. 다른 소프트웨어를 통해 분석하기 위해 CSV 형식으로 입력된 분할표 데이터를 내보냅니다. File(파일) | 데이터 내보내기 | 원하는 데이터 형식을 CSV로 확인 | 위치. 이 편집할 수 없는 필드에는 내보낸 파일의 안전한 위치가 표시됩니다.
    3. 파일 이름: 선택을 클릭하여 파일 이름을 변경합니다.
    4. 형식으로 내보내기: 드롭다운 메뉴에서 CSV 파일 형식을 선택합니다. 변수를 클릭하여 사용 가능한 변수를 표시하고 변수 테이블을 선택합니다. 기본적으로 소스 데이터 세트의 모든 변수는 내보낸 파일에 대해 유지됩니다. 연구자는 테이블을 사용하여 내보낸 파일에 포함할 소스 변수를 지정할 수 있습니다. 내보내기를 클릭합니다.

2. 모델 설정

참고: 다단계 방법은 Keys와 Li 8 이 그래픽 조사를 통해 제안했습니다. 연령과 기간의 누적 효과를 제거하기 위해 중앙값 광택 분석이 수행되었습니다. 마지막으로, 선형 회귀 모델의 코호트 범주에서 중간 광택 단계의 이러한 잔차를 회귀 분석하고 분할표의 데이터를 사용하여 코호트 효과를 평가했습니다.

  1. 첫 번째 단계로서의 그래픽 표현
    1. 연령 그룹과 기간 그룹의 선 플롯을 만듭니다. 연령 그룹 또는 출생 코호트에 걸쳐 출생 코호트를 검사하려면 꺾은선형 차트에 연령 또는 주기에 걸쳐 출생 코호트를 그립니다.
    2. 분할표 사망률 데이터가 포함된 CSV 파일을 가져옵니다. File(파일) | 열기 | 폴더에서 CSV 파일을 찾아 선택합니다. 파일 이름 상자 옆에 있는 드롭다운 목록에서 모든 파일을 선택하는 것을 잊지 마십시오.
    3. 열기를 클릭하여 CSV 파일을 엽니다. 사망률 비상 데이터의 행과 열을 강조 표시하고 Insert(삽입) | 차트 | 선 그래프.
  2. 두 번째 단계로서의 중간 광택 분석
    1. 각 행과 각 열에서 중앙값을 반복적으로 빼서 연령과 기간의 누적 효과를 제거합니다. 중앙값 마무리 단계 후에는 코호트 효과를 평가하기 위해 회귀 분석 절차의 잔차를 유지합니다.
    2. 전체 중앙값 및 잔차 테이블을 계산합니다. 분할표 사망률 데이터가 포함된 CSV 파일을 가져옵니다(2.1.1.2 참조).
    3. LN은 분할표 사망률 데이터의 각 셀에 대해 사용되었습니다. Click Formulas(수식) | 수학 및 삼각법 함수를 선택하고 LN을 선택합니다.
    4. 번호: 각 셀의 위치 레이블을 입력합니다. 분할표 사망률 데이터의 각 셀이 LN을 사용했는지 확인합니다. Click Formulas(수식) | 더 많은 기능 | 통계를 선택하고 MEDIAN을 선택합니다.
    5. 번호1: 첫 번째 셀 위치 레이블을 입력합니다.
    6. 번호2: 마지막 셀 위치 레이블을 입력합니다. 결과 중앙값이 분할표의 왼쪽 위 여백에 저장되어 있는지 확인합니다. 원래 값(즉, LN 사망률 데이터)과 전체 중앙값 간의 차이를 취하여 잔차 테이블이 생성되었는지 확인합니다.
    7. 행 중앙값(즉, 각 연령 그룹의 중앙값)을 계산하고 응답 연령 그룹에 대한 행 중앙값을 계산했는지 확인합니다. Click Formulas(수식) | 더 많은 기능 | 통계 | 중앙값을 선택합니다.
      1. 번호 1: 원시 샘플의 첫 번째 셀 위치 레이블을 입력합니다.
      2. 번호 2: 원료의 마지막 셀 위치 레이블을 입력합니다. 결과 행 중앙값이 분할표의 왼쪽 여백에 저장되어 있는지 확인합니다.
    8. 행 중앙값에서 뺀 후 새 잔차 테이블을 만듭니다. 행 중위수에서 새 잔차 값 집합이 생성되었는지 확인하고, 여기서 각 셀은 해당 행의 각 반응 변수에서 행 중위수의 빼기 값을 사용합니다. =를 클릭하고 각 행의 전체 셀 위치 레이블이 왼쪽 여백 중앙값의 레이블을 뺀 지 확인합니다.
    9. 열 중앙값(즉, 각 기간 그룹의 중앙값)을 계산하고 응답 기간 그룹에 대한 열 중앙값을 계산하는지 확인합니다. Click Formulas(수식) | 더 많은 기능 | 통계 | 중앙값을 선택합니다.
      1. 숫자 1: 열의 첫 번째 셀 위치 레이블을 입력합니다. 번호 2: 열의 마지막 셀 위치 레이블을 입력합니다. 결과 열 중앙값이 분할표의 위쪽 여백에 저장되어 있는지 확인합니다.
    10. 열 중앙값에서 뺀 후 새 잔차 테이블을 만듭니다. 열 중앙값에서 새로운 잔차 값 집합이 생성되었는지 확인하고, 여기서 각 셀은 해당 열의 각 반응 변수에서 열 중앙값의 뺀 값을 사용합니다. =를 클릭하고 각 열의 전체 셀 위치 레이블이 위쪽 여백 중앙값의 레이블을 뺀 지 확인합니다.
    11. 행과 열 중앙값이 0에 근접할 때까지 2.1.2.7에서 2.1.2.10까지의 단계를 반복합니다. Click Formulas(수식) | 더 많은 기능 | 통계 | 중앙값을 선택합니다. 행과 열 중앙값이 거의 0인지 확인합니다. 최종 잔차 테이블을 CSV 형식으로 저장합니다.
  3. 가중치를 세 번째 단계로 사용하는 회귀 프로시저
    참고: 종속 변수를 각 코호트에 대한 잔차로 계산했으며 사망 수를 가중치로 계산했습니다. 다음으로, 코호트 효과를 계산하기 위해 선형 회귀를 실행했습니다.
    1. Excel 용 Kutools가 설치되어 있는지 확인하고 테이블 차원 전치 도구를 사용하여 크로스 테이블을 플랫 목록으로 빠르게 변환하십시오. 분할표 잔여 데이터가 포함된 CSV 파일을 가져옵니다(2.1.2.11 참조).
    2. 목록으로 변환할 테이블을 선택합니다. 클릭 Kutools | 수정 | 테이블 차원을 전치합니다. 테이블 차원 전치 대화 상자에서 크로스 테이블 목록 옆의 상자에 확인 표시가 있는지 확인하고 결과 범위를 선택하여 잔차를 목록 형식으로 저장합니다.
    3. 초기 데이터 파일(1.2 참조)에 잔여 목록 형식 데이터(2.1.3.1 참조)와 함께 열을 삽입합니다. 잔여 목록 형식 데이터에 지원 열을 삽입했는지 확인합니다(2.1.3.1 참조). = age & period variables(연령 및 기간 변수)를 클릭하고 Enter(입력)를 클릭합니다. 지원 열을 사용하여 잔차 목록 형식 데이터의 연령 및 기간 그룹 레이블을 조회하고 초기 데이터 파일에 응답 잔여 열을 삽입합니다(1.2 참조).
    4. Click Formulas(수식) | 조회 및 참조 | VLOOKUP을 선택합니다. VLOOKUP(기간의 셀 위치 레이블 및 기간의 셀 위치 레이블, 지원 열의 첫 번째 셀 위치 레이블: 잔여 열의 마지막 셀 위치 레이블, 4, 0)을 설정합니다. 선택 범위에 지원 열, 연령, 기간 및 잔여 열(즉, 잔여 목록으로 4번째 열)이 포함되어 있는지 확인합니다.
    5. 잔차가 초기 데이터 파일(1.2 참조)에 삽입되었는지 확인하고 다음 단계를 위해 잔차 목록 형식 데이터(2.1.3.1 참조)를 찾습니다. 가중치가 적용되지 않은 최소 제곱으로 회귀 모델을 적합하고 잔차를 분석합니다.
    6. Analyze(분석) | 회귀 분석 | 선형. 독립 변수인 코호트 범주(즉, 17개의 출생 코호트)를 독립 변수(Independent(s), 상자로, 종속 변수인 잔차(Residuals)를 종속(Dependent): 상자로 옮깁니다. 확인을 클릭합니다. 가중치가 적용되지 않은 코호트 효과의 결과를 생성하도록 합니다.
    7. 잔차가 초기 Excel 데이터 파일(1.2 참조)에 삽입되었는지 확인하고 다음 단계에서 잔차 목록 형식 데이터(2.1.3.1 참조)를 찾습니다. 가중 최소 제곱으로 회귀 모형을 적합하고 잔차를 분석합니다. Analyze(분석) | 회귀 분석 | 선형.
    8. 독립 변수 및 코호트 범주(즉, 17개의 출생 코호트)를 독립 상자로 옮기고 종속 변수와 잔차를 종속: 상자로 옮깁니다. 사망 번호를 WLS 웨이트 박스로 옮깁니다. 확인을 클릭합니다. 코호트 효과의 가중 평균의 결과를 생성하는지 확인합니다.

결과

사망률 데이터는 10개의 5년 연령 그룹(40-44세, 45-49세, 50-54세, 55-59세, 60-64세, 65-69세, 70-74세, 75-79세, 80-84세, 85+)과 8개의 5년 기간(1976-1980년, 1981-1985년, 1986-1990년, 1991-1995년, 1996-2000년, 2001-2005년, 2006-2010년, 2011-2015년)에 대해 입증되었습니다. 코호트 그룹의 수는 총 연령 기간 그룹 수에서 1을 빼서 선택되었습니다: 10 (5년 연령 그룹) + 8 (5년 기간) -1 = 17개의 출생 코호트, 출생 ...

토론

간암 사망률의 시간 추세로 인해 기존 모델은 데이터에 숨겨진 몇 가지 중요한 기능(예: 코호트 효과)을 과소평가하며, 관찰된 로그 연령 보정률의 단순 선형 외삽을 사용하는 기존 분석은 예측의 정확도가 크게 감소한 것으로 나타났습니다. 이러한 추세는 35년 동안 지속되어 왔으며 1976년부터 2015년까지 대만의 간암 사망률의 장기 추세를 직접 관찰하면 향후 몇 년 동안 ...

공개

저자는 공개할 내용이 없습니다.

감사의 말

이 연구는 타이페이 쯔쯔 병원 TCRD-TPE-109-RT-8 (2/3) 및 TCRD-TPE-109-39 (2/2)의 지원을 받았습니다.

자료

NameCompanyCatalog NumberComments
not applicablenot applicablenot applicablenot applicable

참고문헌

  1. Kuntz, E., Kuntz, H. D. . Hepatology: Principles and Practice. , 774 (2006).
  2. McGlynn, K. A., et al. International trends and patterns of primary liver cancer. International Journal of Cancer. 94 (2), 290-296 (2001).
  3. Bosch, F. X., Ribes, J., Diaz, M., Cleries, R. Primary liver cancer: worldwide incidence and trends. Gastroenterology. 127, 5-16 (2004).
  4. Tzeng, I. S., Ng, C. Y., Chen, J. Y., Chen, L. S., Wu, C. C. Using weighted regression model for estimating cohort effect in age-period contingency table data. Oncotarget. 9 (28), 19826-19835 (2018).
  5. Tzeng, I. S., Lee, W. C. Forecasting hepatocellular carcinoma mortality in Taiwan using an age-period-cohort model. Asia-Pacific Journal of PublicHealth. 27, 65-73 (2015).
  6. Tzeng, I. S., et al. Predicting emergency departments visit rates from septicemia in Taiwan using an age-period-cohort model, 1998 to 2012. Medicine. 95, 5598 (2016).
  7. Chen, S. H., et al. Period and Cohort Analysis of Rates of Emergency Department Visits Due to Pneumonia in Taiwan, 1998-2012. Risk Management and Healthcare Policy. 13, 1459-1466 (2020).
  8. Keyes, K. M., Li, G. A multiphase method for estimating cohort effects in age-period contingency table data. Annals of Epidemiology. 20, 779-785 (2010).
  9. Tukey, J. . Exploratory data analysis Reading: MS. , (1977).
  10. Selvin, S. . Statistical analysis of epidemiologic data. , (1996).
  11. Légaré, G., Hamel, D. An age-period-cohort approach to analyzing trends in suicide in Quebec between 1950 and 2009. Canadian Journal of Public Health. 104, 118-123 (2013).
  12. Lavanchy, D. Hepatitis B virus epidemiology, disease burden, treatment, and current and emerging prevention and control measures. Journal of Viral Hepatitis. 11, 97-107 (2004).
  13. Chang, M. H., et al. Universal hepatitis B vaccination in Taiwan and the incidence of hepatocellular carcinoma in children. Taiwan Childhood Hepatoma Study Group. New England Journal of Medicine. 336, 1855-1859 (1997).
  14. Lu, F. T., Ni, Y. H. Elimination of mother-to-infant transmission of hepatitis B virus: 35 years of experience. Pediatric Gastroenterology, Hepatology & Nutrition. 23 (4), 311-318 (2020).
  15. Chien, Y. C., Jan, C. F., Kuo, H. S., Chen, C. J. Nationwide hepatitis B vaccination program in Taiwan: effectiveness in the 20 years after it was launched. Epidemiologic Reviews. 28, 126-135 (2006).
  16. Ahmad, O. B., et al. Age standardization of rates: a new WHO standard. Geneva: GPE Discussion Paper Series. World Health Organization. , 31 (2005).
  17. da Silva, C. P., Emídio, E. S., de Marchi, M. R. Method validation using weighted linear regression models for quantification of UV filters in water samples. Talanta. 131, 221-227 (2015).
  18. Dawes, R. M. The robust beauty of improper linear models in decision making. American Psychologist. 34, 571-582 (1979).
  19. Dawes, R. M., Corrigan, B. Linear models in decision making. Psychological Bulletin. 81, 95-106 (1974).
  20. Einhorn, H. J., Hogarth, R. M. Unit weighting schemes for decision making. Organizational Behavior and Human Performance. 13, 171-192 (1975).
  21. Wang, W., et al. Association of hepatitis B virus DNA level and follow-up interval with hepatocellular carcinoma recurrence. JAMA Network Open. 3 (4), 203707 (2020).
  22. Holford, T. R. The estimation of age, period and cohort effects for vital rates. Biometrics. 39, 311-324 (1983).

재인쇄 및 허가

JoVE'article의 텍스트 или 그림을 다시 사용하시려면 허가 살펴보기

허가 살펴보기

더 많은 기사 탐색

HCC

This article has been published

Video Coming Soon

JoVE Logo

개인 정보 보호

이용 약관

정책

연구

교육

JoVE 소개

Copyright © 2025 MyJoVE Corporation. 판권 소유