JoVE Logo

サインイン

このコンテンツを視聴するには、JoVE 購読が必要です。 サインイン又は無料トライアルを申し込む。

この記事について

  • 要約
  • 要約
  • 概要
  • プロトコル
  • 結果
  • ディスカッション
  • 開示事項
  • 謝辞
  • 資料
  • 参考文献
  • 転載および許可

要約

年齢データを使用してコホート効果を測定する多段階の方法を示し、データの品質を犠牲にすることなく、多くの状況でデータを排除することができます。このプロトコルは、戦略を実証し、肝細胞がんデータを分析するための加重回帰モデルを提供します。

要約

年齢サイクルの分割表データにおける年齢と期間の影響を排除するために、コホート効果を評価するために多段階の方法が採用されました。肝臓の最も一般的な原発性悪性腫瘍は肝細胞癌(HCC)です。HCCは、アルコールおよびウイルスの病因を伴う肝硬変に関連しています。疫学では、HCC死亡率の長期的傾向が、年齢-期間-コホート(APC)モデルを用いて描写(または予測)された。HCCによる死亡は、各コホートについて、その重み付けされた影響とともに決定された。加重平均の信頼区間(CI)は、(均等に加重された推定値と比較して)かなり狭くなっています。CIがかなり狭く、不確実性が少ないため、予測の手段として加重平均推定が使用されました。マルチステージ法では、回帰モデルに基づく加重平均推定を使用して、年齢-期間分割表データのコホート効果を評価することをお勧めします。

概要

肝臓の最も一般的な原発性悪性腫瘍は肝細胞がん(HCC)です。その死亡率は、世界中の悪性腫瘍の中で男性で5位、女性で8位(男性の6%、女性の3%) 1 にランクされています。台湾では、男性に多いがんであり、女性に2番目に多いがんです(男性の21.8%、女性の14.2%) 2。2000年以降、世界中で診断されたHCCの年間数は564,000人と推定されており、そのうち398,000人が男性、166,000人が女性です 3。疫学では、年齢、期間、およびコホート(APC)変数間の関係を説明する最も一般的な方法は、年齢と期間が互いに影響し合い、調査対象の疾患傾向に固有の世代体験を生み出すというものです。

この概念化には、年齢+コホート=期間の正確な線形関係がまだありますが、曝露(予測子)は出生コホートに固有の要因ではありません。代わりに、変化が疾患の分布を変える場合、コホート効果があることを提案する。それにもかかわらず、年齢 + コホート = 期間であるため、これら 3 つの変数は線形に関連しています。他の制限が施行されている場合にのみ、年齢、期間、およびコホートの線形効果を使用して推定年齢-期間-コホート(APC)モデルを生成することは不可能です。この研究では、この問題と、以前の出版物4,5,6,7で課した潜在的な制限を明らかにしました。

分割表のデータについてわずかな推測をすると、多段階法 8 はコホート効果を評価するための3つの段階を提供します。また、中央値のポリッシュは特定の分布やフレームワークに依存しないため、比率、対数比、カウントなど、さまざまな種類のデータに使用されました。中央値の研磨は、多相法で使用される主要な技術です。

二元配置分割表 9 からのデータを使用して、磨かれた中央値の発達を生成しました。中央値の研磨手順は、各行と各列から中央値を繰り返し減算することにより、年齢(つまり、行)と期間(つまり、列)の累積的な影響を排除するために使用されます。この手順は、疫学データ分析 10でよく使用されます。この手法の利点の 1 つは、双方向分割表のデータの分布や構造に関する仮定が不要であることです。したがって、この手法は、自殺データ 11など、テーブルに含まれる任意のタイプのデータに対して広く利用された。APCモデルは、疾患の発生率または死亡率の長期的な傾向を説明するためにも使用されてきました 5。APCモデルは、多くの場合、年齢、期間、およびコホートが疾患/死亡率の対数変換に相加的な影響を与えると仮定します。コホート効果を評価するために、記載されているプロトコルは、重み付け回帰による完全な肝細胞がん (HCC) 死亡率分析のための APC モデルを生成し、それにより、治療効果の信頼性の高い予測と中程度の評価をサポートします。

プロトコル

1. データソース

計算を実証するために、台湾の男性と女性の1976年から2015年までのHCC死亡率に関する年間データを使用しました。この研究のプロトコルを実行するために、WindowsおよびMicrosoft Excel用のStatistical Package for Social Sciences(SPSS)バージョン24.0が使用されました。

  1. HCC の医師に患者の臨床症状、臨床検査、および医用画像結果を分類してもらい、国際疾病分類 (ICD) コード、ICD 150 に従って診断コードを提供します。
  2. データファイル(CSVとして保存)に、年(期間)、年齢、コホート、死亡数、年半ばの人口数、および死亡率が列として含まれていることを確認してください。
    1. [ファイル] |データのインポート |CSVデータ |開いています。[データの最初の行から変数名を読み取る] の横にあるボックスにチェックが入っていることを確認し、[OK] をクリックします。データ・ファイルが SPSS にインポートされていることを確認します。
  3. SPSSを介して年齢-期間グループが交差する分割表データを作成します。一般に、行変数を年齢として定義し、列変数を期間として定義しました。データに単一期間の年(または単一の年齢の年)のデータが含まれている場合、それらを期間グループ(または年齢グループ)に統合する必要がありました。次に、調査年全体の年齢層に対する態度をクロス集計しました。
    1. [分析] |記述統計学 |クロス集計を行い、[行] の横のボックスで age 変数を選択し、[列] の横のボックスで [期間] 変数を選択します。[セル] をクリックし、[観察] の横のボックスにチェックが付いていることを確認します。死亡者数(または年央の人口数、または死亡率)の分割表は、上記の手順でSPSSで実行できます。
    2. CSV形式で入力された分割表のデータをエクスポートし、他のソフトウェアで分析することができます。 [ファイル] |データのエクスポート |必要なデータ形式をCSVとして確認する |場所。この編集不可のフィールドには、エクスポートされたファイルの安全な場所が表示されます。
    3. ファイル名: [選択 ] をクリックしてファイル名を変更します。
    4. エクスポートの種類: ドロップダウンメニューからCSVファイルの種類を選択します。 「変数 」をクリックして、使用可能な変数を表示し、変数テーブルを選択します。デフォルトでは、ソース・データ・セットのすべての変数は、エクスポートされたファイルに対して保持されます。研究者は、テーブルを使用して、エクスポートされたファイルに含めるソース変数を指定できます。 「エクスポート」をクリックします。

2. モデル設定

注:多段法は、KeysとLi 8 によってグラフィカルな調査とともに提案されました。年齢と期間の累積的な影響を排除するために、中央値のポリッシュ分析が行われました。最後に、線形回帰モデルのコホートカテゴリのポリッシュフェーズの中央値からのこれらの残差を回帰させ、分割表のデータを使用してコホート効果を評価しました。

  1. 最初のフェーズとしてのグラフィカル表現
    1. 年齢グループと期間グループの折れ線グラフを作成します。年齢グループまたは出生コホート全体で出生コホートを調べるには、折れ線グラフで年齢またはサイクル間で出生コホートを描画します。
    2. 分割表の死亡率データを含む CSV ファイルをインポートします。 [ファイル] |オープン | フォルダから CSV ファイルを参照して選択します。[ファイル名]ボックスの横にあるドロップダウンリストで [すべてのファイル ]を選択することを忘れないでください。
    3. [開く] をクリックして CSV ファイルを開きます。死亡率のコンティンジェンシーデータの行と列を強調表示し、[挿入] |チャート |折れ線グラフ
  2. 第2フェーズとしてのポリッシュの中央値分析
    1. 各行と各列から中央値を繰り返し減算して、年齢と期間の累積効果を排除します。中央値の研磨フェーズの後、回帰手順の残差を保持して、コホート効果を評価します。
    2. 全体の中央値と残差テーブルを計算します。分割表の死亡率データを含むCSVファイルをインポートします(2.1.1.2を参照)。
    3. LNは、分割表の死亡率データの各セルに使用されました。[数式] |Mathematical & Trigonometry Function を選択し、LN.
    4. 番号: 各セルの場所ラベルを入力します。分割表の死亡率データの各セルがLNを取得したことを確認します。[ 数式] |その他の機能 |[統計 ] を選択し、[ MEDIAN] を選択します。
    5. 番号1:最初のセル位置ラベルを入力します。
    6. 番号2:最後のセル位置ラベルを入力します。結果の中央値が分割表の左上の余白に格納されていることを確認します。元の値(つまり、LN死亡率データ)と全体の中央値の差を取ることによって、残差テーブルが作成されることを確認します。
    7. 行の中央値(つまり、各年齢グループの中央値)を計算し、応答年齢グループの行の中央値が計算されたことを確認します。[ 数式] |その他の機能 |統計学 |[MEDIAN] を選択します
      1. 番号1:生サンプルの最初のセル位置ラベルを入力します。
      2. 番号2:原材料の最後のセル位置ラベルを入力します。結果の行の中央値が分割表の左マージンに格納されていることを確認します。
    8. 行の中央値から減算した後、新しい残差テーブルを作成します。新しい残差値のセットが行の中央値から作成され、各セルがその行の各応答変数から行の中央値を減算する値を取ることを確認します。[=] をクリックし、各行の全体的なセル位置ラベルが左マージンの中央値のラベルを減算していることを確認します。
    9. 列の中央値(つまり、各期間グループの中央値)を計算し、応答期間グループの列の中央値が計算されるようにします。[ 数式] |その他の機能 |統計学 |[MEDIAN] を選択します
      1. 番号 1: 列の最初のセル位置ラベルを入力します。番号 2: 列の最後のセル位置ラベルを入力します。結果の列の中央値が分割表の上マージンに格納されていることを確認します。
    10. 列の中央値から減算した後、新しい残差テーブルを作成します。新しい残差値のセットが列の中央値から作成され、各セルがその列の各応答変数から列の中央値の減算の値を取ることを確認します。[=] をクリックし、各列全体のセル位置ラベルが上余白の中央値のラベルを減算していることを確認します。
    11. 行と列の中央値がゼロに近づくまで、手順2.1.2.7から2.1.2.10を繰り返します。[ 数式] |その他の機能 |統計学 |[MEDIAN] を選択します。行と列の中央値がほぼゼロであることを確認してください。最終的な残差テーブルを CSV 形式で保存します。
  3. 重みを第 3 フェーズとする回帰手順
    注:従属変数は、死亡者数を重みとして、各コホートの残差として計算しました。次に、線形回帰を実行してコホート効果を計算しました。
    1. Kutools for Excelがインストールされていることを確認し、それを使用します 転置テーブル寸法 クロステーブルをフラットリストにすばやく変換するツール。分割表の残差データを含むCSVファイルをインポートします(2.1.2.11を参照)。
    2. リストに変換するテーブルを選択します。 Kutoolsをクリックします|変更 |転置テーブル次元。[転置テーブル寸法]ダイアログボックスで、[クロステーブル]リストの横にあるチェックボックスがオンになっていることを確認し、[結果範囲]を選択して残差をリスト形式で保存します。
    3. 初期データ・ファイル(1.2を参照)に、残差リスト形式のデータ(2.1.3.1を参照)を使用して列を挿入します。残差リスト形式のデータにサポート列が挿入されたことを確認します(2.1.3.1を参照)。「= age & period variables」をクリックし、「Enter」をクリックします。サポート列を使用して、残差リスト形式のデータの年齢および期間グループラベルを検索し、初期データファイルに応答残差列を挿入します(1.2を参照)。
    4. [ 数式] |ルックアップ&リファレンス |VLOOKUP を選択します。VLOOKUP を設定します (年齢のセル位置ラベルと期間のセル位置ラベル、支持列の最初のセル位置ラベル: 残差列の最後のセル位置ラベル、4, 0)。選択範囲に支持列、年齢列、期間列、残差列 (つまり、残差リストとして 4番目の 列) が含まれていることを確認します。
    5. 残差が初期データ・ファイル(1.2を参照)に挿入されていることを確認して、次のステップのために残差リスト形式のデータ(2.1.3.1を参照)を検索します。重み付けされていない最小二乗法で回帰モデルを当てはめ、残差を分析します。
    6. [分析] |回帰 |線形。独立変数のコホート・カテゴリー (つまり、17 の出生コホート) を「独立」ボックスに移し、従属変数の「残差」を「従属」ボックスに移します。[OK] をクリックします。重み付けされていないコホート効果の結果を生成することを確認します。
    7. 残差が最初の Excel データ・ファイル (1.2 を参照) に挿入されていることを確認して、次のステップのために残差リスト形式のデータ (2.1.3.1 を参照) を検索します。重み付き最小二乗法で回帰モデルを適合し、残差を分析します。 [分析] |回帰 |線形
    8. 独立変数とコホート・カテゴリー (つまり、17 の出生コホート) を独立ボックスに、従属変数と残差を従属変数ボックスに移します。死亡番号をWLSウェイトボックスに移します。 [OK] をクリックします。コホート効果の加重平均の結果が生成されていることを確認します。

結果

死亡率データは、10の5歳年齢グループ(40-44、45-49、50-54、55-59、60-64、65-69、70-74、75-79、80-84、および85+)および8つの5年間(1976-1980、1981-1985、1986-1990、1991-1995、1996-2000、2001-2005、2006-2010、および2011-2015)で実証されました。コホートグループの数は、年齢グループの総数から1を引くことによって選択されました:10(5歳の年齢グループ)+8(5年間の期間)-1 = 17の出生コホート、?...

ディスカッション

HCC死亡率の時間的傾向により、従来のモデルはデータに隠されたいくつかの重要な特徴(コホート効果など)を過小評価し、観察された対数年齢補正率の単純な線形外挿を使用する従来の分析では、予測の精度が大幅に低下しています。この傾向は35年間続いており、1976年から2015年までの台湾におけるHCC死亡率の長期傾向を直接観察すると、今後数年間で上昇傾向にあ...

開示事項

著者は何も開示していません。

謝辞

本研究は、台北子智病院TCRD-TPE-109-RT-8(2/3)およびTCRD-TPE-109-39(2/2)の支援を受けました。

資料

NameCompanyCatalog NumberComments
not applicablenot applicablenot applicablenot applicable

参考文献

  1. Kuntz, E., Kuntz, H. D. . Hepatology: Principles and Practice. , 774 (2006).
  2. McGlynn, K. A., et al. International trends and patterns of primary liver cancer. International Journal of Cancer. 94 (2), 290-296 (2001).
  3. Bosch, F. X., Ribes, J., Diaz, M., Cleries, R. Primary liver cancer: worldwide incidence and trends. Gastroenterology. 127, 5-16 (2004).
  4. Tzeng, I. S., Ng, C. Y., Chen, J. Y., Chen, L. S., Wu, C. C. Using weighted regression model for estimating cohort effect in age-period contingency table data. Oncotarget. 9 (28), 19826-19835 (2018).
  5. Tzeng, I. S., Lee, W. C. Forecasting hepatocellular carcinoma mortality in Taiwan using an age-period-cohort model. Asia-Pacific Journal of PublicHealth. 27, 65-73 (2015).
  6. Tzeng, I. S., et al. Predicting emergency departments visit rates from septicemia in Taiwan using an age-period-cohort model, 1998 to 2012. Medicine. 95, 5598 (2016).
  7. Chen, S. H., et al. Period and Cohort Analysis of Rates of Emergency Department Visits Due to Pneumonia in Taiwan, 1998-2012. Risk Management and Healthcare Policy. 13, 1459-1466 (2020).
  8. Keyes, K. M., Li, G. A multiphase method for estimating cohort effects in age-period contingency table data. Annals of Epidemiology. 20, 779-785 (2010).
  9. Tukey, J. . Exploratory data analysis Reading: MS. , (1977).
  10. Selvin, S. . Statistical analysis of epidemiologic data. , (1996).
  11. Légaré, G., Hamel, D. An age-period-cohort approach to analyzing trends in suicide in Quebec between 1950 and 2009. Canadian Journal of Public Health. 104, 118-123 (2013).
  12. Lavanchy, D. Hepatitis B virus epidemiology, disease burden, treatment, and current and emerging prevention and control measures. Journal of Viral Hepatitis. 11, 97-107 (2004).
  13. Chang, M. H., et al. Universal hepatitis B vaccination in Taiwan and the incidence of hepatocellular carcinoma in children. Taiwan Childhood Hepatoma Study Group. New England Journal of Medicine. 336, 1855-1859 (1997).
  14. Lu, F. T., Ni, Y. H. Elimination of mother-to-infant transmission of hepatitis B virus: 35 years of experience. Pediatric Gastroenterology, Hepatology & Nutrition. 23 (4), 311-318 (2020).
  15. Chien, Y. C., Jan, C. F., Kuo, H. S., Chen, C. J. Nationwide hepatitis B vaccination program in Taiwan: effectiveness in the 20 years after it was launched. Epidemiologic Reviews. 28, 126-135 (2006).
  16. Ahmad, O. B., et al. Age standardization of rates: a new WHO standard. Geneva: GPE Discussion Paper Series. World Health Organization. , 31 (2005).
  17. da Silva, C. P., Emídio, E. S., de Marchi, M. R. Method validation using weighted linear regression models for quantification of UV filters in water samples. Talanta. 131, 221-227 (2015).
  18. Dawes, R. M. The robust beauty of improper linear models in decision making. American Psychologist. 34, 571-582 (1979).
  19. Dawes, R. M., Corrigan, B. Linear models in decision making. Psychological Bulletin. 81, 95-106 (1974).
  20. Einhorn, H. J., Hogarth, R. M. Unit weighting schemes for decision making. Organizational Behavior and Human Performance. 13, 171-192 (1975).
  21. Wang, W., et al. Association of hepatitis B virus DNA level and follow-up interval with hepatocellular carcinoma recurrence. JAMA Network Open. 3 (4), 203707 (2020).
  22. Holford, T. R. The estimation of age, period and cohort effects for vital rates. Biometrics. 39, 311-324 (1983).

転載および許可

このJoVE論文のテキスト又は図を再利用するための許可を申請します

許可を申請

さらに記事を探す

HCC

This article has been published

Video Coming Soon

JoVE Logo

個人情報保護方針

利用規約

一般データ保護規則

研究

教育

JoVEについて

Copyright © 2023 MyJoVE Corporation. All rights reserved