JoVE Logo

Sign In

A subscription to JoVE is required to view this content. Sign in or start your free trial.

In This Article

  • Summary
  • Abstract
  • Introduction
  • Protocol
  • תוצאות
  • Discussion
  • Disclosures
  • Acknowledgements
  • Materials
  • References
  • Reprints and Permissions

Summary

אנו מתארים שיטה רב-שלבית למדידת אפקט עוקבה עם נתוני גיל, ובכך מאפשרים לבטל נתונים במצבים רבים מבלי להקריב את איכות הנתונים. הפרוטוקול מדגים את האסטרטגיה ומספק מודל רגרסיה משוקלל לניתוח נתוני קרצינומה של הכבד.

Abstract

כדי לבטל את השפעת הגיל והתקופה בנתוני טבלת המגירה של מחזור הגיל, אומצה שיטה רב-שלבית להערכת השפעת העוקבה. הגידול הממאיר הראשוני הכללי ביותר של הכבד הוא קרצינומה הפטו-תאית (HCC). HCC קשור לשחמת הכבד עם אלכוהול ואטיולוגיות ויראליות. באפידמיולוגיה, מגמות ארוכות טווח בתמותה מ-HCC תוארו (או נחזו) על ידי שימוש במודל גיל-תקופה-עוקבה (APC). מקרי המוות של HCC נקבעו עבור כל קבוצה עם ההשפעה המשוקללת שלה. רווח הסמך (CI) של הממוצע המשוקלל צר למדי (בהשוואה להערכות המשוקללות באותה מידה). בשל ה-CI הצר למדי עם פחות אי ודאות, האומדן הממוצע המשוקלל שימש כאמצעי לחיזוי. בשיטה הרב-שלבית, מומלץ להשתמש באומדן ממוצע משוקלל המבוסס על מודל רגרסיה כדי להעריך את השפעת העוקבה בנתוני טבלת המגירה של תקופת הגיל.

Introduction

הגידול הממאיר הראשוני הנפוץ ביותר בכבד הוא קרצינומה הפטו-תאית (HCC). שיעור התמותה שלו מדורג במקום החמישי בגברים ושמיני בנשים (6% מהגברים ו-3% מהנשים), 1 מבין כל הגידולים הממאירים בעולם. בטייוואן זהו הסרטן השכיח ביותר בקרב גברים והסרטן השני בשכיחותו בקרב נשים (21.8% מהגברים ו-14.2% מהנשים) 2. ההערכה היא שמאז שנת 2000, המספר השנתי של HCCs המאובחנים ברחבי העולם הוא 564,000, מתוכם 398,000 גברים ו-166,000 נשים. באפידמיולוגיה, הדרך הנפוצה ביותר להסביר את הקשר בין משתני גיל, תקופה ועוקבה (APC) היא שגיל ותקופה משפיעים זה על זה כדי ליצור חוויה דורית ייחודית למגמת המחלה הנחקרת.

למרות שלהמשגה זו עדיין יש קשר ליניארי מדויק של גיל + עוקבה = תקופה, חשיפה (מנבא) אינה גורם אינהרנטי בקבוצת לידה. במקום זאת, אנו מציעים שכאשר שינויים גורמים להתפלגות שונה של מחלה, יש אפקט עוקבה. עם זאת, מכיוון שגיל + עוקבה = תקופה, שלושת המשתנים הללו קשורים ליניארית; רק אם נאכפות הגבלות אחרות, לא ניתן ליצור מודל גיל-תקופה-עוקבה משוער (APC) תוך שימוש בהשפעות הליניאריות של גיל, תקופה ועוקבה. במחקר זה הבהרנו בעיה זו ואת המגבלות הפוטנציאליות שהטלנו בפרסומים הקודמים שלנו 4,5,6,7.

עם ההשערות הקלות ביותר לגבי נתוני טבלת המגירה, השיטה הרב-שלבית 8 מספקת שלושה שלבים להערכת אפקט העוקבה. בנוסף, מכיוון שהליטוש החציוני אינו תלוי בהתפלגות או מסגרת ספציפית, הוא שימש לסוגים שונים של נתונים, כגון יחסים, יחסים לוגריתמיים וספירות. ליטוש חציוני הוא הטכניקה העיקרית המשמשת בשיטה הרב-פאזית.

נתונים מטבלת מגירה דו-כיוונית 9 שימשו ליצירת הפיתוח של החציון המלוטש. הליך הליטוש החציוני משמש לביטול ההשפעות המצטברות של גיל (כלומר, שורה) ותקופה (כלומר, עמודה) על ידי חיסור איטרטיבי של החציון מכל שורה ומכל עמודה. הליך זה משמש לעתים קרובות בניתוח נתונים אפידמיולוגיים 10. יתרון אחד של טכניקה זו הוא שלא נדרשות הנחות לגבי התפלגות או מבנה הנתונים בטבלת המגירה הדו-כיוונית. לכן, טכניקה זו שימשה באופן נרחב עבור כל סוג של נתונים הכלולים בטבלה, כגון נתוני התאבדות 11. מודל ה-APC שימש גם לתיאור המגמות ארוכות הטווח של היארעות מחלות או תמותה 5. מודלים של APC מניחים לעתים קרובות שלגיל, תקופה וקבוצה יש השפעות נוספות על הטרנספורמציה הלוגריתמית של מחלה/תמותה. כדי להעריך את השפעות העוקבה, הפרוטוקול המתואר מייצר מודל APC לניתוח תמותה מלאה של קרצינומה הפטו-תאית (HCC) עם רגרסיה משוקללת, ובכך תומך בתחזיות אמינות ובהערכה מתונה של השפעות הטיפול.

Protocol

1. מקורות נתונים

כדי להדגים את החישובים, השתמשנו בנתונים שנתיים על תמותה מ-HCC בין השנים 1976 ל-2015 עבור גברים ונשים בטייוואן. חבילה סטטיסטית למדעי החברה (SPSS) גרסה 24.0 עבור Windows ו-Microsoft Excel שימשה לביצוע הפרוטוקולים עבור מחקר זה.

  1. בקש מרופא HCC לסווג את הסימפטומים הקליניים, בדיקות המעבדה ותוצאות ההדמיה הרפואית של המטופלים כדי לתת קוד אבחון בהתאם לקוד הסיווג הבינלאומי של מחלות (ICD), ICD 150.
  2. ודא שקובץ הנתונים (שנשמר כ- CSV) מכיל את השנה (כלומר, תקופה), גיל, עוקבה, מספר פטירה, מספר אוכלוסייה באמצע השנה ותמותה כעמודות.
    1. לחץ על קובץ | ייבוא נתונים | נתוני CSV | לפתוח. ודא שיש סימון בתיבה לצד קרא שמות משתנים מהשורה הראשונה של הנתונים ולחץ על אישור. ודא שקובץ הנתונים מיובא ל-SPSS.
  3. בנה נתוני טבלת מגירה מוצלבים לפי קבוצות גיל באמצעות SPSS. באופן כללי, הגדרנו משתני שורה כגיל ומשתני עמודה כתקופה. אם הנתונים הציגו נתונים של שנה תקופתית אחת (או שנת גיל בודדת), היה צורך לשלב אותם בקבוצת מחזור (או קבוצת גיל). לאחר מכן, הצלבנו את העמדות לקבוצת גיל לאורך שנות הסקר.
    1. לחץ על נתח | סטטיסטיקה תיאורית | הצלבות ובחר את משתנה הגיל בתיבה לצד שורות ומשתנה תקופה בתיבה לצד עמודות. לחץ על תאים וודא שיש סימון בתיבה לצד נצפה. ניתן לבצע טבלת מגירה של מספר מקרי מוות (או מספר אוכלוסייה באמצע השנה, או תמותה) ב-SPSS על ידי השלבים לעיל.
    2. ייצא את נתוני טבלת המגירה שהוזנו בתבנית CSV לניתוח באמצעות תוכנה אחרת. לחץ על קובץ | ייצוא נתונים | ודא פורמט נתונים רצוי כ-CSV | מיקום מעולה. שדה זה שאינו ניתן לעריכה מציג את המיקום הבטוח עבור הקובץ המיוצא.
    3. שם קובץ: לחץ על בחר כדי לשנות את שם הקובץ.
    4. ייצוא כסוג: בחר סוג קובץ CSV מהתפריט הנפתח. לחץ על משתנים כדי להציג את המשתנים הזמינים ולבחור את טבלאות המשתנים. כברירת מחדל, כל המשתנים מסל נתוני המקור נשמרים עבור הקובץ המיוצא. חוקרים יכולים להשתמש בטבלאות כדי לציין אילו משתני מקור לכלול בקובץ המיוצא. לחצו על 'ייצוא'.

2. הגדרת דגם

הערה: השיטה הרב-שלבית הוצעה על ידי קיז ולי 8 עם חקירה גרפית. בוצע ניתוח ליטוש חציוני כדי לבטל את ההשפעות המצטברות של גיל ותקופה; לבסוף, שאריות אלה משלב הליטוש החציוני בקטגוריית הקוהורט במודל הרגרסיה הליניארית הוחזרו, והוערכו השפעות עוקבה באמצעות נתונים בטבלת המגירה.

  1. ייצוג גרפי כשלב ראשון
    1. צור תרשים קו של קבוצות גיל וקבוצות תקופתיות. כדי לבדוק קבוצות לידה על פני קבוצות גיל או קבוצות לידה, צייר אפילו קבוצות לידה על פני גילאים או מחזורים בטבלאות הקווים.
    2. ייבא קובץ CSV עם נתוני תמותה של טבלת מגירה. לחץ על קובץ | פתוח | אתר כדי לבחור קובץ CSV מתיקיה. זכור לבחור כל הקבצים ברשימה הנפתחת לצד התיבה שם הקובץ.
    3. לחץ על פתח כדי לפתוח את קובץ ה- CSV. סמן את השורות והעמודות של נתוני התמותה ולחץ על הוספה | מצעדי הפזמונים | גרף קו.
  2. ניתוח פולני חציוני כשלב שני
    1. הפחיתו באופן איטרטיבי את החציון מכל שורה ומכל עמודה כדי לבטל את ההשפעה המצטברת של גיל ותקופה. לאחר שלב הליטוש החציוני, שמור את השאריות להליך הרגרסיה כדי להעריך את השפעות העוקבה.
    2. חשב את החציון הכולל ואת הטבלה השיורית. ייבא קובץ CSV עם נתוני תמותה של טבלת מגירה (עיין ב-2.1.1.2).
    3. נעשה שימוש ב-LN עבור כל תא בנתוני התמותה של טבלת המגירה. לחץ על נוסחאות | פונקציית מתמטיקה וטריגונומטריה ובחר LN.
    4. מספר: הזן את תווית המיקום עבור כל תא. ודא שכל תא בנתוני התמותה של טבלת המגירה לקח LN. לחץ על נוסחאות | פונקציות נוספות | סטטיסטיקה ובחר חציון.
    5. מספר 1: הזן את תווית מיקום התא הראשונה.
    6. מספר 2: הזן את תווית מיקום התא האחרונה. ודא שהערך החציוני המתקבל מאוחסן בשוליים השמאליים העליונים של טבלת המגירה. ודא שנוצרת טבלה שיורית על ידי לקיחת ההפרש בין הערך המקורי (כלומר, נתוני התמותה של LN) לבין החציון הכולל.
    7. חשב את חציוני השורות (כלומר, החציונים של כל קבוצת גיל) וודא שהוא חישב את ערכי חציון השורה עבור קבוצת גיל התגובה. לחץ על נוסחאות | פונקציות נוספות | סטטיסטיקה | בחר חציון.
      1. מספר 1: הזן את תווית מיקום התא הראשונה של הדגימה הגולמית.
      2. מספר 2: הזן את תווית מיקום התא האחרונה של חומר הגלם. ודא שערכי חציון השורה המתקבלים מאוחסנים בשוליים השמאליים של טבלת המגירה.
    8. צור טבלה שיורית חדשה לאחר הפחתת חציוני השורות. ודא שנוצרת קבוצה חדשה של ערכים שיוריים מחציוני השורה שבהם כל תא מקבל את ערך החיסור של חציון השורה מכל משתנה תגובה באותה שורה. לחץ על = וודא שתווית מיקום התא הכוללת של כל שורה הפחיתה את התווית של חציון השוליים השמאליים.
    9. חשב את חציוני העמודות (כלומר, החציונים של כל קבוצת תקופות) וודא שהוא מחשב את ערכי חציון העמודות עבור קבוצת תקופות התגובה. לחץ על נוסחאות | פונקציות נוספות | סטטיסטיקה | בחר חציון.
      1. מספר 1: הזן את תווית מיקום התא הראשונה של העמודה. מספר 2: הזן את תווית מיקום התא האחרונה של העמודה. ודא שהערכים החציוניים של העמודות המתקבלים מאוחסנים בשוליים העליונים של טבלת המגירה.
    10. צור טבלה שיורית חדשה לאחר הפחתת חציוני העמודות. ודא שנוצרת קבוצה חדשה של ערכים שיוריים מחציוני העמודות שבהם כל תא מקבל את ערך החיסור של חציון העמודה מכל משתנה תגובה באותה עמודה. לחץ על = וודא שכל תווית מיקום תא כוללת של עמודה הפחיתה את התווית של חציון השוליים העליונים.
    11. חזור על שלבים 2.1.2.7 עד 2.1.2.10 עד שהחציון של השורה והעמודה יתקרב לאפס. לחץ על נוסחאות | פונקציות נוספות | סטטיסטיקה | בחר חציון. ודא שחציוני השורה והעמודה הם בערך אפס. שמור את הטבלה השיורית הסופית בתבנית CSV.
  3. הליך רגרסיה עם משקל כשלב השלישי
    הערה: חישבנו את המשתנה התלוי כשאריות עבור כל קבוצה עם מספר מקרי מוות כמשקל. לאחר מכן, הרצנו רגרסיות ליניאריות כדי לחשב את השפעות העוקבה.
    1. ודא ש- Kutools עבור Excel הותקן והשתמש בו להחליף מידות טבלה כלי כדי להמיר במהירות טבלאות צולבות לרשימות שטוחות. ייבא קובץ CSV עם נתונים שיוריים של טבלת מגירה (עיין ב-2.1.2.11).
    2. בחר את הטבלה להמרה לרשימה. לחץ על Kutools | שינוי | חילוף ממד טבלה. בתיבת הדו-שיח חילוף ממדי טבלה, ודא שקיימת סימון בתיבה לצד הרשימה הצלב טבלה ל ובחר את טווח התוצאות כדי לאחסן את השאריות בתבנית רשימה.
    3. הוספת עמודה בקובץ הנתונים הראשוני (עיין ב-1.2) עם נתוני פורמט הרשימה השיורית (עיין ב-2.1.3.1). ודא שהוא הוסיף עמודה תומכת בנתוני פורמט הרשימה השיורית (עיין ב-2.1.3.1). לחץ על = משתני גיל ותקופה ולחץ על Enter. השתמש בעמודה תומכת כדי לחפש את תוויות קבוצת הגיל והתקופות של נתוני תבנית הרשימה השיורית כדי להוסיף עמודה שיורית של תגובה בקובץ הנתונים הראשוני (עיין בסעיף 1.2).
    4. לחץ על נוסחאות | חיפוש והפניה | בחר VLOOKUP. הגדר VLOOKUP (תווית מיקום תא של גיל ותווית מיקום תא של התקופה, תווית מיקום התא הראשונה של העמודה התומכת: תווית מיקום התא האחרונה של העמודה השיורית, 4, 0). ודא שטווח הבחירה כולל עמודות תמיכה, גיל, תקופה ושאריות (כלומר, העמודההרביעית כרשימה השיורית).
    5. ודא שהשאריות מוכנסות לנתונים הראשוניים file (עיין ב-1.2) חפש את נתוני פורמט הרשימה השיורית (עיין ב-2.1.3.1) לשלב הבא. התאם את מודל הרגרסיה על ידי ריבועים מינימליים לא משוקללים ונתח את השאריות.
    6. לחץ על נתח | רגרסיה | ליניארי. העבירו את המשתנה הבלתי תלוי, קטגוריית העוקבה (כלומר, 17 קבוצות לידה), לתיבה הבלתי תלויים, ואת המשתנה התלוי, שאריות, לתיבה תלוי:. לחץ על OK. הקפד ליצור את התוצאות של אפקטי העוקבה הלא משוקללים.
    7. ודא שהשאריות מתווספות לקובץ הנתונים הראשוני של Excel (עיין ב-1.2) חפש את נתוני פורמט הרשימה השיורית (עיין ב-2.1.3.1) לשלב הבא. התאם את מודל הרגרסיה לפי ריבועים מינימליים משוקללים ונתח את השאריות. לחץ על נתח | רגרסיה | ליניארי.
    8. העבר את המשתנה הבלתי תלוי וקטגוריית העוקבה (כלומר, 17 קבוצות לידה) לתיבה הבלתי תלויה ואת המשתנה התלוי והשאריות לתיבה התלויה:. העבירו את מספר הפטירה לקופסת המשקל של WLS. לחץ על OK. ודא שהוא מייצר את התוצאות של הממוצע המשוקלל של אפקט העוקבה.

תוצאות

נתוני התמותה הודגמו עבור 10 קבוצות גיל חמש שנים (40-44, 45-49, 50-54, 55-59, 60-64, 65-69, 70-74, 75-79, 80-84 ו-85+) ו-8 תקופות זמן של חמש שנים (1976-1980, 1981-1985, 1986-1990, 1991-1995, 1996-2000, 2001-2005, 2006-2010 ו-2011-2015). מספר קבוצות הקבוצה נבחר על ידי הפחתת אחת מהמספר הכולל של קבוצות תקופות גיל: 10 (קבוצות גיל של חמש שנים) + 8 (תקופו...

Discussion

בשל מגמת הזמן של תמותה מ-HCC, מודלים קונבנציונליים ממעיטים בהערכת כמה מאפיינים חשובים החבויים בנתונים (כגון השפעות עוקבה), וניתוחים קונבנציונליים המשתמשים באקסטרפולציה ליניארית פשוטה של שיעור תיקון הגיל הלוגריתמי הנצפה מראים דיוק מופחת משמעותית בתחזיות שלהם. ברור שמגמה...

Disclosures

למחברים אין מה לחשוף.

Acknowledgements

עבודה זו נתמכה על ידי בית החולים טאיפיי צו צ'י TCRD-TPE-109-RT-8 (2/3) ו-TCRD-TPE-109-39 (2/2).

Materials

NameCompanyCatalog NumberComments
not applicablenot applicablenot applicablenot applicable

References

  1. Kuntz, E., Kuntz, H. D. . Hepatology: Principles and Practice. , 774 (2006).
  2. McGlynn, K. A., et al. International trends and patterns of primary liver cancer. International Journal of Cancer. 94 (2), 290-296 (2001).
  3. Bosch, F. X., Ribes, J., Diaz, M., Cleries, R. Primary liver cancer: worldwide incidence and trends. Gastroenterology. 127, 5-16 (2004).
  4. Tzeng, I. S., Ng, C. Y., Chen, J. Y., Chen, L. S., Wu, C. C. Using weighted regression model for estimating cohort effect in age-period contingency table data. Oncotarget. 9 (28), 19826-19835 (2018).
  5. Tzeng, I. S., Lee, W. C. Forecasting hepatocellular carcinoma mortality in Taiwan using an age-period-cohort model. Asia-Pacific Journal of PublicHealth. 27, 65-73 (2015).
  6. Tzeng, I. S., et al. Predicting emergency departments visit rates from septicemia in Taiwan using an age-period-cohort model, 1998 to 2012. Medicine. 95, 5598 (2016).
  7. Chen, S. H., et al. Period and Cohort Analysis of Rates of Emergency Department Visits Due to Pneumonia in Taiwan, 1998-2012. Risk Management and Healthcare Policy. 13, 1459-1466 (2020).
  8. Keyes, K. M., Li, G. A multiphase method for estimating cohort effects in age-period contingency table data. Annals of Epidemiology. 20, 779-785 (2010).
  9. Tukey, J. . Exploratory data analysis Reading: MS. , (1977).
  10. Selvin, S. . Statistical analysis of epidemiologic data. , (1996).
  11. Légaré, G., Hamel, D. An age-period-cohort approach to analyzing trends in suicide in Quebec between 1950 and 2009. Canadian Journal of Public Health. 104, 118-123 (2013).
  12. Lavanchy, D. Hepatitis B virus epidemiology, disease burden, treatment, and current and emerging prevention and control measures. Journal of Viral Hepatitis. 11, 97-107 (2004).
  13. Chang, M. H., et al. Universal hepatitis B vaccination in Taiwan and the incidence of hepatocellular carcinoma in children. Taiwan Childhood Hepatoma Study Group. New England Journal of Medicine. 336, 1855-1859 (1997).
  14. Lu, F. T., Ni, Y. H. Elimination of mother-to-infant transmission of hepatitis B virus: 35 years of experience. Pediatric Gastroenterology, Hepatology & Nutrition. 23 (4), 311-318 (2020).
  15. Chien, Y. C., Jan, C. F., Kuo, H. S., Chen, C. J. Nationwide hepatitis B vaccination program in Taiwan: effectiveness in the 20 years after it was launched. Epidemiologic Reviews. 28, 126-135 (2006).
  16. Ahmad, O. B., et al. Age standardization of rates: a new WHO standard. Geneva: GPE Discussion Paper Series. World Health Organization. , 31 (2005).
  17. da Silva, C. P., Emídio, E. S., de Marchi, M. R. Method validation using weighted linear regression models for quantification of UV filters in water samples. Talanta. 131, 221-227 (2015).
  18. Dawes, R. M. The robust beauty of improper linear models in decision making. American Psychologist. 34, 571-582 (1979).
  19. Dawes, R. M., Corrigan, B. Linear models in decision making. Psychological Bulletin. 81, 95-106 (1974).
  20. Einhorn, H. J., Hogarth, R. M. Unit weighting schemes for decision making. Organizational Behavior and Human Performance. 13, 171-192 (1975).
  21. Wang, W., et al. Association of hepatitis B virus DNA level and follow-up interval with hepatocellular carcinoma recurrence. JAMA Network Open. 3 (4), 203707 (2020).
  22. Holford, T. R. The estimation of age, period and cohort effects for vital rates. Biometrics. 39, 311-324 (1983).

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Explore More Articles

HCC

This article has been published

Video Coming Soon

JoVE Logo

Privacy

Terms of Use

Policies

Research

Education

ABOUT JoVE

Copyright © 2025 MyJoVE Corporation. All rights reserved