JoVE Logo

Oturum Aç

Bu içeriği görüntülemek için JoVE aboneliği gereklidir. Oturum açın veya ücretsiz deneme sürümünü başlatın.

Bu Makalede

  • Özet
  • Özet
  • Giriş
  • Protokol
  • Sonuçlar
  • Tartışmalar
  • Açıklamalar
  • Teşekkürler
  • Malzemeler
  • Referanslar
  • Yeniden Basımlar ve İzinler

Özet

Mevcut protokol, rakip bir risk modelinin ayırt etme ve kalibrasyon yeteneklerini değerlendirmek için R'deki kodları ve bunun iç ve dış doğrulaması için kodları açıklamaktadır.

Özet

Cox orantılı tehlike modeli, klinik ortamlarda sağkalım analizleri için yaygın olarak uygulanmaktadır, ancak çoklu sağkalım sonuçlarıyla baş edememektedir. Geleneksel Cox orantılı tehlike modelinden farklı olarak, rakip risk modelleri, rakip olayların varlığını ve bunların klinisyenlerin kesin bir prognostik tahmin yapmaları için yararlı bir araç olan grafiksel bir hesaplama cihazı olan bir nomogram ile kombinasyonunu göz önünde bulundurur. Bu çalışmada, rakip risk nomogramını oluşturmak için bir yöntem, yani ayırt edicilik (yani, uyum indeksi ve eğri altındaki alan) ve kalibrasyon (yani kalibrasyon eğrileri) yeteneklerinin yanı sıra net faydanın (yani karar eğrisi analizi) değerlendirilmesi için bir yöntem sunuyoruz. Ek olarak, orijinal veri kümesinin bootstrap yeniden örneklerini kullanan dahili doğrulama ve yerleşik rakip risk nomogramının harici bir veri kümesini kullanan harici doğrulama, ekstrapolasyon yeteneğini göstermek için de gerçekleştirilmiştir. Rakip risk nomogramı, klinisyenlerin rakip riskleri göz önünde bulundurarak prognozu tahmin etmeleri için yararlı bir araç olarak hizmet etmelidir.

Giriş

Son yıllarda, hassas tıbbın gelişmesiyle birlikte ortaya çıkan prognostik faktörler belirlenmiş, moleküler ve klinikopatolojik faktörleri birleştiren prognostik modeller klinik ortamlarda giderek daha fazla dikkat çekmektedir. Bununla birlikte, Cox orantılı tehlike modeli gibi grafiksel olmayan modeller, katsayı değerlerinin sonuçlarıyla, klinisyenlerin 1'i anlaması zordur. Buna karşılık, bir nomogram, bir matematiksel fonksiyonun yaklaşık grafik hesaplaması için tasarlanmış iki boyutlu bir diyagram olan regresyon modellerinin (Cox regresyon modeli, rakip risk modeli vb. dahil) bir görselleştirme aracıdır2. Bir klinik modelde farklı değişken seviyelerinin değerlendirilmesini ve prognozu tahmin etmek için risk skorlarının (RS) hesaplanmasını sağlar.

Model yapımında model değerlendirmesi esastır ve değerlendirme için genellikle iki özellik kabul edilir: ayrımcılık ve kalibrasyon. Klinik modellerde ayrımcılık, bir modelin olayları geliştiren bireyleri, ölen hastalara karşı hayatta kalanlar gibi geliştirmeyenlerden ayırma yeteneğini ifade eder ve uyum indeksi (C-indeksi) veya alıcı çalışma karakteristik eğrisi (AUC) altındaki alan tipik olarak karakterize etmek için kullanılır 3,4. Kalibrasyon, bir modelin tahmin edilen olasılıklarını gerçek olasılıklarla karşılaştırma işlemidir ve kalibrasyon eğrileri onu temsil etmek için yaygın olarak kullanılmıştır. Ek olarak, model doğrulaması (iç ve dış doğrulama) model yapımında önemli bir adımdır ve yalnızca doğrulanmış modeller daha fazla tahmin edilebilir5.

Cox orantılı tehlike modeli, prognostik faktörler ile sağkalım durumu arasındaki ilişkileri araştırmak için tıbbi araştırmalarda kullanılan bir regresyon modelidir. Bununla birlikte, Cox orantılı tehlike modeli yalnızca iki sonuç durumunu [Y (0, 1)] dikkate alırken, çalışma denekleri genellikle ikiden fazla durumla karşı karşıya kalır ve rakip riskler ortaya çıkar [Y (0, 1, 2)]1. Menşe tarihinden (örneğin tedavi) herhangi bir nedene bağlı ölüm tarihine kadar geçen süre olarak tanımlanan genel sağkalım (OS), sağkalım analizinde en önemli son noktadır. Bununla birlikte, işletim sistemi kansere özgü ölümü kansere özgü olmayan ölümden (örneğin, kardiyovasküler olaylar ve diğer ilgisiz nedenler) ayırt etmekte başarısız olmakta, böylece rakip riskleri göz ardı etmektedir6. Bu gibi durumlarda, rakip riskler göz önünde bulundurularak sağkalım durumunun tahmin edilmesinde rakip risk modeli tercih edilir7. Cox orantılı tehlike modellerinin oluşturulması ve doğrulanması metodolojisi iyi kurulmuş olsa da, rakip risk modellerinin doğrulanması ile ilgili çok az rapor bulunmaktadır.

Önceki çalışmamızda, spesifik bir rakip risk nomogramı, bir nomogram ve rakip risk modelinin bir kombinasyonu ve rakip bir risk modeline dayalı bir risk puanı tahmini oluşturulmuştur8. Bu çalışma, rakip risk nomogramının farklı değerlendirme ve validasyon yöntemlerini sunmayı amaçlamaktadır ve bu yöntemler, klinisyenlerin rakip riskleri göz önünde bulundurarak prognozu tahmin etmeleri için yararlı bir araç olarak hizmet etmelidir.

Access restricted. Please log in or start a trial to view this content.

Protokol

Sürveyans, Epidemiyoloji ve Son Sonuçlar (SEER) veritabanı, yalnızca tanımlanmamış hasta verilerini içeren açık erişimli bir kanser veritabanıdır (SEER ID: 12296-Kasım 2018). Bu nedenle, bu çalışma Zhejiang Üniversitesi Tıp Fakültesi, Bağlı Jinhua Hastanesi inceleme kurulunun onayından muaf tutulmuştur.

1. Veri hazırlama ve R paketlerinin hazırlanması

  1. Verileri hazırlayın ve içeri aktarın.
    > Veri Kümesi <- read.csv(".../Meme kanseri Verileri.xlsx") #Import veriler.
    NOT: Veriler Ek Dosya 1'e yüklenir.
  2. R paketlerini yükleyin ve yükleyin.
    > paketleri <- c("rms","cmprsk","mstate","survival","riskRegression",,"
    prodlim")
    > req.pcg <- fonksiyonu(pcg){
    Yeni <- PCG[!( pcg %in% installed.packages()[, "Paket"])]
    if (length(new)) install.packages(new, dependencies = T)
    sapply(pcg, require, ch = T)
    }
    > req.pcg(paketler)

    NOT: rms, cmprsk, mstate, survival, riskRegression ve prodlim (http://www.r-projectrg/) paketlerini kullanarak R yazılımını (sürüm 3.6.2) temel alan aşağıdaki yordamları gerçekleştirin.

2. Rakip risk nomogramlarını iki farklı yöntemle oluşturun

  1. Rakip risk nomogramını doğrudan bir yöntemle oluşturun.
    > mod_cph <- cph (Surv (Survivalmonths, durum) ~ faktör1 + faktör2 + ...,
    x=T, y=T, surv=T, data=Veri kümesi)
    > nom <- nomogram(mod_cph, fun=list(function(x) 1-surv_cph(36, x)...),
    funlabel=c("3 yıllık olay1 Prob." ...), lp=F)
    örnek olarak 36. ay #Take.
    > mod_crr <- crr(Survivalmonths, fstatus, failcode=1, cov1=cov)
    > puanı <- log(log((1-real.3y),(1-cif.min36)))/(maxbeta/100)
    > Arsa (Nom)
  2. Rakip risk nomogramını ağırlıklı bir yöntemle oluşturun.
    > df.w <- crprep("Survivalmonths"," fstatus",
    data=Veri kümesi, trans=c(1,2), cens=0,
    keep=c("faktör1"," faktör2"...))
    > mod.w <- cph(Surv(Tstart, Tstop, status==1) ~ factor1+factor2+...,
    data=df.w, weight=weight.cens, subset=failcode==1, surv=T)
    > nom.w <- nomogram(mod.w...)

3. Rakip risk nomogramının ayırt edicilik yeteneği

  1. Ayrımcılık için C-indeksi
    1. Matris kovanını rakip risk modeline mod_crr sığdırın ve tahmin edilen bir matris SUV alın.
      > suv <- predict.crr(mod_crr, cov)
    2. Belirli bir aydaki kümülatif olayları suv'den alın ve rcorr.cens işleviyle C-endeksini hesaplayın.
      > cif36 <- suv[hangi(suv[,1]==36),][-1]
      > rcorr <- rcorr.cens(1-cif36,Surv(Dataset$Survivalmonths,Dataset$tumordeath))
      > cindex <- rcorr[1]
  2. Ayrımcılık için AUC
    1. Score (riskRegression package) işlevini kullanarak rakip risk modelinin tahmine dayalı performansını puanlayın.
      > fgr.w <- FGR(Hist(Survivalmonths, fstatus) ~ factor1+ factor2+..., data=Dataset, cause=1)
      > skor <- Score(list("Fine-Gray" = fgr.w),
    2. AUC'yi "puan" dan çıkarın.
      > puanı$AUC

4. Rakip risk modellerinin kalibrasyon kabiliyeti

  1. Rakip risk modelinin %95 güven aralığına sahip kalibrasyon eğrileri
    1. Belirli bir başarısızlık süresinde her bireyin kümülatif olaylarını içeren bir veri çerçevesi edinin.
      Örnek olarak 36. ay #Take cif36 <- data.frame(cif36) >.
      > ortak ad(cif36.36_o)<-c("36m")
    2. Kohortu tahmini kümülatif insidanslara göre beş alt gruba ayırın ve her bir alt grubun ortalama öngörülen kümülatif insidanslarını hesaplayın.
      > grubu36 <- kesim (cif36 $ '36 m',
      Kantil (cif36 $ '36m', seq (0, 1, 0.2)),
      include.en düşük = TRUE, etiketler = 1:5)
      > ortalama36 <- as.vector(by(cif36 $'36m', group36, ortalama))
    3. Gözlenen kümülatif insidansı, yani gerçek kümülatif insidansı, kiminc fonksiyonunu kullanarak hesaplayın ve ardından gözlemlenen kümülatif insidansı, belirli bir başarısızlık süresinde% 95'lik bir güven aralığıyla elde edin.
      > cum36 <- cuminc(Dataset$Survivalmonths,Dataset$fstatus,group36)
      > obs36 <- zaman noktaları(cum36,Veri Kümesi$Survivalmonths)$est[c(1:5),36]
      > obs36var <- timepoints(cum36,Dataset$Survivalmonths)$var[c(1:5),36]
      > DF <- data.frame(ortalama36, obs36, obs36var)
    4. Kalibrasyon eğrisini, ggplot fonksiyonunu kullanarak x ekseni olarak tahmin edilen kümülatif insidanslar ve y ekseni olarak gözlemlenen kümülatif insidanslarla çizin.
      > ggplot(df)+ geom_point(aes(x=ortalama36,y=obs36),col="kırmızı")+
      geom_point(AES(x=ortalama36,y=obs36),col="kırmızı",pch=4)+
      geom_line(col="kırmızı",AES(x=ortalama36,y=obs36))+
      geom_errorbar(col="kırmızı",aes(x=ortalama36,y=obs36+1.96
      *sqrt(obs36var)),
      ymin = obs36-1.96 * sqrt (obs36var), ymax = obs36 + 1.96
      *sqrt(obs36var))
      geom_abline(lty=3,lwd=2,col=c(rgb(0,118,192,
      maxColorValue=255)))
  2. Rakip risk modelinin risk puanları ile kalibrasyon eğrisi
    1. Tüm değişkenlerin her seviyesini değerlendirin ve toplam RS'yi elde edin.
      > Veri Kümesi$factor1[Veri Kümesi$faktör1==1] <- faktör1.scale["Factor1_level1"]
      >
      ... #For örnek, Dataset$histology[Dataset$histology==1]<-histology.scale["Histology1"]
      > Dataset$rs <- Dataset$factor1+Dataset$factor2+Dataset$factor3+...
      NOT: Her değişkenin puanlarını toplayarak her hasta için toplam RS'yi elde edin.
    2. Frekansları sayın ve farklı toplam risk puanlarının gözlemlenen kümülatif insidanslarını hesaplayın.
      > rs.freq <- as.data.frame(table(Dataset$rs))
      > obs.36 <- vektör(mode="sayısal", uzunluk=nrow(rs.freq))
      > için (i in 1: nrow(rs.freq)) {
      dataset <- subset(Dataset,Dataset$rs== rs.freq [i,1])
      cif.dataset <- cuminc(dataset$Survivalmonths,dataset$death3)
      cif36.dataset <- zaman noktaları(cif.dataset,36)
      obs.36[i] <- cif36.dataset$est[1]}
    3. X ekseninin aralığını ayarlayın ve toplam risk puanlarının tahmin edilen kümülatif insidanslarını hesaplayın.
      > RS <- aralığı(nom$total.points)
      > x.36 <- seq(min(RS),max(RS),0.01)
      > pre.36 <- 1-(1-cif.min36)^exp(x.36*maxbeta/100)
    4. Kalibrasyon eğrisini risk puanlarıyla çizin.
      > grafiği(x.36, pre.36, type='l'...)
      > par(new=TRUE)
      > arsa(as.vector(rs.freq[,1]), obs.36... )

5. Rakip risk modellerinin karar eğrisi analizi

  1. Karar eğrisi analizini gerçekleştirmek için stdca işlevini kaynaklayın.
    > kaynak("stdca. R")
  2. Hayatta kalma olasılığını hesaplamak için polinom denklemlerini nomogramdan çıkarın.
    > nomogramEx(nomo = nom)
    > Veri Kümesi$tahmincileri <- A * (Veri Kümesi$rs ^3) + B * (Veri Kümesi$rs ^2) + C * Veri Kümesi$rs + D
    #predictors, belirlenen nomogram tarafından hesaplanan kansere özgü ölüm olasılıklarının tahmin edilen olasılıklarıdır
  3. Karar eğrisi analizini gerçekleştirin.
    > stdca(data = Veri kümesi, result = "status", ttoutcome = "Survivalmonths", timepoint = 36,
    tahminciler = "öngörücüler", cmprsk = DOĞRU, pürüzsüz = YANLIŞ, olasılık = YANLIŞ)

    NOT: Rakip bir risk varlığında bir sonucu değerlendirmek için, cmprsk için TRUE seçilmelidir.

6. Bootstrap yöntemini kullanarak dahili doğrulama

  1. Bootstrap yöntemini kullanarak tahmin edilen ortalama kümülatif olayları elde edin.
    1. Bootstrap veri kümesini (Dataset_in) oluşturmak için özgün veri kümesini (Veri Kümesi) replace ile yeniden örnekleyin. Bootstrap veri kümesiyle rakip bir risk modeli (mod.in_crr) oluşturun. mod.in_crr tahmin etmek için predict.crr işlevini kullanın ve suvall.in oluşturmak için b zamanlarını döngüleyin.
      B=b
      suvall.in <- list()
      for(j in 1:B){
      Dataset_in <- Dataset[sample(c(1:nrow(Dataset)),nrow(Dataset),
      değiştir = TRUE),]
      Ekle (Dataset_ içinde)
      cov. <- model.matrix(~faktör1+ faktör2+...) [,-1]
      mod. içinde _crr <- crr(Survivalmonths, fstatus, failcode=1, cov1=cov.in)
      detach(Veri kümesi. iç)
      SUV. <- predict.crr (mod. in _crr, cov)
      suvall.in[[j]] <- suv.in}
    2. Belirli bir ayda tahmin edilen ortalama kümülatif olayları alın.
      CIF36ALL. <- vektör(mode="sayısal", uzunluk=nrow(Veri kümesi))
      for (k in 1:B) {
      CIF36ALL. İç<- CIF36ALL. iç + suvall. iç[[k]][hangi(suvall. iç[[k]][,1]==36),][-1]
      }
      cif36.in <- cif36all.in/B
  2. C-dizinini, rcorr.cens işleviyle dahili çapraz doğrulamayı kullanarak hesaplayın.
    RCORR. iç <- rcorr.cens(1-cif36.in,Surv(Veri Kümesi$Survivalmonths,Veri Kümesi$tümör ölümü))
    cindex. İç <- RCORR. iç[1]
  3. Çapraz dahili doğrulamayı kullanarak kalibre edin.
    NOT: İç doğrulamalı rakip risk modelinin kalibrasyon eğrisinin kodları, bölüm 4'teki kodlara benzerken, suv suv.in ile değiştirilmiştir.

7. Rakip risk modelinin harici olarak doğrulanması

  1. Dış verileri kullanarak tahmin edilen kümülatif olayları alın. Dış veri değişkenleri matrisi (cov.ex) ile tahmin edilen kümülatif olayları elde edin.
    suv.ex <- predict.crr(mod_crr,cov.ex)
    cif36.ex <- suv.ex [hangi(suv.ex $time=="36"),][-1]
  2. Harici doğrulama kullanarak C-indeksini hesaplayın.
    rcorr.ex <- rcorr.cens(1-cif36.ex,Surv(Dataset.ex$Survivalmonths,Dataset.ex$tumordeath))
    cindex.ex <- rcorr.ex[1]
  3. Harici doğrulama kullanarak kalibre edin.
    NOT: İç doğrulamalı rakip risk modelinin kalibrasyon eğrisinin kodları, bölüm 4'teki kodlara benzerken, suv, suv.ex ile değiştirilir.

Access restricted. Please log in or start a trial to view this content.

Sonuçlar

Bu çalışmada meme kanserli hastaların verileri SEER veri tabanından alınmış ve örnek veri olarak sunulmuştur. SEER veritabanı, Amerika Birleşik Devletleri nüfusunun yaklaşık% 34,6'sını temsil eden kanser hakkında veri sağlar ve veritabanına erişim izni alınmıştır (referans numarası 12296-Kasım 2018).

Her ikisi de histolojik tip, farklılaşmış derece, T evresi ve N evresini içeren iki nomogram (Şekil 1), sırasıyla direkt yöntem ve...

Access restricted. Please log in or start a trial to view this content.

Tartışmalar

Bu çalışmada iki farklı yöntemle oluşturulan rakip risk nomogramları karşılaştırılmış ve oluşturulan nomogramların değerlendirilmesi ve validasyonu yapılmıştır. Spesifik olarak, bu çalışma, doğrudan bir yönteme dayalı nomogramı oluşturmak, ayrıca C-indeksini hesaplamak ve kalibrasyon eğrilerini çizmek için adım adım bir öğretici sağlamıştır.

R yazılımındaki rms paketi, Cox orantılı tehlike modellerinin oluşturulması ve değerlendirilmesi...

Access restricted. Please log in or start a trial to view this content.

Açıklamalar

Yazarlar birbiriyle çelişen çıkarları olmadığını beyan ederler.

Teşekkürler

Çalışma, Zhejiang Eyaleti Tıp Bilimi ve Teknoloji Planı Projesi (hibe numaraları 2013KYA212), Zhejiang Eyaleti Doğa Bilimleri Vakfı'nın genel programı (hibe numarası Y19H160126) ve Jinhua Belediyesi Bilim ve Teknoloji Bürosu'nun kilit programından (hibe numarası 2016-3-005, 2018-3-001d ve 2019-3-013) hibelerle desteklenmiştir.

Access restricted. Please log in or start a trial to view this content.

Malzemeler

NameCompanyCatalog NumberComments
R softwareNoneNot ApplicableVersion 3.6.2 or higher 
Computer systemMicrosoft Windows 10 Windows 10 or higher

Referanslar

  1. Andersen, P. K., Gill, R. D. Cox's regression model for counting processes: A large sample study. The Annals of Statistics. 10 (4), 1100-1120 (1982).
  2. Lubsen, J., Pool, J., vander Does, E. A practical device for the application of a diagnostic or prognostic function. Methods of Information in Medicine. 17 (2), 127-129 (1978).
  3. Harrell, F. E., Lee, K. L., Mark, D. B. Multivariable prognostic models: Issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Statistics In Medicine. 15 (4), 361-387 (1996).
  4. Hung, H., Chiang, C. -T. Estimation methods for time-dependent AUC models with survival data. The Canadian Journal of Statistics / La Revue Canadienne de Statistique. 38 (1), 8-26 (2010).
  5. Moons, K. G. M., et al. Risk prediction models: I. Development, internal validation, and assessing the incremental value of a new (bio)marker. Heart. 98 (9), 683-690 (2012).
  6. Fu, J., et al. Real-world impact of non-breast cancer-specific death on overall survival in resectable breast cancer. Cancer. 123 (13), 2432-2443 (2017).
  7. Fine, J. P., Gray, R. J. A proportional hazards model for the subdistribution of a competing risk. Journal of the American Statistical Association. 94 (446), 496-509 (1999).
  8. Wu, L., et al. Establishing a competing risk regression nomogram model for survival data. Journal of Visualized Experiments. (164), e60684(2020).
  9. Zhang, Z., Geskus, R. B., Kattan, M. W., Zhang, H., Liu, T. Nomogram for survival analysis in the presence of competing risks. Annals of Translational Medicine. 5 (20), 403(2017).
  10. Zhang, Z. H., et al. Overview of model validation for survival regression model with competing risks using melanoma study data. Annals Of Translational Medicine. 6 (16), 325(2018).
  11. Newson, R. Confidence intervals for rank statistics: Somers' D and extensions. Stata Journal. 6 (3), 309-334 (2006).
  12. Davison, A. C., Hinkley, D. V., Schechtman, E. Efficient bootstrap simulation. Biometrika. 73 (3), 555-566 (1986).
  13. Roecker, E. B. Prediction error and its estimation for subset-selected models. Technometrics. 33 (4), 459-468 (1991).
  14. Steyerberg, E. W., Harrell, F. E. Prediction models need appropriate internal, internal-external, and external validation. Journal of Clinical Epidemiology. 69, 245-247 (2016).
  15. Zhang, Z., Chen, L., Xu, P., Hong, Y. Predictive analytics with ensemble modeling in laparoscopic surgery: A technical note. Laparoscopic, Endoscopic and Robotic Surgery. 5 (1), 25-34 (2022).

Access restricted. Please log in or start a trial to view this content.

Yeniden Basımlar ve İzinler

Bu JoVE makalesinin metnini veya resimlerini yeniden kullanma izni talebi

Izin talebi

Daha Fazla Makale Keşfet

Kanser Ara t rmalarSay 187Rakip risk modelinomogramayr mc l kkalibrasyonmodel do rulama

This article has been published

Video Coming Soon

JoVE Logo

Gizlilik

Kullanım Şartları

İlkeler

Araştırma

Eğitim

JoVE Hakkında

Telif Hakkı © 2020 MyJove Corporation. Tüm hakları saklıdır