RNA dizilimi için üç diferansiyel ifade çözümleme yöntemi:limma, EdgeR ve DESeq2. RStudio programını açın ve R dosyası OLAN DEG'leri yükleyin. Dosya ek dosyalardan edinilebilir. Bir.
Data.1.1'in indirilmesi ve önceden işlenmesi. Kanser Genom Atlası'ndan Kolanjiokarsinom'un yüksek verimli dizileme sayısı verilerini indirin. Bu sekme aşağıdaki kodla kolayca elde edilebilir.
R paketini yüklemek için Çalıştır'ı tıklatın. R paketini yüklemek için çalıştır'ı tıklatın. Çalışma dizinini ayarlayın.
Kanser türünü seçin. Verileri indirmek için GDCquery dosyasından R kodunu çalıştırın. Dosya GDCquery ek dosyalardan / komut dosyalarından edinilebilir.
Yürütmeden sonra, Cholangiocarcinoma RNA sıralama sayısı verileri indirilebilir ve satırların topluluk gen kimliklerini ve sütunların sembol kimliklerini temsil ettiği CNT olarak adlandırılabilir. Sembol kimliklerindeki 14 ila 15 numaralarına dikkat edin. Sayılar 01 ila 09 arasında değişmektedir ve 10 ila 19 normal dokuları gösterir.1.2.
Topluluk gen kimliklerinin gen sembollerine konuşulması. Ek açıklama dosyasını, depolama yoluna göre R'ye alın. Ek açıklama dosyası ek dosyalardan edinilebilir.
GTF v22 dosyasından R kodunu çalıştırın. Ek dosyalardan/ komut dosyalarından edinilebilir. Han"işlevini uygulayın ve topluluk gen kimliklerini gen sembollerine dönüştürmek için.1.3.
Düşük ekspresyonlu genleri filtreleyin. Paket edgeR'ı yüklemek için çalıştır'ı tıklatın R paketini yüklemek için çalıştır edgeR"En az iki örnekten birinden daha büyük milyon değer başına sayımlara sahip genleri tutmak için R kodunu takip ederek çalıştırın. İki. Limma aracılığıyla diferansiyel ifade analizi"R paketi limma yüklemek için Çalıştır'ı tıklatın"R paketi limma yüklemek için Çalıştır'ı tıklatın"edgeR"Tasarım matrisi oluşturmak için aşağıdaki R kodunu çalıştırın.
Grup bilgilerini ayıklayın. Tümör dokusu olarak 01"i ayarlayın. Normal doku olarak 11"i ayarlayın.
Tasarım matrisi oluşturun. DGEList nesnesini oluşturun. Verileri normalleştirin.
Limma eğilim yöntemi tabanlı diferansiyel ifade çözümlemesi gerçekleştirmek için aşağıdaki R kodunu çalıştırın. BGBM değerini hesaplayın. Verileri tahmin etmek veya değişkenler arasındaki ilişkiyi çıkarmak için doğrusal bir model sığdırmak için Çalıştır'ı tıklatın.
Bayesian'a göre T değerini, F değerini ve günlük oranlarını hesaplayın. Sonuçlar tablosunu ayıklayın. Diferansiyel ifade analizinin sonuçları log2 katlama değişim değerini içeren res_limma"'a kaydedilir.
Deneydeki genin ortalama log2 ifade düzeyi. Değiştirilmiş T istatistiği, P değeri, yanlış keşif oranı p değerini düzeltti ve farklı şekilde ifade edilen genlerin log-oranları. Farklı olarak ifade edilen genleri tanımlayın.
Yani 0,05'ten küçük ayarlanmış P değeri ve ikiden büyük veya ikiye eşit günlük yanlış değişiminin mutlak değeri, farklı olarak ifade edilen genleri taramak için eşiklerdir. Sonuçlar res limma, normal dokularla karşılaştırıldığında, 1.443 genin yukarı regüle edildiğini ve Cholangiocarcinoma dokularında 1.880 genin aşağı regüle edildiğini göstermektedir. Sonuç tablosunu bir dosyaya çıktısını verin.
R paketi ggplot2 yüklemek için Çalıştır'ı tıklayın"R paketi ggplot2'yi yüklemek için Çalıştır'ı tıklayın"Volkan arsasını oluşturmak için volkan dosyasından R kodunu çalıştırın ve dosya volkanı ek dosyalardan edinilebilir. Genler log2 kat değişimlerine ve ayarlanmış P değerlerine göre farklı konumlara eşlenebilir. Yani yukarı düzenlenmiş farklı ifade edilen genler kırmızı renktedir.
ve aşağı düzenlenmiş diferansially ekspresyon genleri yeşil renklendirilmiştir. Volkan arsasını kaydetmek için export"u tıklayın. Üç. edgeR ile diferansiyel ifade analizi"R paketi edgeR'ı yüklemek için Çalıştır'ı tıklatın"Tasarım matrisi oluşturmak için aşağıdaki R kodunu çalıştırın.
DGEList nesnesini oluşturmak ve verileri normalleştirmek için Çalıştır'ı tıklatın. Gen ifade değerinin dağılımını tahmin etmek için Çalıştır'ı tıklatın. Verileri saymak için modeli sığdırmak için Çalıştır'ı tıklatın.
İstatistiksel test yap. Sonuç tablosunu ayıklayın. Sonuç, günlük katlama değişim değerini, logBPM, F, p değerini ve yanlış bulma hızı düzeltilmiş p değerini içeren res edgeR'a kaydedilir.
Farklı olarak ifade edilen genleri tanımlayın. Sonuç res edgeR", normal dokularla karşılaştırıldığında, Cholangiocarcinoma dokularında 3.121 genin yukarı regüle edildiğini ve 1.578 genin aşağı regüle edildiğini göstermektedir. Sonuç tablosunu bir dosyaya çıktısını verin.
Volkan arsa oluşturun. Volkan arsasını kaydetmek için dışa aktar'ı tıklatın. Dört. DESeq2 aracılığıyla diferansiyel ifade analizi.
R paketini yüklemek için Çalıştır DESeq2'yi tıklatın"R paketini yüklemek için Çalıştır'ı tıklatın DESeq2"Sarkıntılık faktörünü belirlemek için aşağıdaki R kodunu çalıştırın. DESeq2 veri kümesi nesnesini oluşturun. Analiz yapın.
Sonuç tablosunu oluşturun. Sonuç, normalleştirilmiş okuma sayısının, log katlama değişim değerinin, log katlama değişim standart okunun, kaynak istatistiği, orijinal P değerinin ve düzeltilen P değerinin ortalamasını içeren res DESeq2'ye kaydedilir. DEG'leri tanımlayın.
Res DESeq2 sonucu, normal dokularla karşılaştırıldığında, iki bin dokuz yüz otuz sekiz genin yukarı doğru düzenlendiğini ve Cholangiocarcinoma dokularında bin altı yüz on altı genin aşağı doğru düzenlendiğini göstermektedir. Sonuç tablosunu bir dosyaya çıktısını verin. Volkan arsa oluşturun.
Volkan arsasını kaydetmek için dışa aktar'ı tıklatın. Beş. Venn diyagramı. R paketi venn diyagramını yüklemek için Çalıştır'ı tıklatın.
R paketi venn diyagramını yüklemek için Çalıştır'ı tıklatın. Yukarı düzenlenmiş farklılaştırılmış genlerin venn diyagramını yapın. Van diyagramını kaydetmek için dışa aktar'ı tıklatın, Aşağı düzenlenmiş farklı ifade edilen genlerin venn diyagramını yapın.
Venn diyagramını kaydetmek için dışa aktar'ı tıklatın. Altı. Temsili sonuçlar. Şekil 1, limma, edgeR ve DESeq2 tarafından elde edilen tüm genlerin volkan arazilerini göstermektedir.
Negatif günlük p değeri, günlük katlama değişikliğine karşı çizilir. Kırmızı noktalar yukarı doğru düzenlenmiş farklı olarak ifade edilen genleri, yeşil noktalar ise aşağı regüle edilmiş farklı olarak ifade edilen genleri temsil eder. Limma, cholangiocarcinoma dokularında bin sekiz yüz seksen aşağı düzenlenmiş farklılaştırılmış ve bin dört yüz kırk üç yukarı düzenlenmiş farklı olarak ifade edilen genleri tanımlar.
EdgeR, ayrı ayrı ifade edilen bin beş yüz yetmiş sekiz aşağı regüle edilmiş genleri ve üç bin yüz yirmi bir yukarı düzenlenmiş farklı olarak ifade edilen genleri tanımlar. DESeq2, bin altı yüz on altı aşağı düzenlenmiş farklı ifadeli genleri ve iki bin dokuz yüz otuz sekiz yukarı düzenlenmiş farklı olarak ifade edilen genleri tanımlar. Şekil iki, venn diyagramları limma edgeR ve DESeq2'den bölünen sonuçlar arasında çakışma gösterir.
Bu üç yöntemin sonuçlarını karşılaştırın, bin dört yüz otuz bir yukarı düzenlenmiş farklı ifade genleri ve bin beş yüz otuz bir aşağı düzenlenmiş farklı olarak ifade edilen genler üst üste binmektedir. Seven.Conclusion. Bu protokolde, R paketleri, limma, edgeR ve DESeq2 kullanarak yüksek bir sayım verisi dizisi için farklı ölçü analizi türlerinin ayrıntılı bir protokolünü sağladık. Üç yöntem, analizleri arasında benzer ve kadrolara sahiptir.
Ve sonra bu üç ilaçtan elde ettikleri kısmen üst üste biniyor. Her üç ilacın da kendi avantajları vardır. Ve seçim sadece verilerinizin zamanına bağlıdır.
Geçerli verilerim varsa, limma öncelikli olarak verilmelidir, ancak edgeR ve DESeq2'de nesil sıralama verileri tercih edilir.