Bu protokol, diferansiyel ekleme bölgelerini, diferansiyel olarak eksprese edilen ekzonları ve poli (A) bölgelerini tanımlamak için adım adım bir iş akışı sağlayarak alternatif ekleme ve poliadenilasyon tarafından üretilen gen izoformlarının kapsamlı bir şekilde anlaşılmasını sağlar. Bu protokolün temel avantajı, alternatif eklemeyi incelemek için hem ekzon tabanlı hem de olay tabanlı yöntemleri değerlendirmesidir. Ayrıca alternatif poliadenilasyonu incelemek için ekzon bazlı yöntem uygular.
AS ve AP analizi için kodları ve notları içeren R Markdown dosyaları sağlanmıştır. R Markdown dosyasındaki adımları izlemeniz ve her adım için nota dikkatlice ulaşmanız önerilir. Limma'dan diffSplice kullanarak diferansiyel eklemeyi tanımlamak için R not defteri dosyasını izleyin.
Giriş dosyalarını metin makalesinde açıklandığı şekilde hazırlayın. Daha fazla ilerlemeden önce giriş dosyalarını hazırlamak için makaledeki bir ila üç arasındaki adımların sırayla takip edildiğinden emin olun. Gerekli kütüphaneleri yükleyerek başlayın.
Spesifik olmayan filtreleme gerçekleştirmek için, önce daha önce elde edilen okuma sayılarının matrisini ayıklayın ve satırların genleri ve sütunların örnekleri temsil ettiği edgeR paketinden DGEList işlevini kullanarak özelliklerin bir listesini oluşturun. Ardından, edgeR paketindeki BGBM işlevini kullanarak verileri ham ölçekten milyon başına sayıma dönüştürün ve ayarlanabilir bir eşiğin üzerinde sayımlara sahip ekzonları saklayın. Bu veri kümesi altı örnek içerir.
Bu nedenle, BGBM birden büyük ve altıdan en az üç örnek olarak ayarlanır. M değerlerinin Kırpılmış Ortalama değerini kullanarak edgeR paketinden calcNormFactors işleviyle numuneler arasındaki sayımları normalleştirin. Bu işlev, kitaplık boyutlarını ayarlamak için ölçeklendirme faktörlerini hesaplar.
Her numunenin deneysel koşullarını tanımlamak üzere tasarım matrisini oluşturmak için önceden oluşturulmuş örnek tabloyu kullanın. Varyansı tahmin etmek üzere RNA dizileme verilerini işlemek için limma paketinin voom işlevini çalıştırın. Bu işlev, Poisson sayım gürültüsünü düzeltmek için hassas ağırlıklar üretecek ve ekzon seviyesi sayımlarını milyonda iki sayım veya logCPM günlüğe kaydedecek şekilde dönüştürecektir.
Doğrusal modelleri her ekzonun ifade verilerine sığdırmak için lmfit işlevini çalıştırın. Ardından, diferansiyel ekzon ifadesini algılamak üzere takılan modelin ampirik tabanlı istatistiklerini hesaplamak için eBayes işlevini çalıştırın. İlgilenilen deneysel karşılaştırmalar için bir kontrast matrisi tanımlayın.
Kontrastları kullanın. Her bir karşılaştırma çifti için katsayılar ve standart hatalar elde etmek için fit işlevi. Vahşi tip ve nakavt arasındaki genlerin ekzon kullanımındaki farklılıkları test etmek için takılı modelde diffSplice çalıştırın.
T'ye eşit bir testin AS ekzonların sıralamasını verdiği ve simelere eşit testin genlerin bir sıralamasını verdiği topSplice işlevini kullanarak en üst sıradaki sonuçları keşfedin. Sonuçları çizmek için plotSplice işlevini çalıştırın. İlgilenilen geni gen kimliği argümanına koyarken, kırmızı noktalar farklı şekilde ifade edilen ekzonları gösterir.
Farklı şekilde ifade edilen ekzonları sergilemek için EnhancedVolcano biyoiletken paketini kullanarak bir volkan grafiği oluşturun. rMATS'ı kullanmak için, rMATS sürüm 4.1.1'in en son sürümünün çalışma dizininde conda veya GitHub kullanılarak yüklendiğinden emin olun. Eşlemeden sonra elde edilen bam dosyalarını içeren klasöre gidin.
Metin dosyalarını, bam dosyalarının adını ve virgülle ayrılmış yollarını kopyalamanın iki koşulu için rMATS'ın gerektirdiği şekilde hazırlayın. Ramas çalıştırın. py, bam dosyalarının yolunu ve ek açıklamayı açıklayan iki oluşturulan giriş metni dosyasını kullanarak.
gtf dosyası daha önce elde edilmiştir. Bu, rmats_out her ekleme olayı için ayrı ayrı P değerleri ve ekleme düzeyleri dahil olmak üzere istatistikleri açıklayan metin dosyalarını içeren bir çıktı klasörü oluşturur. rMATS sonuçlarını keşfetmek için biyoiletken paket maserini kullanın.
Kavşak ve ekzon sayma metin dosyalarını JCEC uzantısıyla maser nesnesine yükleyin ve sonucu kapsama alanına göre filtrelemek için ekleme olayı başına en az beş ortalama okuma ekleyin. rMATS sonuçlarını görselleştirmek için, önce maser paketinden topEvents işlevini çalıştırın, önemli ekleme olaylarını %10'luk yanlış bulma oranında ve PSI veya PSI içine eklenmiş yüzde olarak en az %10'luk bir değişiklikle seçin. İlgilenilen bireysel genler için gen olaylarını kontrol edin ve bu genin her bir ekleme olayı için PSI değerlerini çizin.
Olay türünü belirterek bir volkan grafiği oluşturun. rmats2sashimiplot paketini kullanarak sashimi grafikleri oluşturmak için rMATS ile elde edilen ekleme olayları sonuçlarını metin dosyaları biçiminde kullanın. Sashimi komplosu, Wnk1 geninde atlanan bir ekzon olayını göstermektedir.
Her satır bir RNA-seq örneğini, vahşi tipte üç kopyayı ve Mbnl1 nakavtını temsil eder. Yükseklik, RPKM cinsinden okuma kapsamını gösterir ve bağlantı yayları, ekzonlar boyunca kavşak okumalarını gösterir. Alt kısımda açıklamalı gen modeli alternatif izoformları gösterilmektedir.
DiffSplice ve DEXSeq kullanılarak elde edilen volkan arazilerinin sol üst veya sağ kadranlarında bulunan genlerde önemli bir kıvrım değişimi ve gerçek farklılıkların güçlü istatistiksel kanıtları gözlemlenebilir. Bir kaset ekzonunun, Wnk1 geni için farklı koşullar arasında değiştiği bulundu. Diferansiyel ekzon kullanım grafiği, Wnk1.6.45 yakınlarındaki beş ekzon bölgesinde diferansiyel ekleme kanıtı gösterdi ve pembe renkle vurgulanan ekzonların vahşi tipe kıyasla Mbnl1 nakavt örneklerinde eklenmesi muhtemeldi.
Alternatif olarak eklenen genlerin volkan grafiği, vahşi tipten dışlanan genler ile vahşi tipe dahil edilenler arasında ayrım yapılmasına yardımcı oldu. SE, A5SS, A3SS, MXE ve RI ekleme olaylarının türleri, bu olayların en önemli genlerinin sashimi grafikleri kullanılarak görselleştirildi. Genlerin üç ana çevrilmemiş bölgesindeki diferansiyel APA aktivitesi, volkan grafikleri kullanılarak gözlendi.
Farklı işlem hatlarından elde edilen önemli ölçüde diferansiyel PA sahası kullanım sonuçları, olay grafiği kullanılarak görselleştirildi. Çift nakavtlarda PA bölgesi kullanımının önemli bir distal ila proksimal kayması hem FOSL1 hem de Papola genlerinde gözlenebilir. Genom çapında bilinen PA bölünme bölgelerine demirlenmiş yan bölgelerdeki ortalama kapsama alanı, tanısal bir grafik kullanılarak belirlendi.
Transspesifik bilgiler ve çoklu örtüşmeye izin verme gibi parametrelerin sayım metrikleri oluşturulurken doğru kullanıldığından emin olun. Doğrusal modelin takılması ve kontrast çiftlerinin oluşturulması, doğru karşılaştırma için önemlidir. rMATS için, komutu çalıştırmadan önce tüm parametrelerin verilerinize göre doğru ayarlandığından emin olun.
Diferansiyel ekleme aktivitesinden elde edilen genler, gen seti zenginleştirme analizi yapmak için kullanılabilir. MISO adı verilen başka bir araç, daha fazla olay tabanlı analiz için kullanılabilir.