Konak-patojen etkileşimlerini araştırmak için yüksek verimli transkriptom analizi protokolüne hoş geldiniz. Bu iletişim kuralı aşağıdaki adımlara ayrılmıştır. Düşük kaliteli okumaları filtrelemek ve ayrıca bağdaştırıcı dizilerini sıralama ve ek açıklamaları kaldırmak için kalite kontrolü, okumaları bir referans genomlarına eşlemeniz ve okumaları genlere açıklama eklemeniz gerekir.
Farklı olarak ifade edilen genleri tanımlayan ve aynı zamanda birlikte ifade modüllerini bulan istatistiksel ve birlikte ifade analizi. Potansiyel aykırı örnekleri bulmak için moleküler pertürbasyon analizi derecesi. Ve son olarak, farklı olarak ifade edilen genlerin biyolojik fonksiyonlarını belirlemek için fonksiyonel analiz.
Bu işlem hatlarını kullanan tüm araçlar bir Linux sistemine önceden yüklenmiş ve bir Docker kapsayıcısına kapsüllenmiştir. Plos Patojen'de grubumuz tarafından yayınlanan bir makaleden elde edilen bu protokolleri kullanan örnekler. Örnekler 20 sağlıklı insan ve Chikungunya virüsü ile enfekte olmuş 39 hastadan oluşmaktadır.
Kan örnekleri toplandı ve RNA dizilimi yapıldı. Docker'ı Windows sistemine yüklemek için şu adımları izlemeniz gerekir. Docker'ın resmi web sayfasına gidin ve Başlarken'e tıklayın.
Pencereler için Docker Desktop yükleyicisini bulun. Dosyayı indirin. Makinenize yerel olarak yükleyin.
Bu iki seçeneğin işaretli olduğundan emin olun. Programı yükledikten sonra, bu iletişim kuralı için Docker görüntüsünü indirir. Windows terminaline gidin.
Görüntüyü indirmek için komutları yürütün. Görüntüyü indirdikten sonra, dosyayı Docker masaüstünde görebilirsiniz ve bu görüntüden kapsayıcıyı başlatabiliriz. Yuvarlak düğmeyi tıklattıktan sonra, kapsayıcının adını tanımlamak ve yerel bilgisayarınızdaki bir klasörü Docker içindeki klasörle ilişkilendirmek için özgün parametreleri ve seçenekleri genişletmeniz gerekir.
Bundan sonra, kapsayıcıyı başlatmak için Çalıştır'ı tıklatın. Daha sonra Docker içindeki Linux sisteminde bulunan terminale erişebilirsiniz. Bash komutlarını yazın ve sonra bu iletişim kuralının tüm komutlarını yürütebilirsiniz.
İlk olarak, bu protokolün tüm araçlarını kullanılabilir hale getirmek için kaynağı yürütmeliyiz. Dizin komut dosyalarına erişmelisiniz. Transkriptomik analiz yapmak için önce referans genomu indirmeniz gerekir.
Bunun için aşağıdaki komutları yürütmeniz gerekir. Genom indirildikten sonra, genlerin ek açıklamalarını indirmeniz gerekir. Bunu yapmak için aşağıdaki komutları yazmanız gerekir.
Ardından, fastq dökümünü yapılandırmanız gerekir. Bu, örneklerin sıralama dosyalarını indirmenize olanak sağlar. Aşağıdaki komutları yazdıktan sonra, Araçlar seçeneğine gitmek ve seçenekler currents dizinini işaretlemek için Sekme düğmesini kullanmanız gerekir.
Kaydetmek için Sekme düğmelerini kullanın ve tamam. Ve sonra araçtan fastq-dump çıkın. Artık aşağıdaki komutları yazarak okumaların indirilmesini başlatabiliriz.
Kalite kontrolü oluşur ve sıralama okumalarında hata olasılığını grafiksel olarak değerlendirir. Bu adımda, bağdaştırıcılar gibi teknik sıraları da kaldırmanız gerekir. Kalite kontrol grafiklerini oluşturmak için FastQC programını çalıştırmanız gerekir.
Bağdaştırıcı sıralarını ve düşük kaliteli sıraları kaldırmak için aşağıdaki komutları yazmanız gerekir. Kaliteli okumalarla, okumaları referans genomuna eşlememiz gerekiyor. Haritalamadan sonra, genlere insan genlerine göre açıklama eklememiz ve sonra her insan geniyle eşleşen okuma sayısını saymamız gerekecek.
İlk adım, aşağıdaki komutu yazarak başvuru genomunu dizine almaktır. Ve sonra bu komutları yazıp okumaları insan genomuna eşleyeceğiz. Daha sonra, okumalara açıklama getiren komut dosyalarını çalıştırmalısınız.
Haritalama ve ek açıklama yapıldıktan sonra, ifadesi bir grupta diğerine kıyasla daha yüksek veya daha düşük olan genleri bulmaktan oluşan diferansiyel ifade analizini gerçekleştirebilirsiniz. Farklı şekilde ifade edilen genleri veya DEG'leri tanımlamak için aşağıdaki komutları çalıştırmanız gerekir. Bundan sonra, veri sonuçlarını Docker'dan yerel bilgisayarınıza aktarabilirsiniz.
Bunun için terminale gidin ve tüm sonuçları yerel bir klasöre kaydetmek için aşağıdaki komutları yazın. Kalan çözümlemeyi gerçekleştirmek için, dizin verilerinin tüm dosyalarını yerel bilgisayarınızdaki bir dizine de kopyalamanız gerekir. Yerel bilgisayarınızda, Verileri Docker'dan kaydettiğiniz dizinleri görebileceksiniz.
Gördüğünüz gibi, tüm kütüphanelere erişebilirsiniz. Kalite kontrol raporlarını içeren HTML dosyasını da açabilirsiniz. Farklı olarak ifade edilen genleri içeren bir dizine de erişebilirsiniz.
Ve bu dizinin içinde, bir grupta yukarı veya aşağı doğru kontrol edilen genleri görebileceğiniz volkan arazilerini bulacaksınız, bu durumda, Chikungunya virüsü ile enfekte olan hastalar sağlıklı kontrollere karşı. Bu protokolün kalan tüm adımları tarayıcınız kullanılarak web araçlarında yürütülecektir. Önce CEMiTool ile başlayalım.
Tarayıcıya gidin ve aşağıdaki adresi yazın. CEMiTool, kullanıcılar tarafından sağlanan ifade veri kümelerinden ortak ifade modüllerini tanımlar. Ana sayfada, menüye gidebilir ve Çalıştır düğmesine tıklayabilirsiniz.
Bu, ifade dosyasını karşıya yükleyebileceğiniz yeni bir sayfa açacaktır. Bu dosya yerel bilgisayarınızın dizin verilerindedir. Orada üç ifade dosyası göreceksiniz ve CEMiTool için kullanacağımız bir normalleşme çağrısı tmm.
Daha sonra protein-protein etkileşimlerini içeren dosya için aynı şey olan fenodata dosyasını seçmeniz ve son olarak gen kümelerini veya yolları içeren dosyayı yüklemeniz gerekir. Gen kümeleri dosyası, CEMiTool'un ortak ifade modülünün her biri için zenginleştirme analizi gerçekleştirmesini sağlar. Ardından, parametre bölümünü genişletmeli ve VST Uygula'yı tıklatmalısınız.
Bundan sonra, CEMiTool Çalıştır'ı tıklamanız yeterlidir. CEMiTool'u çalıştırdıktan sonra, 12 ortak ifade modülünin tanımlandığını göreceksiniz. Buraya tıklayarak, bu analizin tüm sonuçlarını indirebilirsiniz.
Bu protokolde kullanacağımız bir diğer araç MDP veya Moleküler Pertürbasyon Derecesidir. Tarayıcınız mdp.sysbio.tools yazın. MDP, her numunenin moleküler mesafesini bir örnek referans grubuna kıyasla hesaplar, bu durumda, sağlıklı kontroller, sadece potansiyel aykırı değerleri değil, aynı zamanda her numunenin bu gruba kıyasla ne kadar rahatsız olduğunu bulmak için.
Çalıştır sayfasında, düğmeyi tıklatıp dosyayı seçerek ifade dosyasını karşıya yükleyebilirsiniz. Ardından fenodata dosyasını yüklemeniz gerekir. Daha sonra hangi sütunun grup veya sınıf hakkındaki bilgileri içerdiğini ve sonra hangi sınıf veya grubun denetim grubuna karşılık geldiğini tanımlamanız gerekir.
Bundan sonra, sadece MDP çalıştırabilirsiniz. Çubuk grafik, örneklerin her biri için moleküler pertürbasyon derecesini bir çubuk olarak gösterir ve renkler farklı grupları temsil eder. Ve kutu çizimi, her noktada gördüğünüz aynı sonuçları görselleştirmenin başka bir yoludur, iki gruba göre ayrı farklı bir örnektir.
İşlevsel analizi gerçekleştirmek için Enrichr aracını kullanacağız. Bunun için, farklı olarak ifade edilen genlerin listesini seçmeniz, yukarı veya downregüle edilmiş olması ve Enrichr aracında bir giriş gen listesi olarak kullanmanız gerekir. Farklı sekmeler olduğunu göreceksiniz.
Tüm sonuçlar yerel bilgisayarınıza da indirilebilir. Transkriptom analizi için bilgisayar ortamı Docker platformuna yerleştirildi. Bu yaklaşım, Linux sistemiyle önceden deneyimi olmayan kullanıcıların bir terminal kullanmasına olanak tanır.
Bu kapsayıcıda, tüm çözümleme için gerekli olan veri kümesi ve komut dosyaları için önceden tanımlanmış bir klasör yapısı vardır. Boru hattında, kullanıcılar Chikungunya virüsü ile akut olarak enfekte olan 20 sağlıklı birey ve 39 hastanın kan transkriptom verilerini kullanacaklar. Sıralama platformu, DNA dizisini içeren bir dizi FASTQ dosyası döndürür, yani.
okur ve her nükleotid tabanı için ilişkili kalite. Phred kalite ölçeği, her taban için yanlış okuma olasılığını gösterir. Araçlar, örneklerden düşük kaliteli okumaları tanımlar ve kaldırır ve okuma eşleme olasılığını artırır.
Bu adımda, haritalama modülü, kurtarılan yüksek kaliteli okumalar, onları insan referans genomuna hizalamak için giriş olarak kullanılır. CEMiTool, birlikte ifade modüllerini tanımlar ve analiz eder. Aynı modüldeki genler birlikte ifade edilir, bu da veri kümelerinin örnekleri arasında benzer ifade kalıpları sergiledikleri anlamına gelir.
Ağ analizi, en bağlı genler, yani hub'lar hakkında bilgi sağlar. Bu genlerin isimleri ağda gösterilir.
Düğümlerin boyutu bağlantı derecesiyle orantılıdır. DEG analizinden elde edilen sonuçlar volkan arazilerinde özetlenmiştir. Pertürbasyonun moleküler derecesinin analizi, sağlıklı ve enfekte bireylerden gelen pertürbed örneklerin tanımlanmasına izin eder.
MDP, hangi örneklerin potansiyel biyolojik aykırılıklar olduğunu öne sürmemektedir. Bu örneklerin kaldırılması aşağı akış sonuçlarını etkileyecektir. Enrichr aracı ile AURA kullanılarak fonksiyonel bir zenginleştirme analizi yapılabilir.
Bu adımlar, farklı olarak ifade edilen birkaç genin ortak fonksiyonel rollerini ortaya çıkararak sonuçları yorumlamaya yardımcı olur. Çubuk grafiklerde gösterilen biyolojik süreç, p-değer sıralamasına göre en iyi 10 zenginleştirilmiş gen kümesidir. Sonuç olarak, bu protokoller RNA-Seq analizinin tüm adımlarını kapsar.
Boru hattı geliştirildi ve Docker adlı ticari olmayan sisteme kapsüllendi. Bir görüntüde ve bilim camiası için kullanılabilir hale getirildi. Kapsayıcı sistemi nedeniyle, tüm komut dosyaları ve araçlar tekrarlanabilirliği garanti etmek için aynı belirli sürüm altındadır.
Ayrıca biyoinformatik analizinin bazı bölümleri ücretsiz kullanıcı dostu web araçları ile gerçek gerçekleştirildi.