Konak-Patojen Etkileşimlerini Araştırmak için Yüksek Verimli Transkriptom Analizi

André Nicolau Aquime Gonçalves; Vanessa Escolano Maso; Ícaro Maia Santos de Castro; Amanda Pereira Vasconcelos; Rodrigo Luiz Tomio Ogava; Helder I Nakaya

doi:10.3791/62324

Bu içeriği görüntülemek için JoVE aboneliği gereklidir. Oturum açın veya ücretsiz deneme sürümünü başlatın.

Bu Makalede

Özet
Özet
Giriş
Protokol
Sonuçlar
Tartışmalar
Açıklamalar
Teşekkürler
Malzemeler
Referanslar
Yeniden Basımlar ve İzinler

Özet

Burada sunulan protokol, RNA dizilimi transkriptom verilerini ham okumalardan fonksiyonel analize analiz etmek için kalite kontrolü ve gelişmiş istatistiksel analitik yaklaşımlara yönelik ön işleme adımları da dahil olmak üzere eksiksiz bir işlem hattını açıklar.

Özet

Patojenler çok çeşitli bulaşıcı hastalıklara neden olabilir. Konağın enfeksiyona yanıt olarak indüklediği biyolojik süreçler hastalığın şiddetini belirler. Bu tür süreçleri incelemek için araştırmacılar, konak transkriptomunun enfeksiyon, klinik sonuçlar veya hastalık şiddetinin farklı aşamalarında dinamik değişikliklerini ölçen yüksek verimli sıralama tekniklerini (RNA-seq) kullanabilirler. Bu araştırma, hastalıkların daha iyi anlaşılmasının yanı sıra potansiyel ilaç hedeflerini ve tedavilerini ortaya çıkarmaya yol açabilir. Burada sunulan protokol, RNA sıralama verilerini ham okumalardan işlevsel analize analiz etmek için tam bir işlem hattını açıklar. İşlem hattı beş adıma ayrılmıştır: (1) verilerin kalite kontrolü; (2) genlerin haritalanması ve ek açıklaması; (3) farklı ifade edilen genleri ve birlikte ifade edilen genleri tanımlamak için istatistiksel analiz; (4) numunelerin pertürbasyonunun moleküler derecesinin belirlenmesi; ve (5) fonksiyonel analiz. Adım 1, aşağı akış analizlerinin kalitesini etkileyebilecek teknik yapıtları kaldırır. 2. adımda genler standart kütüphane protokollerine göre eşlenir ve açıklama eklenir. 3. adımdaki istatistiksel analiz, enfekte olmayanlara kıyasla, enfekte örneklerde farklı olarak ifade edilen veya birlikte ifade edilen genleri tanımlar. Örnek değişkenliği ve potansiyel biyolojik aykırılıkların varlığı, 4. Son olarak, 5. Sunulan boru hattı, araştırmacıları konak-patojen etkileşim çalışmalarından elde edilen RNA-seq veri analizi yoluyla desteklemeyi ve enfeksiyonların moleküler mekanizmasını anlamak için gerekli olan gelecekteki in vitro veya in vivo deneyleri yönlendirmeyi amaçlamaktadır.

Giriş

Dang humması, sarıhumma, chikungunya ve zika gibi arbovirüsler, çeşitli endemik salgınlarla yaygın olarak ilişkilendirilmiştir ve son on yıllarda insanlara bulaştırmaktan sorumlu ana patojenlerden biri olarak ortaya ^{çıkmıştır1,2}. Chikungunya virüsü (CHIKV) ile enfekte olan bireylerde sıklıkla ateş, baş ağrısı, döküntü, poliartralji ve ^artrit3,4,5 vardır. Virüsler hücrenin gen ekspresyonunu alt edebilir ve çeşitli konak sinyal yollarını etkileyebilir. Son zamanlarda, kan transkriptom çalışmaları, ^iyileşme6 veya sağlıklı kontrollerle karşılaştırıldığında akut CHIKV enfeksiyonu ile ilişkili farklı olarak ifade edilen genleri (DEG' ler) tanımlamak için RNA-seq'i ^{kullanmıştır7}. CHIKV ile enfekte olmuş çocuklarda, viral RNA için hücresel sensörler, JAK/STAT sinyali ve toll benzeri reseptör sinyal yolları6 gibi doğuştan gelen bağışıklıkta yer alan yukarı düzenlenmiş genler ^vardı6. CHIKV ile akut olarak enfekte olan yetişkinler de monositler ve dendritik hücre aktivasyonu ile ilgili olanlar ve antiviral yanıtlar gibi doğuştan gelen bağışıklıkla ilgili genlerin indüksiyonunu ^gösterdi7. Aşağı düzenlenmiş genlerle zenginleştirilmiş sinyal yolları, T hücre aktivasyonu ve T ve B hücrelerinde farklılaşma ve zenginleştirme gibi uyarlanabilir bağışıklıkla ilgili olanları ^içeriyordu7.

Konak ve patojen genlerinin transkriptom verilerini analiz etmek için çeşitli yöntemler kullanılabilir. Genellikle, RNA-seq kütüphane hazırlığı olgun poli-A transkriptlerinin zenginleştirilmesi ile başlar. Bu adım ribozomal RNA'nın (rRNA) çoğunu ve bazı durumlarda viral/bakteriyel RNA'ları giderir. Bununla birlikte, biyolojik soru patojen transkript tespitini içerdiğinde ve RNA önceki seçimden bağımsız olarak sıralandığında, sıralama ile diğer birçok farklı transkript tespit edilebilir. Örneğin, subgenomik mRNA'ların hastalıkların şiddetini doğrulamak için önemli bir faktör olduğu ^{gösterilmiştir8}. Ek olarak, CHIKV ve SARS-CoV-2 gibi bazı virüsler için, poli-A zenginleştirilmiş kütüphaneler bile aşağı akış analizlerinde kullanılabilecek viral okumalar ^{oluşturur9,10}. Konak transkriptom analizine odaklandıklarında, araştırmacılar örnekler arasındaki biyolojik pertürbasyonu araştırabilir, farklı olarak ifade edilen genleri ve zenginleştirilmiş yolları tanımlayabilir ve ortak ifade modülleri oluşturabilir7,11,12. Bu protokol, CHIKV ile enfekte olmuş hastaların ve sağlıklı bireylerin farklı biyoinformatik yaklaşımlar kullanılarak yapılan transkriptom analizlerini vurgulamaktadır (Şekil 1A). Daha önce yayınlanan bir çalışmadan elde edilen ^veriler7, temsili sonuçları oluşturmak için 20 sağlıklı ve 39 CHIKV akut enfekte bireyden oluşan bir çalışmadan kullanıldı.

Protokol

Bu protokolde kullanılan örnekler, hem São Paulo Üniversitesi Biyomedikal Bilimler Enstitüsü Mikrobiyoloji Bölümü hem de Sergipe Federal Üniversitesi etik kurulları tarafından onaylanmıştır (Protokoller: 54937216.5.0000.5467 ve 54835916.2.0000.5546).

1. Docker masaüstü kurulumu

NOT: Docker ortamını hazırlama adımları işletim sistemleri (işletim sistemleri) arasında farklıdır. Bu nedenle, Mac kullanıcıları 1.1 olarak listelenen adımları izlemeli, Linux kullanıcıları 1.2 olarak listelenen adımları izlemeli ve Windows kullanıcıları 1.3 olarak listelenen adımları izlemelidir.

MacOS'a yükleyin.
1. Docker web sitesine (Malzeme Tablosu) erişin, Mac için Docker Desktop'a tıklayın ve ardından Docker Hub'dan İndir bağlantısına tıklayın.
2. Docker Al düğmesine tıklayarak yükleme dosyasını indirin.
3. Yükleyiciyi açmak için Docker.dmg dosyasını yürütün ve simgeyi Uygulamalar klasörüne sürükleyin. Programı başlatmak için Uygulamalar klasöründeki Docker.app yerelleştirin ve yürütün.
  NOT: Üst durum çubuğundaki yazılıma özgü menü, yazılımın çalıştığını ve bir terminalden erişilebildiğini gösterir.
Kapsayıcı programını Linux işletim sistemine yükleyin.
1. Docker Linux web sitesine (Malzeme Tablosu) erişin ve Docker Linux Deposu bağlantısında bulunan depo bölümünü kullanarak yükleme talimatlarını izleyin.
2. Komut satırını kullanarak tüm Linux paketlerini güncelleştirin:
  sudo apt-get güncelleştirmesi
3. Gerekli paketleri Docker'a yükleyin:
  sudo apt-get install apt-transport-https ca-certificates curl gnupg lsb-release
4. Yazılım arşivi anahtarlık dosyası oluşturma:
  kıvrılma -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg
5. Kaynak.list dosyasına Docker deb bilgilerini ekleyin:
  echo "deb [arch=amd64 signed-by=/usr/share/keyrings/docker-archive-keyring.gpg] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null
6. Son eklenenler de dahil olmak üzere tüm paketleri yeniden güncelleştirin:
  sudo apt-get güncelleştirmesi
7. Masaüstü sürümünü yükleyin:
  sudo apt-get docker-ce docker-ce-cli containerd.io
8. Yükleme işlemini tamamlamak için coğrafi bölgeyi ve saat dilimini seçin.
Kapsayıcı programını Windows işletim sistemine yükleyin.
1. Docker web sitesine (Malzeme Tablosu) erişin ve Başlarken'e tıklayın. Windows için Docker Desktop yükleyicisini bulun. Dosyaları indirin ve bilgisayara yerel olarak yükleyin.
2. karşıdan yüklemeden sonra yükleme dosyasını başlatın (.exe) ve varsayılan parametreleri saklayın. WSL 2 için Gerekli Windows Bileşenlerini Yükle ve Masaüstüne Kısayol Ekle seçeneklerinin işaretli olduğundan emin olun.
  NOT: Bazı durumlarda, bu yazılım hizmeti başlatmaya çalıştığında bir hata gösterir: WSL yüklemesi tamamlanmadı. Bu hatayı çözmek için WSL2-Kernel (Malzeme Tablosu) web sitesine erişin.
3. En son WSL2 Linux çekirdeğini indirip yükleyin.
4. PowerShell terminaline Yönetici olarak erişin ve komutu yürütün:
  dism.exe /online /enable-feature /featurename:Microsoft-Windows-Alt Sistem-Linux /all /norestart
5. Docker Desktop yazılımının başarıyla yüklendiğinden emin olun.
Görüntüyü Docker hub'ındaki (Malzeme Tablosu) CSBL deposundan indirin.
1. Docker Masaüstü'nü açın ve durumun araç çubuğunun sol alt kısmında "çalıştığını" doğrulayın.
2. Windows PowerShell terminal komut satırına gidin. Bu protokol için Linux Container görüntüsünü Docker hub'ındaki CSBL deposundan indirin. Yansımayı karşıdan yüklemek için aşağıdaki komutu yürütün:
  docker çekme csblusp/transcriptome
  NOT: Görüntüyü indirdikten sonra, dosya Docker Masaüstü'nde görülebilir. Kapsayıcıyı oluşturmak için Windows kullanıcılarının 1.5 adımını, Linux kullanıcılarının ise 1.6 adımını izlemesi gerekir.
Windows işletim sistemi üzerinde sunucu kapsayıcısını başlatın.
1. Masaüstü Uygulama yöneticisindeki Docker görüntü dosyasını Araç Çubuğu'ndan görüntüleyin ve Görüntüler sayfasına erişin.
  NOT: ardışık düzen görüntüsü başarıyla indirildiyse, kullanılabilir bir csblusp/transcriptome görüntüsü olacaktır.
2. Çalıştır düğmesine tıklayarak kapsayıcıyı csblusp/transcriptome görüntüsünden başlatın. Kapsayıcıyı yapılandırmak için İsteğe Bağlı Ayarlar'ı genişletin.
3. Kapsayıcı Adını tanımlayın (örneğin, sunucu).
4. Yerel bilgisayardaki bir klasörü docker içindeki klasörle ilişkilendirin. Bunu yapmak için Ana Bilgisayar Yolu'nu belirleyin. Sonunda karşıdan yüklenecek işlenmiş verileri depolamak için yerel makinede bir klasör ayarlayın. Kapsayıcı Yolunu ayarlayın. Csblusp/transcriptome kapsayıcı klasörünü tanımlayın ve yerel makine yoluna bağlayın (Kapsayıcı Yolu için "/opt/transferdata" adını kullanın).
5. Bundan sonra, csblusp/transcriptome kapsayıcısını oluşturmak için Çalıştır'ı tıklatın.
6. Linux terminaline csblusp/transcriptome kapsayıcısından erişmek için CLI düğmesine tıklayın.
7. Daha iyi bir deneyim yaşamak için bash terminaline yazın. Bunun için komutu yürütün:
  bash
8. Bash komutunu yürüttükten sonra, terminalin gösterdiğinden emin olun (root@:/#):
  root@ac12c583b731:/ #
Linux işletim sistemi için sunucu kapsayıcısını başlatın.
1. Görüntüyü temel alan Docker kapsayıcısını oluşturmak için bu komutu yürütün:
  docker run -d -it --rm --name server -v :/opt/transferdata csblusp/transcriptome
  NOT: : yerel klasör makinesinin bir yolunu tanımlayın.
2. Docker kapsayıcısının komut terminaline erişmek için bu komutu yürütün:
  docker exec -it sunucu bash
3. Komut satırını kullanarak herhangi bir program/komut dosyası yürütmek için bir Linux terminalinin kullanılabilirliğini sağlayın.
4. Bash komutunu yürüttükten sonra, terminalin gösterdiğinden emin olun (root@:/#):
  root@ac12c583b731:/ #
  NOT: Kök parola varsayılan olarak "transkriptome" dir. İsterseniz, kök parola komut çalıştırılarak değiştirilebilir:
  passwd
5. İlk olarak, tüm araçların kullanılabilir olduğundan emin olmak için addpath.sh kaynak komutunu çalıştırın. Komutu yürütün:
  kaynak /opt/addpath.sh
RNA sıralama klasörünün yapısını denetleyin.
1. Transcriptome ardışık düzen komut dosyaları klasörüne erişin ve RNA diziliminden gelen tüm verilerin klasörün içinde depolandığından emin olun: /home/transcriptome-pipeline/data.
2. Analizden elde edilen tüm sonuçların /home/transcriptome-pipeline/results yolunun klasöründe depolandığından emin olun.
3. Genom ve ek açıklama başvuru dosyalarının /home/transcriptome-pipeline/datasets yolunun klasöründe depolandığından emin olun. Bu dosyalar tüm analizleri desteklemeye yardımcı olacaktır.
4. Tüm komut dosyalarının /home/transcriptome-pipeline/scripts yolunun klasöründe depolandığından ve aşağıda açıklandığı gibi her adımla ayrıldığından emin olun.
Ek açıklamayı ve insan genomunu indirin.
1. Komut dosyaları klasörüne erişin:
  cd /home/transcriptome-pipeline/scripts
2. Referans insan genomunu indirmek için bu komutu yürütün:
  bash downloadGenome.sh
3. Ek açıklamayı karşıdan yüklemek için komutu yürütün:
  bash downloadAnnotation.sh
Başvuru genomunun ek açıklamalarını veya sürümünü değiştirin.
1. Her dosyanın URL'sini değiştirmek için downloadAnnotation.sh ve downloadGenome.sh açın.
2. downloadAnnotation.sh ve downloadGenome.sh dosyalarını aktarım alanına kopyalayın ve yerel işletim sistemi içinde düzenleyin.
  cd /home/transcriptome-pipeline/scripts
  cp downloadAnnotation.sh downloadGenome.sh /opt/transferdata
3. 1.5.4. adımda ana bilgisayar ve Docker kapsayıcısı arasında bağlantı sağlamak için seçilen Ana Bilgisayar Yolu klasörünü açın.
4. Tercih edilen düzenleyici yazılımını kullanarak dosyaları düzenleyin ve kaydedin. Son olarak, değiştirilen dosyaları komut dosyası klasörüne koyun. Komutu yürütün:
  cd /opt/transferdata
  cp downloadAnnotation.sh downloadGenome.sh /home/transcriptome-pipeline/scripts
  NOT: Bu dosyalar doğrudan vim veya nano Linux editörü kullanılarak düzenlenebilir.
Ardından, fastq-dump aracını komut satırıyla yapılandırın:
vdb-config --etkileşimli
NOT: Bu, örnek verilerden sıralama dosyalarının indirilmesine izin verir.
1. Sekme tuşunu kullanarak Araçlar sayfasında gezinin ve geçerli klasör seçeneğini belirleyin. Kaydet seçeneğine gidin ve Tamam'ı tıklatın. Ardından, fastq-dump aracından çıkın .
Okumaların indirilmesini daha önce ^{yayımlanmıştır7}. Her örneğin SRA katılım numarası gereklidir. SRA numaralarını SRA NCBI web sitesinden (Malzeme Tablosu) alın.
NOT: Ortak veritabanlarında bulunan RNA-Seq verilerini çözümlemek için 1.12 adımını izleyin. Özel RNA-seq verilerini çözümlemek için 1.13 adımını izleyin.
Belirli genel verileri analiz edin.
1. Ulusal Biyoteknoloji Bilgileri Merkezi (NCBI) web sitesine erişin ve belirli bir konu için anahtar kelimeler arayın.
2. Genomlar bölümünde bioproject için sonuç bağlantısına tıklayın.
3. Belirli bir çalışmayı seçin ve tıklayın. SRA Deneyleri'ne tıklayın. Bu çalışma için mevcut tüm örnekleri gösteren yeni bir sayfa açılır.
4. Katılım numarasının üstündeki "Gönder:" üzerine tıklayın. "Hedef Seç" seçeneğinde Dosya ve Biçim seçeneğini belirleyin, RunInfo'yı seçin. Tüm kitaplık bilgilerini vermek için "Dosya Oluştur" u tıklayın.
5. SraRunInfo.csv dosyasını 1.5.4 adımında tanımlanan Ana Bilgisayar yoluna kaydedin ve indirme komut dosyasını yürütün:
  cp /opt/transferdata/SraRunInfo.csv /home/transcriptome-pipeline/data
  cd /home/transcriptome-pipeline/scripts
  bash downloadAllLibraries.sh
Özel ve yayımlanmamış sıralama verilerini çözümleme.
1. Sıralama verilerini Reads adlı bir klasörde düzenleyin.
  NOT: Okur klasörünün içinde, her örnek için bir klasör oluşturun. Bu klasörler her örnek için aynı ada sahip olmalıdır. Her örneğin verilerini dizinine ekleyin. Eşleştirilmiş uç RNA-Seq olması durumunda, her örnek dizin sırasıyla {sample}_1.fastq.gz ve {sample}_2.fastq.gz, forward ve reverse sequences desenlerine göre biten adları sunması gereken iki FASTQ dosyası içermelidir. Örneğin, "Healthy_control" adlı bir örneğin aynı ada sahip bir dizini ve Healthy_control_1.fastq.gz ve Healthy_control_2.fastq.gz adlı FASTQ dosyaları olmalıdır. Bununla birlikte, kitaplık sıralaması tek uçlu bir stratejiyse, aşağı akış analizi için yalnızca bir okuma dosyası kaydedilmelidir. Örneğin, aynı örnek olan "Sağlıklı denetim", Healthy_control.fastq.gz adlı benzersiz bir FASTQ dosyasına sahip olmalıdır.
2. Tüm örnek adları içeren bir fenotipik dosya oluşturun: İlk sütunu 'Örnek', ikinci sütunu 'Sınıf' olarak adlandırın. Örnek sütunu, örnek dizinler için aynı ad olması gereken örnek adlarla doldurun ve Sınıf sütununu her örneğin fenotipik grubuyla (örneğin, kontrol veya virüslü) doldurun. Son olarak, "metadata.tsv" adlı bir dosyayı kaydedin ve /home/transcriptome-pipeline/data/ dizinine gönderin. Fenotipik dosyanın biçimini anlamak için varolan meta veri.tsv dosyasına göz atın.
  cp /opt/transferdata/metadata.tsv
  /home/transcriptome-pipeline/data/metadata.tsv
3. 1.5.4. adımda tanımlanan Ana Bilgisayar Yolu dizinine erişin ve yeni yapılandırılmış dizin örneklerini kopyalayın. Son olarak, örnekleri /opt/transferdata'dan işlem hattı veri dizinine taşıyın.
  cp -rf /opt/transferdata/reads/*
  /home/transcriptome-pipeline/data/reads/
Tüm okumaların /home/transcriptome-pipeline/data/reads klasöründe depolandığını gözlemleyin.

2. Verilerin kalite kontrolü

NOT: Sıralama okumalarındaki hata olasılığını grafiksel olarak değerlendirin. Adaptörler gibi tüm teknik dizileri kaldırın.

FastQC aracıyla kitaplıkların sıralama kalitesine erişin.
1. Kalite grafiklerini oluşturmak için fastqc programını çalıştırın. Komutu yürütün:
  bash FastQC.sh
  NOT: Sonuçlar /home/transcriptome-pipeline/results/FastQC klasörüne kaydedilecektir. Sıra bağdaştırıcıları kitaplık hazırlama ve sıralama için kullanıldığından, bazı durumlarda bağdaştırıcılar dizisinin parçaları eşleme işlemini engelleyebilir.
Bağdaştırıcı sırasını ve düşük kaliteli okumaları kaldırın. Komut Dosyaları klasörüne erişin ve Trimmomatic aracının komutunu çalıştırın:
cd /home/transcriptome-pipeline/scripts
bash trimmomatic.sh
NOT: Filtreyi sıralamak için kullanılan parametreler şunlardır: Önde gelen düşük kaliteyi veya 3 tabanı (kalitenin altında 3) çıkarın (LEADING:3); Takip eden düşük kaliteyi veya 3 tabanı (kalitenin altında 3) çıkarın (TRAILING:3); Taban başına ortalama kalite 20'nin altına düştüğünde keserek 4 tabanlı geniş sürçme penceresiyle okumayı tarayın (SLIDINGWINDOW:4:20); ve Drop 36 taban uzunluğundaki (MINLEN:36) altında okur. Bu parametreler Trimmomatic komut dosyası düzenlenerek değiştirilebilir.
1. Sonuçların aşağıdaki klasöre kaydedildiğine emin olun: /home/transcriptome-pipeline/results/trimreads. Komutu yürütün:
  ls /home/transcriptome-pipeline/results/trimreads

3. Örneklerin haritalanması ve ek açıklaması

NOT: Kaliteli okumalar elde edildikten sonra, bunların referans genomla eşlenilmesi gerekir. Bu adım için, ÖRNEK örnekleri eşlemek için STAR eşleyicisi kullanıldı. STAR eşleyici aracı, okuma ve genom eşlemesini yüklemek ve yürütmek için 32 GB RAM bellek gerektirir. 32 GB RAM belleği olmayan kullanıcılar için önceden eşlenmiş okumalar kullanılabilir. Bu gibi durumlarda adım 3.3'e atlayın veya Bowtie2 eşleyiciyi kullanın. Bu bölümde STAR (tüm rakamlarla gösterilen sonuçlar) ve Bowtie2 (düşük bellekli gerekli eşleyici) için komut dosyaları vardır.

İlk olarak haritalama işlemi için referans genomun dizinini İndeksleyin:
1. Komut satırını kullanarak Komut Dosyaları klasörüne erişin:
  cd /home/transcriptome-pipeline/scripts
2. STAR eşleyici için yürütün:
  bash indexGenome.sh
3. Bowtie eşleyici için yürütün:
  bash indexGenomeBowtie2.sh
Filtre uygulanmış okumaları (adım 2'den elde edilen) başvuru genomuna (GRCh38 sürümü) eşlemek için aşağıdaki komutu yürütün. Hem STAR hem de Bowtie2 eşleyiciler varsayılan parametreler kullanılarak gerçekleştirilir.
1. STAR eşleyici için yürütün:
  bash mapSTAR.sh
2. Bowtie2 eşleyici için yürütün:
  bash mapBowtie2.sh
  NOT: Nihai sonuçlar, /home/transcriptome-pipeline/results/mapreads içinde depolanan her örnek için İkili Hizalama Eşlemesi (BAM) dosyalarıdır.
Her gen için ham sayımlar elde etmek için FeatureCounts aracını kullanarak eşlenen okumalara açıklama ekleme. Okumalara açıklama getiren komut dosyalarını çalıştırın.
NOT: FeatureCounts aracı, genomik özelliklere eşlenmiş sıralama okumaları atamaktan sorumludur. Biyolojik sorunun ardından değiştirilebilen genom ek açıklamalarının en önemli yönleri arasında, izoformların tespiti, birden fazla eşlenmiş okuma ve ekson-ekson kavşakları, parametrelere karşılık gelen GTF.attrType="gene_name" gen için veya meta özellik düzeyi için parametreleri belirtmeyin, allowMultiOverlap=TRUE ve juncCounts=TRUE, sırasıyla.
1. Komut satırını kullanarak komut dosyaları klasörüne erişin:
  cd /home/transcriptome-pipeline/scripts
2. Gen başına ham sayım elde etmek üzere eşlenen okumalara açıklama eklemek için komut satırını yürütün:
  Rscript ek açıklaması. R
  NOT: Ek açıklama işlemi için kullanılan parametreler: dönüş geni kısa adı (GTF.attrType="gene_name"); birden çok çakışmaya izin verin (allowMultiOverlap = DOĞRU); ve kitaplığın eşleştirilmiş uçlu olduğunu belirtin (isPairedEnd=TRUE). Tek uç stratejisi için isPairedEnd=FALSE parametresini kullanın. Sonuçlar /home/transcriptome-pipeline/countreads klasörüne kaydedilir.
Gen ekspresyonlarını normalleştirin.
NOT: Gen ekspresyonun normalleştirilmesi, sonuçları sonuçlar arasında karşılaştırmak için gereklidir (örneğin, sağlıklı ve enfekte örnekler). Pertürbasyon analizlerinin birlikte ifade ve moleküler derecesini gerçekleştirmek için de normalleşme gereklidir.
1. Komut satırını kullanarak Komut Dosyaları klasörüne erişin:
  cd /home/transcriptome-pipeline/scripts
2. Gen ekspresyonini normalleştirin. Bunun için komut satırını yürütün:
  Rscript normalleştirme örneklemeleri. R
  NOT: Ham sayım ifadesi, bu denemede, M değerlerinin Kırpılmış Ortalaması (TMM) ve Milyon Başına Sayı (BGBM) yöntemleri kullanılarak normalleştirildi. Bu adım, kütüphane boyutu normalleşmesi yaparak, teknik etkiye bağlı gen ifadesindeki farklılıkları ortadan kaldırmayı amaçlamaktadır. Sonuçlar /home/transcriptome-pipeline/countreads klasörüne kaydedilir.

4. Farklı ifade edilen genler ve birlikte ifade edilen genler

Açık kaynaklı EdgeR paketini kullanarak farklı şekilde ifade edilen genleri tanımlayın. Bu, ifade kontrolüne kıyasla daha yüksek veya daha düşük olan genleri bulmayı içerir.
1. Komut satırını kullanarak Komut Dosyaları klasörüne erişin:
  cd /home/transcriptome-pipeline/scripts
2. Farklı şekilde ifade edilen geni tanımlamak için, komut satırını kullanarak DEG_edgeR R komut dosyasını yürütün:
  Rscript DEG_edgeR.R
  NOT: Farklı olarak ifade edilen genleri içeren sonuçlar /home/transcriptome-pipeline/results/degs klasörüne kaydedilecektir. Veriler kişisel bir bilgisayara aktarılabilir.
Csblusp/transcriptome kapsayıcısından veri indirin.
1. İşlenen verileri /home/transcriptome-pipeline dosyasından /opt/transferdata klasörüne (yerel bilgisayar) aktarın.
2. Komut satırını çalıştırarak tüm dosyaları yerel bilgisayara kopyalayın:
  cp -rf /home/transcriptome-pipeline/results /opt/transferdata/pipeline
  cp -rf /home/transcriptome-pipeline/data /opt/transferdata/pipeline
  NOT: Şimdi, tüm sonuçların, veri kümelerinin ve verilerin Ana Bilgisayar Yolu'ndan indirilebildiğine emin olmak için yerel bilgisayara gidin.
Ortak ifade modüllerini tanımlayın.
1. Ortak İfade Modülleri Tanımlama Aracı (CEMiTool) web sitesine erişin (Tablo
  Malzemeler). Bu araç, kullanıcılar tarafından sağlanan ifade veri kümelerinden ortak ifade modüllerini tanımlar. Ana sayfada, sağ üstteki Çalıştır'a tıklayın. Bu, ifade dosyasını karşıya yüklemek için yeni bir sayfa açacaktır.
2. İfade Dosyası bölümünün altındaki Dosya Seç'e tıklayın ve normalleştirilmiş gen ifade matrisi 'tmm_expression.tsv'yi Ana Bilgisayar Yolu'ndan yükleyin.
  NOT: Adım 4.4. zorunlu değildir.
Birlikte ifade modüllerinin biyolojik anlamını keşfedin.
1. Örnek Fenotipler bölümünde Dosya Seç'e tıklayın ve indirme veri adımı 4.2.2'den metadata_cemitool.tsv örnek fenotipleri olan dosyayı yükleyin. gen kümesi zenginleştirme analizi (GSEA) yapmak için.
2. Gen etkileşimleri olan bir dosya yüklemek için Gen Etkileşimleri bölümündeki Dosya Seç'e basın (cemitool-interactions.tsv). WebCEMiTool tarafından örnek olarak sağlanan gen etkileşimleri dosyasını kullanmak mümkündür. Etkileşimler protein-protein etkileşimleri, transkripsiyon faktörleri ve bunların transkripsiyonlu genleri veya metabolik yollar olabilir. Bu adım, her birlikte ifade modülü için bir etkileşim ağı oluşturur.
3. Gene Matrix Transposed (GMT) formatında bir dosyada işlevsel olarak ilişkili genlerin listesini yüklemek için Gen Kümeleri bölümündeki Dosya Seç bölümüne tıklayın. Gene Set dosyası, aracın her bir ortak ifade modülü için zenginleştirme analizi, yani aşırı temsil analizi (ORA) gerçekleştirmesini sağlar.
  NOT: Bu gen listesi yolları, GO terimlerini veya miRNA hedef genlerini kapsayabilir. Araştırmacı bu analiz için gen seti olarak Kan Transkripsiyon Modüllerini (BTM) kullanabilir. BTM dosyası (BTM_for_GSEA.gmt).
Birlikte ifade analizleri yapmak için parametreleri ayarlayın ve sonuçlarını alın.
1. Ardından, varsayılan parametreleri sergilemek için artı işaretine tıklayarak Parametre bölümünü genişletin. Gerekirse, değiştirin. VST Uygula kutusunu işaretleyin.
2. Sonuçları e-posta olarak almak için e-postayı E-posta bölümüne yazın. Bu adım isteğe bağlıdır.
3. CEMiTool Çalıştır düğmesine basın.
4. Sağ üstteki Tam Raporu İndir'e tıklayarak analiz raporunun tamamını indirin. Sıkıştırılmış bir dosyayı cemitool_results.zip.
5. WinRAR ile cemitool_results.zip içeriğini ayıklayın.
  NOT: Ayıklanan içeriğe sahip klasör, analizin tüm sonuçlarını ve belirlenen parametrelerini içeren birkaç dosyayı kapsar.

5. Numunelerin moleküler pertürbasyon derecesinin belirlenmesi

Moleküler Pertürbasyon Derecesi (MDP) web sürümü.
1. MDP'yi çalıştırmak için MDP web sitesine (Malzeme Tablosu) erişin. MDP, her numunenin referanstan moleküler mesafesini hesaplar. Çalıştır düğmesine tıklayın.
2. Dosya Seç bağlantısında, tmm_expression.tsv ifade dosyasını karşıya yükleyin. Ardından, verileri indirme adımı 4.2.2'den fenotipik veri dosyası meta datata.tsv dosyasını yükleyin. Hastalıkla ilişkili yolların pertürbasyon puanını hesaplamak için GMT formatında bir yol ek açıklama dosyası göndermek de mümkündür.
3. Veriler yüklendikten sonra, MDP tarafından kullanılan fenotipik bilgileri içeren Sınıf sütununu tanımlayın. Ardından, denetim sınıfına karşılık gelen etiketi seçerek denetim sınıfını tanımlayın.
  NOT: Örnek puanların nasıl hesaplanacağını etkileyecek bazı isteğe bağlı parametreler vardır. Gerekirse, kullanıcı istatistik ortalama yöntemini, standart sapmasını ve pertürbed genlerin üst yüzdesini değiştirebilir.
4. Bundan sonra, MDP Çalıştır düğmesine basın ve MDP sonuçları gösterilecektir. Kullanıcı, her çizimdeki Çizimi İndir'e ve MDP Puan Dosyasını İndir düğmesindeki MDP puanına tıklayarak rakamları indirebilir.
  NOT: Dosyaların nasıl gönderılacağı veya MDP'nin nasıl çalıştığı hakkında sorularınız olması durumunda, Öğretici ve Web sayfaları hakkında'dan geçmeniz yeterlidir.

6. Fonksiyonel zenginleştirme analizi

Bir alt düzenlenmiş DEG listesi ve başka bir yukarı düzenlenmiş DEG listesi oluşturun. Gen isimleri Entrez gen sembollerine göre olmalıdır. Listenin her geni tek bir satıra yerleştirilmelidir.
Gen listelerini txt veya tsv biçiminde kaydedin.
İşlevsel analizi gerçekleştirmek için Enrichr web sitesine (Malzeme Tablosu) erişin.
Dosya Seç'e tıklayarak gen listesini seçin. DEG listesinden birini seçin ve Gönder düğmesine basın.
ORA yaklaşımıyla işlevsel zenginleştirme analizi yapmak için web sayfasının üst kısmındaki Yollar'a tıklayın.
Bir yol veritabanı seçin. "Reactome 2016" yol veritabanı, insan verilerinin biyolojik anlamını elde etmek için yaygın olarak kullanılmaktadır.
Yol veritabanının adına yeniden tıklayın. Çubuk Grafik'i seçin ve p-değer sıralamasına göre sıralanıp sıralanmadığını denetleyin. Değilse, p değerine göre sıralanana kadar çubuk grafiği tıklatın. Bu çubuk grafik, p değerlerine göre en iyi 10 yolu içerir.
Konfigürasyon düğmesine basın ve yukarı düzenlenmiş gen analizi için kırmızı rengi veya aşağı düzenlenmiş gen analizi için mavi rengi seçin. svg, png ve jpg'ye tıklayarak çubuk grafiği çeşitli biçimlerde kaydedin.
Tablo'yu seçin ve txt dosyasındaki işlevsel zenginleştirme çözümleme sonuçlarını elde etmek için çubuk grafiğin sol alt kısmındaki Tabloya Girişleri Dışa Aktar'ı tıklatın.
NOT: Bu fonksiyonel zenginleştirme sonuçları dosyası, her satırda bir yolun adını, gönderilen DEG listesi ile yol arasındaki çakışmış genlerin sayısını, p değerini, ayarlanmış p değerini, oran oranını, birleşik puanı ve DEG listesinde bulunan ve yola katılan genlerin gen sembolünü kapsar.
Diğer DEG'ler listesiyle aynı adımları yineleyin.
NOT: Aşağı düzenlenmiş DEG'lerle yapılan analiz, aşağı düzenlenmiş genler için zenginleştirilmiş yollar sağlar ve yukarı düzenlenmiş genlerle yapılan analizler, yukarı düzenlenmiş genler için zenginleştirilmiş yollar sağlar.

Sonuçlar

Transkriptom analizleri için bilgi işlem ortamı Docker platformunda oluşturulmuş ve yapılandırılmıştır. Bu yaklaşım, yeni başlayan Linux kullanıcılarının linux terminal sistemlerini priori yönetim bilgisi olmadan kullanmalarını sağlar. Docker platformu, belirli kullanıcıların araçlarını içeren bir hizmet kapsayıcısı oluşturmak için ana işletim sistemi kaynaklarını kullanır (Şekil 1B). Linux OS Ubuntu 20.04 dağıtımına dayalı bir konteyner oluşturul...

Tartışmalar

Sıralama kütüphanelerinin hazırlanması, biyolojik soruları mümkün olan en iyi şekilde yanıtlamak için çok önemli bir adımdır. Çalışmanın ilgi çekici transkriptlerinin türü, hangi sıralama kütüphanesinin seçileceğine rehberlik edecek ve biyoinformatik analizleri yönlendirecektir. Örneğin, bir patojen ve konak etkileşiminin dizileninden, sıralama türüne göre, her ikisinden de veya yalnızca ana bilgisayar transkriptlerinden dizileri tanımlamak mümkündür.

Ye...

Açıklamalar

Yazarların açıklayacak bir şeyi yok.

Teşekkürler

HN, FAPESP tarafından finanse edilmektedir (hibe numaraları: #2017/50137-3, 2012/19278-6, 2018/14933-2, 2018/21934-5 ve 2013/08216-2) ve CNPq (313662/2017-7).

Özellikle bursiyerler için aşağıdaki hibelere minnettarız: ANAG (FAPESP Süreci 2019/13880-5), VEM (FAPESP Süreci 2019/16418 -0), IMSC (FAPESP Süreci 2020/05284-0), APV (FAPESP Süreci 2019/27146-1) ve, RLTO (CNPq Süreci 134204/2019-0).

Malzemeler

Name	Company	Catalog Number	Comments
CEMiTool	Computational Systems Biology Laboratory	1.12.2	Discovery and the analysis of co-expression gene modules in a fully automatic manner, while providing a user-friendly HTML report with high-quality graphs.
EdgeR	Bioconductor (Maintainer: Yunshun Chen [yuchen at wehi.edu.au])	3.30.3	Differential expression analysis of RNA-seq expression profiles with biological replication
EnhancedVolcano	Bioconductor (Maintainer: Kevin Blighe [kevin at clinicalbioinformatics.co.uk])	1.6.0	Publication-ready volcano plots with enhanced colouring and labeling
FastQC	Babraham Bioinformatics	0.11.9	Aims to provide a simple way to do some quality control checks on raw sequence data coming from high throughput sequencing
FeatureCounts	Bioinformatics Division, The Walter and Eliza Hall Institute of Medical Research	2.0.0	Assign mapped sequencing reads to specified genomic features
MDP	Computational Systems Biology Laboratory	1.8.0	Molecular Degree of Perturbation calculates scores for transcriptome data samples based on their perturbation from controls
R	R Core Group	4.0.3	Programming language and free software environment for statistical computing and graphics
STAR	Bioinformatics Division, The Walter and Eliza Hall Institute of Medical Research	2.7.6a	Aligner designed to specifically address many of the challenges of RNA-seq data mapping using a strategy to account for spliced alignments
Bowtie2	Johns Hopkins University	2.4.2	Ultrafast and memory-efficient tool for aligning sequencing reads to long reference sequences
Trimmomatic	THE USADEL LAB	0.39	Trimming adapter sequence tasks for Illumina paired-end and single-ended data
Get Docker	Docker	20.10.2	Create a bioinformatic environment reproducible and predictable (https://docs.docker.com/get-docker/)
WSL2-Kernel	Windows	NA	https://docs.microsoft.com/en-us/windows/wsl/wsl2-kernel
Get Docker Linux	Docker	NA	https://docs.docker.com/engine/install/ubuntu/
Docker Linux Repository	Docker	NA	https://docs.docker.com/engine/install/ubuntu/#install-using-the-repository
MDP Website	Computational Systems Biology Laboratory	NA	https://mdp.sysbio.tools
Enrichr Website	MaayanLab	NA	https://maayanlab.cloud/Enrichr/
webCEMiTool	Computational Systems Biology Laboratory	NA	https://cemitool.sysbio.tools/
gProfiler	Bioinformatics, Algorithmics and Data Mining Group	NA	https://biit.cs.ut.ee/gprofiler/gost
goseq	Bioconductor (Maintainer: Matthew Young [my4 at sanger.ac.uk])	NA	http://bioconductor.org/packages/release/bioc/html/goseq.html
SRA NCBI study	NCBI	NA	https://www.ncbi.nlm.nih.gov/bioproject/PRJNA507472/

Referanslar

Weaver, S. C., Charlier, C., Vasilakis, N., Lecuit, M. Zika, Chikungunya, and Other Emerging Vector-Borne Viral Diseases. Annual Review of Medicine. 69, 395-408 (2018).
Burt, F. J., et al. Chikungunya virus: an update on the biology and pathogenesis of this emerging pathogen. The Lancet. Infectious Diseases. 17 (4), 107-117 (2017).
Hua, C., Combe, B. Chikungunya virus-associated disease. Current Rheumatology Reports. 19 (11), 69 (2017).
Suhrbier, A., Jaffar-Bandjee, M. -. C., Gasque, P. Arthritogenic alphaviruses-an overview. Nature Reviews Rheumatology. 8 (7), 420-429 (2012).
Nakaya, H. I., et al. Gene profiling of chikungunya virus arthritis in a mouse model reveals significant overlap with rheumatoid arthritis. Arthritis and Rheumatism. 64 (11), 3553-3563 (2012).
Michlmayr, D., et al. Comprehensive innate immune profiling of chikungunya virus infection in pediatric cases. Molecular Systems Biology. 14 (8), 7862 (2018).
Soares-Schanoski, A., et al. Systems analysis of subjects acutely infected with the Chikungunya virus. PLOS Pathogens. 15 (6), 1007880 (2019).
Alexandersen, S., Chamings, A., Bhatta, T. R. SARS-CoV-2 genomic and subgenomic RNAs in diagnostic samples are not an indicator of active replication. Nature Communications. 11 (1), 6059 (2020).
Wang, D., et al. The SARS-CoV-2 subgenome landscape and its novel regulatory features. Molecular Cell. 81 (10), 2135-2147 (2021).
Wilson, J. A. C., et al. RNA-Seq analysis of chikungunya virus infection and identification of granzyme A as a major promoter of arthritic inflammation. PLOS Pathogens. 13 (2), 1006155 (2017).
Gonçalves, A. N. A., et al. Assessing the impact of sample heterogeneity on transcriptome analysis of human diseases using MDP webtool. Frontiers in Genetics. 10, 971 (2019).
Russo, P. S. T., et al. CEMiTool: a Bioconductor package for performing comprehensive modular co-expression analyses. BMC Bioinformatics. 19 (1), 56 (2018).
Costa-Silva, J., Domingues, D., Lopes, F. M. RNA-Seq differential expression analysis: An extended review and a software tool. PloS One. 12 (12), 0190152 (2017).
Seyednasrollah, F., Laiho, A., Elo, L. L. Comparison of software packages for detecting differential expression in RNA-seq studies. Briefings in Bioinformatics. 16 (1), 59-70 (2015).
Zhang, B., Horvath, S. A general framework for weighted gene co-expression network analysis. Statistical Applications in Genetics and Molecular Biology. 4, (2005).
Cheng, C. W., Beech, D. J., Wheatcroft, S. B. Advantages of CEMiTool for gene co-expression analysis of RNA-seq data. Computers in Biology and Medicine. 125, 103975 (2020).
Cardozo, L. E., et al. webCEMiTool: Co-expression modular analysis made easy. Frontiers in Genetics. 10, 146 (2019).
de Lima, D. S., et al. Long noncoding RNAs are involved in multiple immunological pathways in response to vaccination. Proceedings of the National Academy of Sciences of the United States of America. 116 (34), 17121-17126 (2019).
Prada-Medina, C. A., et al. Systems immunology of diabetes-tuberculosis comorbidity reveals signatures of disease complications. Scientific Reports. 7 (1), 1999 (2017).
Chen, E. Y., et al. Enrichr: interactive and collaborative HTML5 gene list enrichment analysis tool. BMC Bioinformatics. 14, 128 (2013).
Kuleshov, M. V., et al. Enrichr: a comprehensive gene set enrichment analysis web server 2016 update. Nucleic Acids Research. 44, 90-97 (2016).
Raudvere, U., et al. g:Profiler: a web server for functional enrichment analysis and conversions of gene lists (2019 update). Nucleic Acids Research. 47, 191-198 (2019).
Young, M. D., Wakefield, M. J., Smyth, G. K., Oshlack, A. Gene ontology analysis for RNA-seq: accounting for selection bias. Genome Biology. 11 (2), 14 (2010).

Yeniden Basımlar ve İzinler

Bu JoVE makalesinin metnini veya resimlerini yeniden kullanma izni talebi

Izin talebi

Daha Fazla Makale Keşfet

mm noloji ve Enfeksiyon Say 181 y ksek verimli dizileme RNA seq konak patojen etkile imi farkl olarak ifade edilen genler birlikte ifade edilen genler fonksiyonel analiz rneklerin molek ler pert rbasyon derecesi

This article has been published

Video Coming Soon

Keep me updated: