JoVE Logo

Oturum Aç

Bu içeriği görüntülemek için JoVE aboneliği gereklidir. Oturum açın veya ücretsiz deneme sürümünü başlatın.

Bu Makalede

  • Özet
  • Özet
  • Giriş
  • Protokol
  • Sonuçlar
  • Tartışmalar
  • Açıklamalar
  • Teşekkürler
  • Malzemeler
  • Referanslar
  • Yeniden Basımlar ve İzinler

Özet

Bu protokolün amacı, RNA dizileme verilerini kullanarak aday genlerin evrimini ve ekspresyonunun araştırılmasıdır.

Özet

Tüm genom veya transkriptom verileri gibi büyük veri kümelerini damıtmak ve raporlamak genellikle göz korkutucu bir iştir. Sonuçları parçalamanın bir yolu, organizma için önemli olan bir veya daha fazla gen ailesine odaklanmak ve çalışmaktır. Bu protokolde, bir filogeni oluşturmak ve ilgi genlerinin ekspresyonunun ölçülmesi için biyoinformatik adımları özetliriz. Filogenetik ağaçlar, genlerin türler içinde ve arasında nasıl geliştiğine dair fikir verebilir ve ortolojiyi ortaya getirebilir. Bu sonuçlar, farklı bireylerde veya dokularda bu genlerin ekspresyonunun karşılaştırılması için RNA-seq verileri kullanılarak geliştirilebilir. Moleküler evrim ve ifade çalışmaları, türler arasındaki evrim ve gen fonksiyonunun korunması modlarını ortaya çıkarabilir. Bir gen ailesinin karakterizasyonu gelecekteki çalışmalar için bir sıçrama tahtası görevi görebilirsiniz ve yeni bir genom veya transkriptom kağıdında önemli bir gen ailesini vurgulayabilir.

Giriş

Sıralama teknolojilerindeki gelişmeler, model olmayan organizmaların genomlarının ve transkriptomlarının dizilimini kolaylaştırdı. Dna ve RNA'yı birçok organizmadan sıralamanın artan fizibilitesine ek olarak, ilgi genlerini incelemek için çok sayıda veri kamuya açıktır. Bu protokolün amacı, ilgi çekici organizmada önemli bir rol oynayabilecek genlerin moleküler evrimini ve ekspresyonunun araştırılması için biyoinformatik adımlar sağlamaktır.

Bir gen veya gen ailesinin evrimini araştırmak, biyolojik sistemlerin evrimi hakkında fikir verebilir. Bir gen ailesinin üyeleri tipik olarak korunmuş motifler veya homolog gen dizileri tanımlanarak belirlenir. Gen ailesi evrimi daha önce uzaktan ilişkili model organizmaların genomları kullanılarak araştırılmıştır1. Bu yaklaşımın bir sınırlaması, bu gen ailelerinin yakından ilişkili türlerde nasıl evrimleştiğinin ve farklı çevresel seçici baskıların rolünün açık olmamasıdır. Bu protokolde, yakından ilişkili türlerde homologlar için bir arayışa yer verdik. Fitülm düzeyinde bir filogeny üreterek, korunmuş genler veya soyuna özgü çoğaltmalar gibi gen ailesi evrimi eğilimlerini not edebiliriz. Bu seviyede genlerin ortolog mu yoksa paralog mu olduğunu da araştırabiliriz. Birçok homolog muhtemelen birbirine benzer şekilde işlev görürken, bu mutlaka durum2. Filogenetik ağaçların bu çalışmalara dahil edilerek bu homolog genlerin ortolog olup olmadığının çözülmesi önemlidir. Ökaryotlarda, birçok ortez, memeli proteinlerinin maya ortezlerinin işlevini geri kazanma yeteneğinin kanıt ettiği gibi hücre içinde benzer işlevleri korur3. Bununla birlikte, ortezsiz bir genin karakterize bir işlev4gerçekleştirdiği durumlar vardır.

Filogenetik ağaçlar genler ve türler arasındaki ilişkileri tanımlamaya başlar, ancak işlev sadece genetik ilişkilere göre atanamaz. Gen ekspresyon çalışmaları fonksiyonel ek açıklamalar ve zenginleştirme analizi ile birlikte gen fonksiyonu için güçlü destek sağlar. Gen ekspresyonunun ölçülebildiği ve bireyler veya doku tipleri arasında karşılaştırılabildiği durumlar potansiyel işlevin daha fazla anlatılması olabilir. Aşağıdaki protokol Hydra vulgaris7'deopsin genlerinin araştırılmasında kullanılan yöntemleri izler, ancak herhangi bir türe ve herhangi bir gen ailesine uygulanabilirler. Bu tür çalışmaların sonuçları, model olmayan organizmalarda gen fonksiyonu ve gen ağları hakkında daha fazla araştırma için bir temel sağlar. Örnek olarak, fototransdüksiyon basamaklanmasını başlatan proteinler olan opsinlerin filogenisinin araştırılması, gözlerin evrimine ve ışık algılamaya bağlam verir 8,9,10,11. Bu durumda, model olmayan organizmalar özellikle cnidarians veya ctenophores gibi bazal hayvan türlerinin korunması veya fototransdüksiyon kaskadındaki değişiklikler ve clades12 , 13,14. Benzer şekilde, diğer gen ailelerinin filogeni, ifade ve ağlarının belirlenmesi, adaptasyonların altında kalan moleküler mekanizmalar hakkında bizi bilgilendirecektir.

Protokol

Bu protokol UC Irvine hayvan bakım yönergelerini izler.

1. RNA-seq kütüphane hazırlığı

  1. Aşağıdaki yöntemleri kullanarak RNA'yı yalıtın.
    1. Örnekleri toplayın. RNA daha sonra çıkarılacaksa, numuneyi flaşla dondurun veya RNA depolama çözeltisi15'e (Malzeme Tablosu) yerleştirin.
    2. İlgi çekici dokuları ayırmak için organizmayı ötenazi ve diseksiyon.
    3. Bir ekstraksiyon kiti kullanarak toplam RNA'yı çıkarın ve bir RNA arıtma kiti kullanarakRNA'yı arındırın( Malzeme Masası )
      NOT: Farklı türler ve doku tipleri için daha iyi çalışabilecek protokoller ve kitler vardır16,17. Bir kelebek18 ve jelatinli Hydra19'un farklı vücut dokularından RNA çıkardık (tartışmaya bakın).
    4. Her numunenin RNA konsantrasyonu ve kalitesiniölçün( Malzeme Tablosu ). CDNA kitaplıkları oluşturmak için ideal olarak 920'ye daha yakın, RNA bütünlük numaraları (RIN) 8'den yüksek olan örnekleri kullanın.
  2. cDNA kitaplığını ve sırasını aşağıdaki gibi oluşturun.
    1. Kitaplık hazırlık kullanım kılavuzuna göre cDNA kitaplıkları oluşturun (tartışmaya bakın).
    2. cDNA konsantrasyonu ve kalitesini belirleyin (Malzeme Tablosu).
    3. Kitaplıkları çoklayın ve sıralayın.

2. Bilgisayar kümesine erişme

NOT: RNA-seq analizi büyük dosyaların manipülasyonu gerektirir ve en iyi bilgisayar kümesinde(Malzeme Tablosu)yapılır.

  1. Terminal (Mac) veya PuTTY (Windows) uygulama penceresinde ssh username@clusterlocation komutunu kullanarak bilgisayar kümesi hesabına giriş yapın.

3. RNA-seq okumaları elde edin

  1. Sıralama olanaktan veya bir yayında oluşturulan veriler için, yatırıldığı veri deposundan (3.2 veya 3.3) RNA-seq okumaları alın.
  2. ArrayExpress gibi depolardan veri yüklemek için aşağıdakileri yapın:
    1. Katılım numarasını kullanarak sitede arama yap.
    2. Verileri indirmek için bağlantıyı bulun, sonra sol tıklatın ve Bağlantıyı Kopyala 'yıseçin.
    3. Terminal penceresinde, verileri çözümleme için dizine kopyalamak üzere wget yazın ve Bağlantıyı yapıştır'ı seçin.
  3. NCBI Kısa Okuma Arşivi (SRA) verilerini indirmek için şu alternatif adımları izleyin:
    1. Terminalde Wget kullanarak SRA Toolkit v. 2.8.1'i indirin.
      NOT: Programları bilgisayar kümesine indirip yüklemek kök erişimi gerektirebilir, yükleme başarısız olursa bilgisayar kümesi yöneticinize başvurun.
    2. Tar -xvf $TARGZFILEyazarak programı yüklemeyi tamamla.
    3. İndirmek istediğiniz örnekler için SRA katılım numarası için NCBI'yi arayın, SRRXXXXXX biçimine sahip olmalıdır.
    4. Terminal penceresine [sratoolkit location]/bin/prefetch SRRXXXXXX yazarak RNA-seq verilerini elde edin.
    5. Eşleştirilmiş uçlu dosyalar için [sratoolkit location]/bin/fastq-dump --split-files SRRXXXXXX iki fastq dosyası (SRRXXXXXX_1.FASTQ ve SRRXXXXXX_2.FASTQ) almak için yazın.
      NOT: Trinity de novo derlemesi yapmak için [sratoolkit location]/bin/fastq-dump --defline-seq '@$sn[_$rn]/$ri' --split-files SRRXXXXXX

4. Adaptörleri ve düşük kaliteli okumaları kırpın (isteğe bağlı)

  1. Trimmomatic21 v. 0.35'i bilgi işlem kümesine yükleyin veya yükleyin.
  2. RNA-seq veri dosyalarının bulunduğu dizine, trimmomatik jar dosyasının konumunu, giriş FASTQ dosyalarını, çıkış FASTQ dosyalarını ve okuma uzunluğu ve kalitesi gibi isteğe bağlı parametreleri içeren bir komut yazın.
    NOT: Komut, okumaların ham ve istenen kalitesine ve uzunluğuna göre değişir. Nextera primer'ları ile Illumina 43 bp okumaları için şunları kullandık: java -jar /data/apps/trimmomatic/0.35/trimmomatic-0.35.jar PE $READ 1. FASTQ $READ 2. FASTQ paired_READ1. FASTQ unpaired_READ1. FASTQ paired_READ2. FASTQ unpaired_READ2. FASTQ ILLUMINACLIP:adapters.fa:2:30:10 LİDER:20 İZLEYEN:20 SLIDINGWINDOW:4:17 MINLEN:30.

5. Referans montaj elde edin

  1. İlgi gören türler için bir referans genom veya monte edilmiş transkriptom için google, EnsemblGenomes ve NCBI Genomları ve Nükleotid TSA'yı (Transcriptome Shotgun Assembly) arayın (Şekil 1).
    NOT: Bir referans genom veya transkriptom mevcut değilse veya düşük kaliteliyse, bir de novo montajı oluşturmak için ADIM 6'ya geçin.
  2. Bir referans genom veya monte edilmiş transkriptom varsa, aşağıdaki adımları izleyerek analizin gerçekleştirileceği yere fasta dosyası olarak indirin.
    1. Genom indirmek için bağlantıyı bulun, sol tıklatın ve Bağlantıyı Kopyalayın.
    2. Terminal penceresine wget yazın ve bağlantı adresini yapıştırın. Varsa, referans genom için GTF dosyasını ve protein FASTA dosyasını da kopyalayın.

6. Bir de novo montajı oluşturun (Adım 5'e Alternatif)

  1. Cat *READ1 yazarak tüm örnekler için RNA-seq READ1 ve READ2 fastq dosyalarını birleştirin. FASTQ > $all_READ1. FASTQ ve kedi *READ2. FASTQ > all_READ2. FASTQ terminal penceresinde.
  2. Trinity 22 v.2.8.5'i bilgi işlem kümesine yükleyin veya yükleyin.
  3. Terminale yazarak oluşturun ve birin: Trinity --seqType fq --max_memory 20G --left $all_READ1. FASTQ --sağ $all_READ2. HıZLıQ.

7. Harita genoma (7.1) veya de novo transkriptome (7.2) okur

  1. Harita, STAR 23 v.2.6.0c ve RSEM 24 v.1.3.0 kullanarak referans genomunu okur.
    1. STAR v. 2.6.0c'yi yükleyin veya yükleyin. ve RSEM v. 1.3.0 bilgi işlem kümesine.
    2. Rsem-prepare-reference --gtf $GENOME yazarak genomun dizinini dizine dizin. GTF -- yıldız -p 16 $GENOME. FASTA $OUTPUT.
    3. Eşleme, rsem-calculate-expression -p 16 --star --paired-end $READ 1 yazarak her örnek için ifadeyi okur ve hesaplar. FASTQ $READ 2. FASTQ $INDEX $OUTPUT.
    4. Mv RSEM.genes.results $sample.genes.results kullanarak sonuç dosyasını açıklayıcı bir şeyle yeniden adlandırın.
    5. rsem-generate-data-matrix *[genes/isoforms.results] > $OUTPUTyazarak tüm sayımların matrisini oluşturun.
  2. RNE-seq'i RSEM ve bowtie kullanarak Trinity de novo derlemesine eşleyin.
    1. Trinity 22 v.2.8.5, Bowtie25 v. 1.0.0 ve RSEM v. 1.3.0'ı yükleyin veya yükleyin.
    2. [trinity_location]/align_and_estimate_abundance.pl --prep-reference --transcripts $TRINITY yazarak her örnek için harita okuma ve hesaplama ifadesi. FASTA --seqType fq --sol $READ 1. FASTQ -- sağ $READ 2. FASTQ --est_method RSEM --aln_method papyon --trinity_mode --output_dir $OUTPUT.
    3. Mv RSEM.genes.results $sample.genes.results kullanarak sonuç dosyasını açıklayıcı bir şeyle yeniden adlandırın.
    4. [trinity_location]/abundance_estimates_to_matrix.pl --est_method RSEM *[genes/isoforms].results yazarak tüm sayımların matrisini oluşturun

8. İlgi genlerini tanımlayın

NOT: Aşağıdaki adımlar nükleotid veya protein FASTA dosyaları ile yapılabilir, ancak en iyi şekilde çalışır ve protein dizileri ile daha basittir. Proteinden proteine protein kullanarak yapılan BLAST aramalarının farklı türler arasında arama yaparken sonuç verme olasılığı daha yüksektir.

  1. Referans genom için STEP 5.2.2'nin FASTA protein dosyasını kullanın veya özel gen özelliği GTF oluşturmak için Ek Malzemeler'e bakın.
  2. De novo transkriptom için TransDecoder kullanarak bir protein FASTA oluşturun.
    1. Bilgisayar cluser'ına TransDecoder v. 5.5.0 yükleyin veya yükleyin.
    2. [Transdecoder location]/TransDecoder.LongOrfs -t $TRINITY yazarak en uzun açık okuma çerçevesini ve tahmin edilen peptit sırasını bulun. FASTA.
  3. NCBI Genbank'ta yakından ilişkili türlerde homologlar arayın.
    1. Bir internet tarayıcısı penceresi açın ve https://www.ncbi.nlm.nih.gov/genbank/ gidin.
    2. Arama çubuğuna, ilgi geninin adını ve sıralanmış veya cins veya fitülar olan yakından ilişkili türlerin adını yazın. Arama çubuğunun solunda proteini seçin ve ara'yı tıklatın.
    3. Gönder'i tıklatıp Dosya'yı seçerek dizileri ayıklayın. Biçim'in altında FASTA'yı seçin ve Dosya Oluştur'u tıklatın.
    4. Yerel terminal penceresinde scp $FASTA username@clusterlocation:/$DIR yazarak homologların FASTA dosyasını bilgisayar kümesine taşıyın veya dosyaları bilgisayara ve kümeden aktarmak için FileZilla'yı kullanın.
  4. BLAST+26kullanarak aday genleri arayın.
    1. BLAST+ v. 2.8.1'i bilgisayar kümesine yükleyin veya yükleyin.
    2. Bilgisayar kümesinde, $PEP [BLAST+ location]/makeblastdb -in yazarak genom veya transcriptome çevrilmiş protein FASTA'dan bir BLAST veritabanı oluşturun. FASTA -dbtype prot -out $OUTPUT
    3. [BLAST+ location]/blastp -db $DATABASE -query $FASTA -evalue 1e-10 -outfmt 6 -max_target_seqs 1 -out-out $OUTPUT yazarak NCBI'denilgi gören türlerin veritabanına homolog gen dizilerini BLAST.
    4. Daha fazlakomut kullanarak çıktı dosyasını görüntüleyin. İlgi çekici türlerden benzersiz gen kimliklerini yeni bir metin dosyasına kopyalayın.
    5. Perl -ne 'if(/^>(\S+)/){$c=$i{$1}}$c?print:chomp;$i{$_}=1 if @ARGV' $gene_id.txt $PEP yazarak aday genlerin dizilerini ayıklayın. FASTA > $OUTPUT.
  5. Karşılıklı BLAST kullanarak gen ek açıklamalarını onaylayın.
    1. İnternet tarayıcısında https://blast.ncbi.nlm.nih.gov/Blast.cgi gidin.
    2. Tblastn 'ıseçin, sonra aday sıralarını yapıştırın, Gereksiz olmayan protein dizisi veritabanını seçin ve BLAST 'ıtıklatın.
  6. Genom veya transkriptomdaki tüm genlere gen ontolojisi (GO) terimleriyle açıklama vererek ek genleri tanımlayın (bkz. tartışma).
    1. FASTA proteinini yerel bilgisayara aktarın.
    2. Blast2GO27 , 28,29v. 5.2'yi yerel bilgisayara indirip yükleyin.
    3. Blast2GO'yuaçın, Dosya'yı tıklatın, Yükle'ye gidin, Sıraları Yükle'ye gidin, Fasta Dosyasını Yükle 'yi (fasta)tıklatın. FASTA dosyasını seçin ve Yükle 'yitıklatın.
    4. Blast 'ı tıklatın, NCBI Blast'ı seçin ve İleri 'yitıklatın. Parametreleri düzenleyin veya İleri'yi tıklatın, parametreleri düzenleyin ve en benzer gen açıklamasını bulmak için Çalıştır'ı tıklatın.
    5. Benzer proteinler için Gen Ontoloji ek açıklamalarını aramak için eşleme'yi tıklatın ve Çalıştır'ı tıklatın.
    6. Sonra interpro'yu tıklatın, EMBL-EBI InterPro'yu seçin ve İleri'yi tıklatın. Parametreleri düzenleyin veya İleri'yi tıklatın ve bilinen gen ailelerinin ve etki alanlarının imzalarını aramak için Çalıştır 'ı tıklatın.
    7. Dosya'yı tıklatarak ek açıklamaları dışarı aktar , Dışarı Aktar'ı seçin, Tabloyu Dışarı Aktar'ı tıklatın. Gözat 'ıtıklatın, dosyayı adlandırın, Kaydet 'itıklatın, Dışarı Aktar'ı tıklatın.
    8. Ek aday genlerini tanımlamak için GO ilgi koşulları için ek açıklama tablosunu arayın. Dizileri FASTA dosyasından ayıklama (ADIM 8.4.5)

9. Filogenetik ağaçlar

  1. MEGA30 v. 7.0.26'yı indirip yerel bilgisayarınıza yükleyin.
  2. MEGA'yı açın, Hizala 'yıtıklatın, Hizalamayı Düzenle/Oluştur 'utıklatın, Yeni hizalama oluştur 'u tıklatın Tamam 'ıtıklatın, Protein'i seçin.
  3. Hizalama penceresi açıldığında, Düzenle 'yetıklayın, Dosyadan dizi ekle'ye tıklayın ve aday genlerin protein dizileri ve olası homologlarla FASTA'yı seçin.
  4. Tüm dizileri seçin. Kol sembolünü bulun ve üzerine gelin. MUSCLE31 algoritmasını kullanarak dizileri hizala demelidir. Kol sembolüne tıklayın ve ardından dizileri hizalamak için Proteini Hizala'ya tıklayın. Parametreleri düzenleyin veya varsayılan parametreleri kullanarak hizalamak için Tamam'ı tıklatın.
  5. El ile yapılan değişiklikleri görsel olarak inceleyin ve yapın, ardından Hizalama penceresini kaydedin ve kapatın.
  6. Ana MEGA penceresinde, Modeller'e tıklayın, En İyi DNA / Protein modellerini bul 'a tıklayın (ML),hizalama dosyasını seçin ve aşağıdaki gibi ilgili parametreleri seçin: Analiz: Model Seçimi (ML), Kullanılacak Ağaç: Otomatik (komşu birleştirme ağacı), İstatistiksel Yöntem: Maksimum Olasılık, Değiştirme Türü: Amino Asit, Boşluk / eksik veri tedavisi: Tüm siteleri kullanın, Şube sitesi filtresi: Yok.
  7. Veriler için en iyi model belirlendikten sonra ana MEGA penceresine gidin. Filogeni'yi tıklatın ve Contruct/Test Maksimum Olasılık Ağacı'nı tıklatın ve gerekirse hizalamayı seçin. Ağaç için uygun parametreleri seçin: İstatistiksel yöntem: Maksimum Olasılık, Filogeni Testi: 100 çoğaltmalı Bootstrap yöntemi, ikame türü: amino asit, model: Freqs ile LG. (+F), siteler arasındaki oranlar: 5 ayrı gama kategorisine sahip gama dağıtılmış (G), boşluk/eksik veri işleme: tüm siteleri kullanın, ML sezgisel yöntem: En Yakın Komşu-Değişim (NNI).

10. TPM kullanarak gen ekspresyonlarını görselleştirin

  1. Trinity için, bilgisayar kümesinde abundance_estimates_to_matrix.pl çalıştırıldığı dizine gidin ve çıktılardan biri matris olmalıdır. TPM.not_cross_norm. Bu dosyayı yerel bilgisayarınıza aktarın.
    NOT: Çapraz numune normalleştirmesi için Ek Malzemeler'e bakın.
  2. Genom analizinden TPM'ler için aşağıdaki adımları izleyin.
    1. Bilgisayar kümesinde, RSEM yükleme konumuna gidin. scp rsem-generate-data-matrix rsem-generate-generate-TPM-matrix yazarak rsem-generate-data-matrix'ikopyalayın. Yeni dosyayı düzenlemek ve "$offsite = 4" ü TPM için 4'ten 5'e değiştirmek için nano'yu kullanın, şimdi "$offsite = 5" okumalıdır.
  3. RSEM çıktı dosyalarının bulunduğu dizine gidin .genes.results ve şimdi bir TPM matrisi oluşturmak için rsem-generate-TPM-matrix *[genes/isoforms.results] > $OUTPUT kullanın. Sonuçları yerel bir bilgisayara aktarın.
  4. Sonuçları ggplot2 ile görselleştirin.
    1. R v. 4.0.0 ve RStudio v. 1.2.1335'i yerel bir bilgisayara indirin.
    2. Ekranın sağındaki RStudio'yu açın Paketler sekmesine gidin ve Yükle 'yitıklatın. ggplot2 yazın ve yükle 'yitıklatın.
    3. TPM tablosunda veri<-read.table("$tpm.txt",üstbilgi = T) yazarak okunan R komut dosyası penceresinde
    4. Şekil 4'e benzer çubuk grafikler için aşağıdakine benzer bir şey yazın: p<- ggplot() + geom_bar(aes(y=TPM, x=Symbol, fill=Tissue), data=data, stat="identity")
      fill<-c("#d7191c","#fdae61", "#ffffbf", "#abd9e9", "#2c7bb6")
      p<-p+scale_fill_manual(değerler=dolgu)
      p + tema(axis.text.x = element_text(açı = 90))

Sonuçlar

Yukarıdaki yöntemler Şekil 1'de özetlenmiş ve Hydra vulgaris dokularının bir veri kümesine uygulanmıştır. H. vulgaris, mercanlar, denizanaları ve deniz anemonlarını da içeren phylum Cnidaria'ya ait tatlı su omurgasızıdır. H. vulgaris tomurcuklanarak aseksüel olarak üreyebilir ve ikiye ayrıştıklarında başlarını ve ayaklarını yenileyebilirler. Bu çalışmada, Hydra7'deopsin genlerinin evrimini v...

Tartışmalar

Bu protokolün amacı, RNA-seq verilerini kullanarak bir gen ailesini karakterize etmek için adımların bir özetini sağlamaktır. Bu yöntemlerin çeşitli türler ve veri kümeleri4 , 34,35için çalıştığı kanıtlanmıştır. Burada kurulan boru hattı basitleştirildi ve biyoinformatikte bir acemi tarafından takip edilebilecek kadar kolay olmalıdır. Protokolün önemi, yayımlanabilir bir analizi tamamlamak için t...

Açıklamalar

Yazarların açıklayacak bir şeyi yok.

Teşekkürler

Adriana Briscoe, Gil Smith, Rabi Murad ve Aline G. Rangel'e bu adımlardan bazılarını iş akışımıza dahil etme konusunda tavsiye ve rehberlik için teşekkür ederiz. Katherine Williams, Elisabeth Rebboah ve Natasha Picciani'ye de el yazması hakkındaki yorumları için minnettarız. Bu çalışma kısmen George E. Hewitt Tıbbi araştırma vakfı tarafından A.M.M.'ye desteklendi.

Malzemeler

NameCompanyCatalog NumberComments
Bioanalyzer-DNA kitAgilent5067-4626wet lab materials
Bioanalyzer-RNA kitAgilent5067-1513wet lab materials
BLAST+ v. 2.8.1On computer cluster*
https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/
Blast2GO (on your PC)On local computer
https://www.blast2go.com/b2g-register-basic
boost v. 1.57.0On computer cluster
Bowtie v. 1.0.0On computer cluster
https://sourceforge.net/projects/bowtie-bio/files/bowtie/1.3.0/
Computing cluster (highly recommended)NOTE: Analyses of genomic data are best done on a high-performance computing cluster because files are very large.
Cufflinks v. 2.2.1On computer cluster
edgeR v. 3.26.8 (in R)In Rstudio
https://bioconductor.org/packages/release/bioc/html/edgeR.html
gcc v. 6.4.0On computer cluster
Java v. 11.0.2On computer cluster
MEGA7 (on your PC)On local computer
https://www.megasoftware.net
MEGAX v. 0.1On local computer
https://www.megasoftware.net
NucleoSpin RNA II kitMacherey-Nagel740955.5wet lab materials
perl 5.30.3On computer cluster
pythonOn computer cluster
Qubit 2.0 FluorometerThermoFisherQ32866wet lab materials
R v.4.0.0On computer cluster
https://cran.r-project.org/src/base/R-4/
RNAlaterThermoFisherAM7021wet lab materials
RNeasy kitQiagen74104wet lab materials
RSEM v. 1.3.0Computer software
https://deweylab.github.io/RSEM/
RStudio v. 1.2.1335On local computer
https://rstudio.com/products/rstudio/download/#download
Samtools v. 1.3Computer software
SRA Toolkit v. 2.8.1On computer cluster
https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit
STAR v. 2.6.0cOn computer cluster
https://github.com/alexdobin/STAR
StringTie v. 1.3.4dOn computer cluster
https://ccb.jhu.edu/software/stringtie/
Transdecoder v. 5.5.0On computer cluster
https://github.com/TransDecoder/TransDecoder/releases
Trimmomatic v. 0.35On computer cluster
http://www.usadellab.org/cms/?page=trimmomatic
Trinity v.2.8.5On computer cluster
https://github.com/trinityrnaseq/trinityrnaseq/releases
TRIzolThermoFisher15596018wet lab materials
TruSeq RNA Library Prep Kit v2IlluminaRS-122-2001wet lab materials
TURBO DNA-free KitThermoFisherAM1907wet lab materials
*Downloads and installation on the computer cluster may require root access. Contact your network administrator.

Referanslar

  1. Lespinet, O., Wolf, Y. I., Koonin, E. V., Aravind, L. The role of lineage-specific gene family expansion in the evolution of eukaryotes. Genome Research. 12 (7), 1048-1059 (2002).
  2. Gabaldón, T., Koonin, E. V. Functional and evolutionary implications of gene orthology. Nature Reviews Genetics. 14 (5), 360-366 (2013).
  3. Dolinski, K., Botstein, D. Orthology and Functional Conservation in Eukaryotes. Annual Review of Genetics. 41 (1), (2007).
  4. Macias-Muñoz, A., McCulloch, K. J., Briscoe, A. D. Copy number variation and expression analysis reveals a non-orthologous pinta gene family member involved in butterfly vision. Genome Biology and Evolution. 9 (12), 3398-3412 (2017).
  5. Cannon, S. B., Mitra, A., Baumgarten, A., Young, N. D., May, G. The roles of segmental and tandem gene duplication in the evolution of large gene families in Arabidopsis thaliana. BMC plant biology. 4, 10 (2004).
  6. Eastman, S. D., Chen, T. H. P., Falk, M. M., Mendelson, T. C., Iovine, M. K. Phylogenetic analysis of three complete gap junction gene families reveals lineage-specific duplications and highly supported gene classes. Genomics. 87 (2), 265-274 (2006).
  7. Macias-Munõz, A., Murad, R., Mortazavi, A. Molecular evolution and expression of opsin genes in Hydra vulgaris. BMC Genomics. 20 (1), 1-19 (2019).
  8. Hisatomi, O., Tokunaga, F. Molecular evolution of proteins involved in vertebrate phototransduction. Comparative Biochemistry and Physiology - B Biochemistry and Molecular Biology. 133 (4), 509-522 (2002).
  9. Arendt, D. Evolution of eyes and photoreceptor cell types. International Journal of Developmental Biology. 47, 563-571 (2003).
  10. Shichida, Y., Matsuyama, T. Evolution of opsins and phototransduction. Philosophical Transactions of the Royal Society B: Biological Sciences. 364 (1531), 2881-2895 (2009).
  11. Porter, M. L., et al. Shedding new light on opsin evolution. Proceedings of the Royal Society B: Biological Sciences. 279 (1726), 3-14 (2012).
  12. Plachetzki, D. C., Degnan, B. M., Oakley, T. H. The origins of novel protein interactions during animal opsin evolution. PLoS ONE. 2 (10), 1054 (2007).
  13. Ramirez, M. D., et al. The last common ancestor of most bilaterian animals possessed at least nine opsins. Genome Biology and Evolution. 8 (12), 3640-3652 (2016).
  14. Schnitzler, C. E., et al. Genomic organization, evolution, and expression of photoprotein and opsin genes in Mnemiopsis leidyi: a new view of ctenophore photocytes. BMC Biology. 10, 107 (2012).
  15. Pedersen, K. B., Williams, A., Watt, J., Ronis, M. J. Improved method for isolating high-quality RNA from mouse bone with RNAlater at room temperature. Bone Reports. 11, 100211 (2019).
  16. Ridgeway, J. A., Timm, A. E., Fallon, A. Comparison of RNA isolation methods from insect larvae. Journal of Insect Science. 14 (1), 4-8 (2014).
  17. Scholes, A. N., Lewis, J. A. Comparison of RNA isolation methods on RNA-Seq: Implications for differential expression and meta-Analyses. BMC Genomics. 21 (1), 1-9 (2020).
  18. Briscoe, A. D., et al. Female behaviour drives expression and evolution of gustatory receptors in butterflies. PLoS genetics. 9 (7), 1003620 (2013).
  19. Murad, R., Macias-Muñoz, A., Wong, A., Ma, X., Mortazavi, A. Integrative analysis of Hydra head regeneration reveals activation of distal enhancer-like elements. bioRxiv. , 544049 (2019).
  20. Gallego Romero, I., Pai, A. A., Tung, J., Gilad, Y. Impact of RNA degradation on measurements of gene expression. BMC Biology. 12, 42 (2014).
  21. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  22. Trinity. . RNA-Seq De novo Assembly Using Trinity. , 1-7 (2014).
  23. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29, 15-21 (2013).
  24. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC bioinformatics. 12, 323 (2011).
  25. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome biology. 10, 25 (2009).
  26. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10, 421 (2009).
  27. Conesa, A., Götz, S. Blast2GO: A comprehensive suite for functional analysis in plant genomics. International Journal of Plant Genomics. 619832, (2008).
  28. Conesa, A., et al. Blast2GO: A universal tool for annotation, visualization and analysis in functional genomics research. Bioinformatics. 21 (18), 3674-3676 (2005).
  29. Götz, S., et al. High-throughput functional annotation and data mining with the Blast2GO suite. Nucleic Acids Research. 36 (10), 3420-3435 (2008).
  30. Kumar, S., Stecher, G., Tamura, K. MEGA7: Molecular Evolutionary Genetics Analysis version 7.0 for bigger datasets. Molecular biology and evolution. 33 (7), 1870-1874 (2016).
  31. Edgar, R. C. MUSCLE: Multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  32. Taddei-Ferretti, C., Musio, C., Santillo, S., Cotugno, A. The photobiology of Hydra's periodic activity. Hydrobiologia. 530, 129-134 (2004).
  33. Chapman, J. A., et al. The dynamic genome of Hydra. Nature. 464 (7288), 592-596 (2010).
  34. Macias-Muñoz, A., Rangel Olguin, A. G., Briscoe, A. D. Evolution of phototransduction genes in Lepidoptera. Genome Biology and Evolution. 11 (8), 2107-2124 (2019).
  35. Macias-Munõz, A., Murad, R., Mortazavi, A. Molecular evolution and expression of opsin genes in Hydra vulgaris. BMC Genomics. 20 (1), (2019).
  36. Picelli, S., et al. Full-length RNA-seq from single cells using Smart-seq2. Nature Protocols. 9 (1), 171-181 (2014).
  37. Tavares, L., Alves, P. M., Ferreira, R. B., Santos, C. N. Comparison of different methods for DNA-free RNA isolation from SK-N-MC neuroblastoma. BMC research notes. 4, 3 (2011).
  38. Johnson, M. T. J., et al. Evaluating Methods for Isolating Total RNA and Predicting the Success of Sequencing Phylogenetically Diverse Plant Transcriptomes. PLoS ONE. 7 (11), (2012).
  39. Zhao, S., Zhang, Y., Gamini, R., Zhang, B., Von Schack, D. Evaluation of two main RNA-seq approaches for gene quantification in clinical RNA sequencing: PolyA+ selection versus rRNA depletion. Scientific Reports. 8 (1), 1-12 (2018).
  40. Zhao, S., et al. Comparison of stranded and non-stranded RNA-seq transcriptome profiling and investigation of gene overlap. BMC Genomics. 16 (1), 1-14 (2015).
  41. Corley, S. M., MacKenzie, K. L., Beverdam, A., Roddam, L. F., Wilkins, M. R. Differentially expressed genes from RNA-Seq and functional enrichment results are affected by the choice of single-end versus paired-end reads and stranded versus non-stranded protocols. BMC Genomics. 18 (1), 1-13 (2017).
  42. Haas, B. J., et al. De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis. Nature Protocols. 8 (8), 1494-1512 (2013).
  43. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature biotechnology. 33 (3), 290-295 (2015).
  44. Bray, N. L., Pimentel, H., Melsted, P., Pachter, L. Near-optimal probabilistic RNA-seq quantification. Nature Biotechnology. 34 (5), 525-527 (2016).
  45. Patro, R., Duggal, G., Love, M. I., Irizarry, R. A., Kingsford, C. Salmon provides fast and bias-aware quantification of transcript expression. Nature Methods. 14 (4), 417-419 (2017).
  46. Araujo, F. A., Barh, D., Silva, A., Guimarães, L., Thiago, R. . OPEN GO FEAT a rapid web-based functional annotation tool for genomic and transcriptomic data. , 8-11 (2018).
  47. Huerta-Cepas, J., et al. Fast genome-wide functional annotation through orthology assignment by eggNOG-mapper. Molecular Biology and Evolution. 34 (8), 2115-2122 (2017).
  48. Huerta-Cepas, J., et al. EggNOG 5.0: A hierarchical, functionally and phylogenetically annotated orthology resource based on 5090 organisms and 2502 viruses. Nucleic Acids Research. 47, 309-314 (2019).
  49. Törönen, P., Medlar, A., Holm, L. PANNZER2: A rapid functional annotation web server. Nucleic Acids Research. 46, 84-88 (2018).
  50. Robinson, M., Mccarthy, D., Chen, Y., Smyth, G. K. . edgeR differential expression analysis of digital gene expression data User's Guide. , (2013).
  51. Huang, D. W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  52. Huang, D. W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: Paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  53. Letunic, I., Bork, P. Interactive tree of life (iTOL) v3: an online tool for the display and annotation of phylogenetic and other trees. Nucleic acids research. 44, 242-245 (2016).

Yeniden Basımlar ve İzinler

Bu JoVE makalesinin metnini veya resimlerini yeniden kullanma izni talebi

Izin talebi

Daha Fazla Makale Keşfet

BiyolojiSay 171biyoinformatikgen gen genle meleriBLASTtranskriptomgenomMEGA

This article has been published

Video Coming Soon

JoVE Logo

Gizlilik

Kullanım Şartları

İlkeler

Araştırma

Eğitim

JoVE Hakkında

Telif Hakkı © 2020 MyJove Corporation. Tüm hakları saklıdır