JoVE Logo

サインイン

このコンテンツを視聴するには、JoVE 購読が必要です。 サインイン又は無料トライアルを申し込む。

この記事について

  • 要約
  • 要約
  • 概要
  • プロトコル
  • 結果
  • ディスカッション
  • 開示事項
  • 謝辞
  • 資料
  • 参考文献
  • 転載および許可

要約

このプロトコルの目的は、RNAシーケンシングデータを用いて候補遺伝子の進化と発現を調べるものです。

要約

全ゲノムやトランスクリプトームデータなどの大規模なデータセットを蒸留して報告することは、しばしば困難な作業です。結果を分解する1つの方法は、生物にとって重要な1つ以上の遺伝子ファミリーに焦点を当て、研究することです。このプロトコルでは、系統を生成し、目的の遺伝子の発現を定量化するためのバイオインフォマティクスステップの概要を説明する。系統樹は、遺伝子が種の内外でどのように進化しているかについての洞察を与えるだけでなく、鳥類学を明らかにすることができます。これらの結果は、RNA-seqデータを用いて、異なる個体または組織におけるこれらの遺伝子の発現を比較するために増強することができる。分子進化と発現の研究は、種間の遺伝子機能の進化と保存のモードを明らかにすることができます。遺伝子ファミリーの特徴付けは、将来の研究のスプリングボードとして機能し、新しいゲノムまたはトランスクリプトーム論文で重要な遺伝子ファミリーを強調することができます。

概要

シーケンシング技術の進歩は、非モデル生物のゲノムおよびトランスクリプトムのシーケンシングを促進してきた。多くの生物からのDNAとRNAのシーケンシングの実現可能性の増加に加えて、関心のある遺伝子を研究するために豊富なデータが一般に公開されています。このプロトコルの目的は、目的の生物に重要な役割を果たす可能性のある遺伝子の分子進化と発現を調査するためのバイオインフォマティクスのステップを提供することです。

遺伝子や遺伝子ファミリーの進化を調査することで、生物学的システムの進化に関する洞察を得ることができます。遺伝子ファミリーのメンバーは、通常、保存されたモチーフまたは相同遺伝子配列を同定することによって決定される。遺伝子ファミリーの進化は、以前は遠縁モデル生物1のゲノムを用いて調べられた。このアプローチの制限は、これらの遺伝子ファミリーが密接に関連する種でどのように進化し、異なる環境選択的圧力の役割が明確でないということです。このプロトコルでは、密接に関連する種のホモログの探索を含む。系統レベルで系統を生成することで、保存された遺伝子や系統特異的な重複などの遺伝子ファミリーの進化の傾向に注意することができます。このレベルでは、遺伝子がオルソログかパラログかを調べることもできます。多くのホモログは互いに同様に機能する可能性が高いが、必ずしも2の場合ではない。これらの研究に系統樹を組み込むことは、これらの相同遺伝子がオルソログであるかどうかを解決するために重要である。真核生物において、多くのオルソログは、哺乳類タンパク質が酵母オルソログ3の機能を回復する能力によって証明されるように、細胞内で同様の機能を保持している。しかし、非オーソリンス遺伝子が特徴付き機能4を行う場合があります。

系統樹は遺伝子と種の関係を引き起じ始めますが、遺伝的関係だけに基づいて機能を割り当てることはできません。遺伝子発現解析と機能性アノテーションと濃縮分析を組み合わせることで、遺伝子機能を強力にサポートします。遺伝子発現を定量化し、個人や組織の種類を比較できるケースは、潜在的な機能をより伝えることができます。以下のプロトコルは、Hydra下流7のオプシン遺伝子の調査に用いられる方法に従うが、それらはあらゆる種およびあらゆる遺伝子ファミリーに適用することができる。このような研究の結果は、非モデル生物における遺伝子機能および遺伝子ネットワークのさらなる調査のための基礎を提供する。一例として、光伝達カスケードを開始するタンパク質であるオプシンの系統の調査は、眼および光検出8、9、10、11の進化にコンテキストを与える。この場合、非モデル生物、特にクニダリアンやクテノフォアなどの基底動物種は、クレード12、13、14にわたる光変調カスケードおよび視力の保全または変化解明することができる。同様に、他の遺伝子ファミリーの系統、発現、ネットワークを決定することは、適応の根底にある分子メカニズムについて私たちに知らせるでしょう。

プロトコル

このプロトコルは、UCアーバイン動物ケアガイドラインに従います。

1. RNA-セクライブラリ調製

  1. RNAを分離するには、以下の方法を用いた。
    1. サンプルを収集します。RNAを後で抽出する場合、フラッシュは、サンプルを凍結するか、RNAストレージ溶液15(材料の表)に置く。
    2. 目的の組織を分離するために生物を安楽死させ、解剖する。
    3. 抽出キットを用いて全RNAを抽出し、RNA精製キットを用いてRNAを精製する(材料表)
      注:異なる種や組織の種類16、17のためにより良く働くプロトコルやキットがあります。我々は、バタフライ18とゼラチン性ヒドラ19の異なる身体組織からRNAを抽出した(議論参照)。
    4. 各サンプルのRNAの濃度と品質を測定する(材料表)。RNA 完全性番号 (RIN) が 8 より高いサンプルを使用し、理想的には 920 に近い cDNA ライブラリを構築します。
  2. cDNAライブラリとシーケンスを次のように構築します。
    1. ライブラリ準備の取扱説明書に従ってcDNAライブラリを構築します(説明を参照)。
    2. cDNAの濃度と品質を決定する(材料表)。
    3. ライブラリを多重化し、それらをシーケンスします。

2. コンピュータ クラスタへのアクセス

注: RNA-seq 解析は大きなファイルの操作を必要とし、コンピュータ クラスタ (材料表) で行うのが最善です。

  1. ターミナル (Mac) または PuTTY (Windows) アプリケーション ウィンドウで コマンド ssh username@clusterlocation を使用して、コンピューター クラスター アカウントにログインします。

3. RNA-seq 読み取りを取得する

  1. シーケンシング機能から RNA-seq を取得するか、またはパブリケーションで生成されたデータの場合は、それが保管されたデータ リポジトリ (3.2 または 3.3) から読み取ります。
  2. ArrayExpress などのリポジトリからデータをダウンロードするには、次の操作を行います。
    1. アクセス番号を使用してサイトを検索します。
    2. データをダウンロードするリンクを見つけ、左クリックして [ リンクのコピー] を選択します。
    3. ターミナル ウィンドウで 、wget と入力し、[ リンクを貼り付け] を選択して、データを分析用のディレクトリにコピーします。
  3. NCBI ショート読取りアーカイブ (SRA) データをダウンロードするには、次の代替手順に従います。
    1. ターミナルで wgetを使用して SRA ツールキット v. 2.8.1 をダウンロードします。
      注 : プログラムをダウンロードしてコンピュータ クラスタにインストールするには、ルート アクセスが必要な場合があります。
    2. tar -xvf $TARGZFILEと入力してプログラムのインストールを完了します。
    3. NCBI でダウンロードするサンプルの SRA アクセス番号を検索すると、SRRXXXXXX という形式になります。
    4. RNA-seq データを取得するには、ターミナル ウィンドウに [sratoolkit 位置]/bin/prefetch SRRXXXXXX と入力します。
    5. ペアエンドファイルの場合は 、[sratoolkit location]/bin/fastq-dump --split-files SRRXXXXXX を使用して、2 つのファストQファイル(SRRXXXXXX_1.FASTQ と SRRXXXXXX_2.FASTQ)を取得します。
      注:トリニティ ・デ・ノボ ・アセンブリを行うには 、コマンド[sratoolkitの場所]/ビン/ファストqダンプ --defline-seq '@$sn[_$rn]/$ri'--スプリットファイルSRRXXXXXXを使用してください

4.トリムアダプタと低品質の読み取り(オプション)

  1. コンピューティング クラスターに Trimmomatic21 v. 0.35 をインストールまたはロードします。
  2. RNA-seq データ ファイルが配置されているディレクトリに、トリミングされた jar ファイルの場所、入力 FASTQ ファイル、出力 FASTQ ファイル、および読み取り長さや品質などのオプションのパラメーターを含むコマンドを入力します。
    注: コマンドは、読み取りの生の品質と長さによって異なります。Nexteraプライマーによるイルミナ43 bp読み取りについては 、Java -jar /データ/アプリ/トリミング/0.35/trimmomatic-0.35.jar PE $READ 1を使用しました。ファストク $READ 2.ファストクpaired_READ1。ファストクunpaired_READ1。ファストクpaired_READ2。ファストクunpaired_READ2。ファストク・イルミナクリップ:adapters.fa:2:30:10 先頭:20 トレーリング:20 スライディングウィンドウ:4:17 分:30分の10。

5. 参照アセンブリを取得する

  1. グーグル、エンセンブルゲノム、NCBIゲノムおよびヌクレオチドTSA(トランスクリプトームショットガンアセンブリ)を検索して、目的の種の参照ゲノムまたは組み立てられたトランスクリプトームを検索します(図1)。
    注:参照ゲノムまたはトランスクリプトームが利用できないか、または低品質である場合は、ステップ6に進み、 デノボ アセンブリを生成します。
  2. 参照ゲノムまたは組み立てられたトランスクリプトームが存在する場合は、以下の手順に従って、高速ファイルとして、分析を実行する場所にダウンロードします。
    1. ゲノムをダウンロードするリンクを探し、左クリックして リンクをコピーします。
    2. ターミナルウィンドウで 、wget と入力し、リンクアドレスを貼り付けます。可能であれば、参照ゲノムのGTFファイルとプロテインFASTAファイルもコピーします。

6. デノボ アセンブリを生成する(ステップ5の代替)

  1. cat *READ1 と入力して、すべてのサンプルに対して RNA-seq READ1 ファイルと READ2 ファストQ ファイルを結合します 。ファストク > $all_READ1.ファストク猫 *READ2.ファストク> all_READ2。 ターミナル ウィンドウの FASTQ。
  2. トリニティ22 v.2.8.5 をコンピューティング クラスタにインストールまたはロードします。
  3. ターミナルに入力して生成し、アセンブリします: トリニティ --seqType fq --max_memory 20G --左$all_READ1。FASTQ --右$all_READ2。ファストク。

7. ゲノム(7.1)または デノボ トランスクリプトーム(7.2)への読み取りをマップする

  1. STAR23 v. 2.6.0c および RSEM24 v. 1.3.0 を使用して、参照ゲノムに読み取りをマップします。
    1. STAR v. 2.6.0c をインストールまたはロードします。そして、RSEM v. 1.3.0 をコンピューティング クラスタに対して行います。
    2. 「rsem-prepare-reference --gtf $GENOME」と入力してゲノムにインデックスを付けます。GTF --star -p 16 $GENOME。ファスタ$OUTPUT。
    3. 各サンプルの読み取りと計算を行う場合は 、rsem-calculate-expression -p 16 --star --paired end $READ 1 と入力します。ファストク $READ 2.ファストク$INDEX $OUTPUT。
    4. mv RSEM.genes.results $sample.genes.results.results.resultsを使用して、結果ファイルの名前をわかりやすい名前に変更します。
    5. rsem生成データマトリックス*[遺伝子/isoforms.results]> $OUTPUT入力して、すべてのカウントの行列を生成します。
  2. RSEMとボウタイを使用して、RNA-seqをトリニティ ・デ・ノボ ・アセンブリーにマッピングします。
    1. トリニティ22 v.2.8.5、ボウタイ25 v. 1.0.0、RSEM v. 1.3.0 をインストールまたはロードします。
    2. [trinity_location]/align_and_estimate_abundance.pl --prep-reference --transcripts $TRINITYと入力して、各サンプルの読み取りと計算 式をマップします。FASTA --seqType fq --左$READ 1。ファストク --右 $READ 2.FASTQ --est_method RSEM --aln_methodボウタイ --trinity_mode --output_dir $OUTPUT。
    3. mv RSEM.genes.results $sample.genes.results.results.resultsを使用して、結果ファイルの名前をわかりやすい名前に変更します。
    4. [trinity_location]/abundance_estimates_to_matrix.pl est_method --rsEM *[遺伝子/アイソフォーム]と入力して、すべてのカウントのマトリックスを生成します。

8. 目的の遺伝子を特定する

注:次の手順は、ヌクレオチドまたはタンパク質FASTAファイルで行うことができますが、最も良く動作し、タンパク質配列でより簡単です。タンパク質からタンパク質へのBLAST検索は、異なる種間を検索する際に結果を与える可能性が高い。

  1. 参照ゲノムの場合は、STEP 5.2.2のタンパク質FASTAファイルを使用するか、補足材料を参照してカスタム遺伝子特徴GTFを生成します。
  2. デノボトランスクリプトームの場合は、トランスデコーダーを使用してプロテインFASTAを生成します。
    1. コンピュータ cluser に TransDecoder v. 5.5.0 をインストールまたはロードします。
    2. 「トランスデコーダーの位置」/TransDecoder.LongOrfs -t $TRINITYと入力して、最も長いオープンリーディングフレームと予測ペプチドシーケンスを見つけます。ファスト。
  3. NCBIゲンバンクで密接に関連する種のホモログを検索します。
    1. インターネットブラウザウィンドウを開き、https://www.ncbi.nlm.nih.gov/genbank/ に移動します。
    2. 検索バーに、対象遺伝子の名前と、配列または属またはフィラムの密接に関連する種の名前を入力します。検索バーの左側でタンパク質を選択し、[検索]をクリックします。
    3. [送信]をクリックしてシーケンスを抽出し、[ファイル] を選択します。[フォーマット] で [FASTA] を選択し、[ファイルの作成] をクリックします。
    4. ローカルターミナルウィンドウで scp $FASTA username@clusterlocation:/$DIR と入力するか、FileZillaを使用してコンピュータとクラスタとの間でファイルを転送することにより、ホモログのFASTAファイルをコンピュータクラスタに移動します。
  4. BLAST+26を使用して候補遺伝子を検索します。
    1. BLAST+ v. 2.8.1 をコンピュータ クラスタにインストールまたはロードします。
    2. コンピュータクラスタでは、ゲノムまたはトランスクリプトーム翻訳タンパク質FASTAからBLASTデータベースを作成し 、[BLAST+ ロケーション]/makeblastdb -in $PEP入力します。FASTA -db 型のプロト -アウト $OUTPUT
    3. BLASTはNCBIから目的種のデータベースに対する相同遺伝子配列を [BLAST+場所]/blastp-db $DATABASE-query $FASTA -evalue 1e-10 -outfmt 6 -max_target_seqs 1 -out $OUTPUTと入力して目的の種のデータベースにする。
    4. 詳細コマンドを使用して出力ファイルを表示します。対象の種から新しいテキスト ファイルに、一意の遺伝子 ID をコピーします。
    5. perl -ne 'if(/^>(\S+)/){$c=$i{$1}}$c?print:chomp;$i{$_}=1'$gene_id.txt $PEPを@ARGVして、候補遺伝子の配列を抽出します。ファスタ> $OUTPUT。
  5. 相互BLASTを用いて遺伝子注釈を確認する。
    1. インターネットブラウザで https://blast.ncbi.nlm.nih.gov/Blast.cgi に行きます。
    2. tblastnを選択し、候補シーケンスを貼り付け、非冗長タンパク質配列データベースを選択してBLASTをクリックします。
  6. ゲノムまたはトランスクリプトーム内のすべての遺伝子に遺伝子オントロジー(GO)用語を付けて追加遺伝子を同定する(議論参照)。
    1. プロテイン FASTA をローカル コンピュータに転送します。
    2. Blast2GO27、28、29v. 5.2 をダウンロードしてローカル コンピュータにインストールします。
    3. Blast2GOを開き、[ファイル] をクリックし、[読み込み] に移動し、[シーケンスの読み込み]をクリックします。FASTA ファイルを選択し、[ロード] をクリックします。
    4. ブラストをクリックし、[NCBI ブラスト] を選択して 、[次へ] をクリックします。パラメータを編集するか、[次へ] をクリックしてパラメータを編集し、[実行] をクリックして最も類似した遺伝子の説明を見つけます。
    5. マッピングをクリックしてから[ 実行 ]をクリックして、類似したタンパク質の遺伝子オントロジーアノテーションを検索します。
    6. 次に [インタープロ] をクリックし 、[EMBL-EBI インタープロ] を選択して 、[ 次へ] をクリックします。パラメータを編集するか、[ 次へ] をクリックし、[ 実行 ] をクリックして、既知の遺伝子ファミリおよびドメインのシグネチャを検索します。
    7. [ ファイル] をクリックしてコメントを エクスポートし、[エクスポート] を選択して [ テーブルのエクスポート] をクリックします。[ 参照] をクリックし、ファイル名を 指定して [保存] をクリックし、[ エクスポート] をクリックします。
    8. 追加の候補遺伝子を特定するために、GO の対象用語の注釈テーブルを検索します。FASTA ファイルからシーケンスを抽出する (STEP 8.4.5)

9. 系統樹

  1. MEGA30 v. 7.0.26 をダウンロードしてローカルコンピュータにインストールします。
  2. MEGA を開き、[配置] をクリックし、[配置の編集/作成]をクリックします。
  3. アライメントウィンドウが開いたら、[ 編集]をクリックし、[ ファイルからシーケンスを挿入 ] をクリックして、候補遺伝子と可能性のあるホモログのタンパク質配列を含む FASTA を選択します。
  4. すべてのシーケンスを選択します。アームシンボルを見つけて、その上にカーソルを合わせます。それはMUSCLE31 アルゴリズムを使用して配列を整列と言うべきです。アーム記号をクリックし、「 タンパク質の位置合わせ 」をクリックして、配列を整列させます。パラメータを編集するか 、[OK]を クリックしてデフォルト パラメータを使用して整列します。
  5. 視覚的に検査し、手動で変更を加え、配置ウィンドウを保存して閉じます。
  6. メイン MEGA ウィンドウで、[ モデル] をクリックし、[ 最適な DNA/タンパク質モデルの検索 (ML)] をクリックし、アライメント ファイルを選択し、次のような対応するパラメーターを選択します: 分析: モデル選択 (ML)、使用するツリー: 自動 (隣接するツリー) 統計方法: 最も高い可能性, 置換タイプ: アミノ酸, ギャップ/欠損データ処理: すべてのサイトを使用, ブランチ サイト フィルター: なし.
  7. データに最適なモデルが決定されたら、メインの MEGA ウィンドウに移動します。 [Phylogeny] をクリックし、[ コントクト/テスト最大尤度ツリー ] をクリックし、必要に応じて配置を選択します。ツリーに適切なパラメータを選択: 統計法:最大尤度、系統のテスト:100複製のブートストラップ法、置換タイプ:アミノ酸、モデル:Freqsを使用するLG。(+F)、サイト間のレート:5つの離散ガンマガンマカテゴリを持つガンマ分布(G)、ギャップ/欠損データ処理:すべての部位を使用し、MLヒューリスティック法:近傍インターチェンジ(NNI)。

10. TPMを用いた遺伝子発現の可視化

  1. トリニティの場合、コンピュータクラスタ上で abundance_estimates_to_matrix.pl が実行されたディレクトリに移動し、出力の1つが行列である必要があります。TPM.not_cross_norm。このファイルをローカル コンピュータに転送します。
    注: クロス サンプルの正規化については、補足資料を参照してください。
  2. ゲノム解析のTPMについては、以下の手順に従います。
    1. コンピュータ クラスタで、RSEM のインストール場所に移動します。scp rsem 生成データマトリックスを入力して、rsem 生成 データマトリックスをコピーします。 nano を使用して新しいファイルを編集し、TPMの場合は「私の$offsite = 4」を4から5に変更すると、「私の$offsite = 5」と表示されます。
  3. RSEM 出力ファイル .genes.results が存在するディレクトリに移動し 、rsem 生成 TPM-マトリックス *[genes/isoforms.results] > $OUTPUT を使用して TPM 行列を生成します。ローカル コンピューターに結果を転送します。
  4. ggplot2 で結果を視覚化します。
    1. R v. 4.0.0 および RStudio v. 1.2.1335 をローカル コンピューターにダウンロードします。
    2. 画面の右側にある RStudio を開いて [ パッケージ ] タブに移動し、[ インストール] をクリックします。 ggplot2 と入力し、[ インストール] をクリックします。
    3. データを入力して TPM テーブルに読み取られた R スクリプト ウィンドウで <-read.table("$tpm.txt"、ヘッダー = T)
    4. 図 4に似た棒グラフの場合、p<- ggplot() + geom_bar(aes(y=TPM、x=シンボル、フィル=ティッシュ)、データ=データ、stat="アイデンティティに似たものを入力します。
      fill<-c("#d7191c","#fdae61"、"#ffffbf"、"#abd9e9"、"#2c7bb6")
      p<-p+scale_fill_manual(値=塗りつぶし)
      p + テーマ(軸.text.x = element_text(角度 = 90))

結果

上記の方法は 図1 に要約され、 ヒドラ下品 組織のデータセットに適用された。 H. 下垂体 は、サンゴ、クラゲ、イソギンチャクを含むフィラム クニダリア に属する淡水無脊椎動物です。 H.下品は 出芽によって無性を再現することができ、二分すると頭と足を再生することができます。本研究では、 ヒドラ7における?...

ディスカッション

このプロトコルの目的は、RNA-seqデータを用いて遺伝子ファミリーを特徴付けるためのステップの概要を提供することにある。これらの方法は、さまざまな種やデータセット4、3435に対して機能することが証明されています。ここで確立されたパイプラインは簡素化されており、バイオインフォマティクスの初心者が続く...

開示事項

著者らは開示するものは何もない。

謝辞

アドリアナ・ブリスコ、ギル・スミス、ラビ・ムラド、アリーン・G・レンゲルに、これらのステップのいくつかをワークフローに組み込む際のアドバイスとガイダンスに感謝します。また、キャサリン・ウィリアムズ、エリザベート・レボア、ナターシャ・ピッチャーニの原稿に対するコメントに感謝しています。この研究の一部は、ジョージ・E・ヒューイット医学研究フェローシップによって支援されました.M.M。

資料

NameCompanyCatalog NumberComments
Bioanalyzer-DNA kitAgilent5067-4626wet lab materials
Bioanalyzer-RNA kitAgilent5067-1513wet lab materials
BLAST+ v. 2.8.1On computer cluster*
https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/
Blast2GO (on your PC)On local computer
https://www.blast2go.com/b2g-register-basic
boost v. 1.57.0On computer cluster
Bowtie v. 1.0.0On computer cluster
https://sourceforge.net/projects/bowtie-bio/files/bowtie/1.3.0/
Computing cluster (highly recommended)NOTE: Analyses of genomic data are best done on a high-performance computing cluster because files are very large.
Cufflinks v. 2.2.1On computer cluster
edgeR v. 3.26.8 (in R)In Rstudio
https://bioconductor.org/packages/release/bioc/html/edgeR.html
gcc v. 6.4.0On computer cluster
Java v. 11.0.2On computer cluster
MEGA7 (on your PC)On local computer
https://www.megasoftware.net
MEGAX v. 0.1On local computer
https://www.megasoftware.net
NucleoSpin RNA II kitMacherey-Nagel740955.5wet lab materials
perl 5.30.3On computer cluster
pythonOn computer cluster
Qubit 2.0 FluorometerThermoFisherQ32866wet lab materials
R v.4.0.0On computer cluster
https://cran.r-project.org/src/base/R-4/
RNAlaterThermoFisherAM7021wet lab materials
RNeasy kitQiagen74104wet lab materials
RSEM v. 1.3.0Computer software
https://deweylab.github.io/RSEM/
RStudio v. 1.2.1335On local computer
https://rstudio.com/products/rstudio/download/#download
Samtools v. 1.3Computer software
SRA Toolkit v. 2.8.1On computer cluster
https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit
STAR v. 2.6.0cOn computer cluster
https://github.com/alexdobin/STAR
StringTie v. 1.3.4dOn computer cluster
https://ccb.jhu.edu/software/stringtie/
Transdecoder v. 5.5.0On computer cluster
https://github.com/TransDecoder/TransDecoder/releases
Trimmomatic v. 0.35On computer cluster
http://www.usadellab.org/cms/?page=trimmomatic
Trinity v.2.8.5On computer cluster
https://github.com/trinityrnaseq/trinityrnaseq/releases
TRIzolThermoFisher15596018wet lab materials
TruSeq RNA Library Prep Kit v2IlluminaRS-122-2001wet lab materials
TURBO DNA-free KitThermoFisherAM1907wet lab materials
*Downloads and installation on the computer cluster may require root access. Contact your network administrator.

参考文献

  1. Lespinet, O., Wolf, Y. I., Koonin, E. V., Aravind, L. The role of lineage-specific gene family expansion in the evolution of eukaryotes. Genome Research. 12 (7), 1048-1059 (2002).
  2. Gabaldón, T., Koonin, E. V. Functional and evolutionary implications of gene orthology. Nature Reviews Genetics. 14 (5), 360-366 (2013).
  3. Dolinski, K., Botstein, D. Orthology and Functional Conservation in Eukaryotes. Annual Review of Genetics. 41 (1), (2007).
  4. Macias-Muñoz, A., McCulloch, K. J., Briscoe, A. D. Copy number variation and expression analysis reveals a non-orthologous pinta gene family member involved in butterfly vision. Genome Biology and Evolution. 9 (12), 3398-3412 (2017).
  5. Cannon, S. B., Mitra, A., Baumgarten, A., Young, N. D., May, G. The roles of segmental and tandem gene duplication in the evolution of large gene families in Arabidopsis thaliana. BMC plant biology. 4, 10 (2004).
  6. Eastman, S. D., Chen, T. H. P., Falk, M. M., Mendelson, T. C., Iovine, M. K. Phylogenetic analysis of three complete gap junction gene families reveals lineage-specific duplications and highly supported gene classes. Genomics. 87 (2), 265-274 (2006).
  7. Macias-Munõz, A., Murad, R., Mortazavi, A. Molecular evolution and expression of opsin genes in Hydra vulgaris. BMC Genomics. 20 (1), 1-19 (2019).
  8. Hisatomi, O., Tokunaga, F. Molecular evolution of proteins involved in vertebrate phototransduction. Comparative Biochemistry and Physiology - B Biochemistry and Molecular Biology. 133 (4), 509-522 (2002).
  9. Arendt, D. Evolution of eyes and photoreceptor cell types. International Journal of Developmental Biology. 47, 563-571 (2003).
  10. Shichida, Y., Matsuyama, T. Evolution of opsins and phototransduction. Philosophical Transactions of the Royal Society B: Biological Sciences. 364 (1531), 2881-2895 (2009).
  11. Porter, M. L., et al. Shedding new light on opsin evolution. Proceedings of the Royal Society B: Biological Sciences. 279 (1726), 3-14 (2012).
  12. Plachetzki, D. C., Degnan, B. M., Oakley, T. H. The origins of novel protein interactions during animal opsin evolution. PLoS ONE. 2 (10), 1054 (2007).
  13. Ramirez, M. D., et al. The last common ancestor of most bilaterian animals possessed at least nine opsins. Genome Biology and Evolution. 8 (12), 3640-3652 (2016).
  14. Schnitzler, C. E., et al. Genomic organization, evolution, and expression of photoprotein and opsin genes in Mnemiopsis leidyi: a new view of ctenophore photocytes. BMC Biology. 10, 107 (2012).
  15. Pedersen, K. B., Williams, A., Watt, J., Ronis, M. J. Improved method for isolating high-quality RNA from mouse bone with RNAlater at room temperature. Bone Reports. 11, 100211 (2019).
  16. Ridgeway, J. A., Timm, A. E., Fallon, A. Comparison of RNA isolation methods from insect larvae. Journal of Insect Science. 14 (1), 4-8 (2014).
  17. Scholes, A. N., Lewis, J. A. Comparison of RNA isolation methods on RNA-Seq: Implications for differential expression and meta-Analyses. BMC Genomics. 21 (1), 1-9 (2020).
  18. Briscoe, A. D., et al. Female behaviour drives expression and evolution of gustatory receptors in butterflies. PLoS genetics. 9 (7), 1003620 (2013).
  19. Murad, R., Macias-Muñoz, A., Wong, A., Ma, X., Mortazavi, A. Integrative analysis of Hydra head regeneration reveals activation of distal enhancer-like elements. bioRxiv. , 544049 (2019).
  20. Gallego Romero, I., Pai, A. A., Tung, J., Gilad, Y. Impact of RNA degradation on measurements of gene expression. BMC Biology. 12, 42 (2014).
  21. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  22. Trinity. . RNA-Seq De novo Assembly Using Trinity. , 1-7 (2014).
  23. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29, 15-21 (2013).
  24. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC bioinformatics. 12, 323 (2011).
  25. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome biology. 10, 25 (2009).
  26. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10, 421 (2009).
  27. Conesa, A., Götz, S. Blast2GO: A comprehensive suite for functional analysis in plant genomics. International Journal of Plant Genomics. 619832, (2008).
  28. Conesa, A., et al. Blast2GO: A universal tool for annotation, visualization and analysis in functional genomics research. Bioinformatics. 21 (18), 3674-3676 (2005).
  29. Götz, S., et al. High-throughput functional annotation and data mining with the Blast2GO suite. Nucleic Acids Research. 36 (10), 3420-3435 (2008).
  30. Kumar, S., Stecher, G., Tamura, K. MEGA7: Molecular Evolutionary Genetics Analysis version 7.0 for bigger datasets. Molecular biology and evolution. 33 (7), 1870-1874 (2016).
  31. Edgar, R. C. MUSCLE: Multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  32. Taddei-Ferretti, C., Musio, C., Santillo, S., Cotugno, A. The photobiology of Hydra's periodic activity. Hydrobiologia. 530, 129-134 (2004).
  33. Chapman, J. A., et al. The dynamic genome of Hydra. Nature. 464 (7288), 592-596 (2010).
  34. Macias-Muñoz, A., Rangel Olguin, A. G., Briscoe, A. D. Evolution of phototransduction genes in Lepidoptera. Genome Biology and Evolution. 11 (8), 2107-2124 (2019).
  35. Macias-Munõz, A., Murad, R., Mortazavi, A. Molecular evolution and expression of opsin genes in Hydra vulgaris. BMC Genomics. 20 (1), (2019).
  36. Picelli, S., et al. Full-length RNA-seq from single cells using Smart-seq2. Nature Protocols. 9 (1), 171-181 (2014).
  37. Tavares, L., Alves, P. M., Ferreira, R. B., Santos, C. N. Comparison of different methods for DNA-free RNA isolation from SK-N-MC neuroblastoma. BMC research notes. 4, 3 (2011).
  38. Johnson, M. T. J., et al. Evaluating Methods for Isolating Total RNA and Predicting the Success of Sequencing Phylogenetically Diverse Plant Transcriptomes. PLoS ONE. 7 (11), (2012).
  39. Zhao, S., Zhang, Y., Gamini, R., Zhang, B., Von Schack, D. Evaluation of two main RNA-seq approaches for gene quantification in clinical RNA sequencing: PolyA+ selection versus rRNA depletion. Scientific Reports. 8 (1), 1-12 (2018).
  40. Zhao, S., et al. Comparison of stranded and non-stranded RNA-seq transcriptome profiling and investigation of gene overlap. BMC Genomics. 16 (1), 1-14 (2015).
  41. Corley, S. M., MacKenzie, K. L., Beverdam, A., Roddam, L. F., Wilkins, M. R. Differentially expressed genes from RNA-Seq and functional enrichment results are affected by the choice of single-end versus paired-end reads and stranded versus non-stranded protocols. BMC Genomics. 18 (1), 1-13 (2017).
  42. Haas, B. J., et al. De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis. Nature Protocols. 8 (8), 1494-1512 (2013).
  43. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature biotechnology. 33 (3), 290-295 (2015).
  44. Bray, N. L., Pimentel, H., Melsted, P., Pachter, L. Near-optimal probabilistic RNA-seq quantification. Nature Biotechnology. 34 (5), 525-527 (2016).
  45. Patro, R., Duggal, G., Love, M. I., Irizarry, R. A., Kingsford, C. Salmon provides fast and bias-aware quantification of transcript expression. Nature Methods. 14 (4), 417-419 (2017).
  46. Araujo, F. A., Barh, D., Silva, A., Guimarães, L., Thiago, R. . OPEN GO FEAT a rapid web-based functional annotation tool for genomic and transcriptomic data. , 8-11 (2018).
  47. Huerta-Cepas, J., et al. Fast genome-wide functional annotation through orthology assignment by eggNOG-mapper. Molecular Biology and Evolution. 34 (8), 2115-2122 (2017).
  48. Huerta-Cepas, J., et al. EggNOG 5.0: A hierarchical, functionally and phylogenetically annotated orthology resource based on 5090 organisms and 2502 viruses. Nucleic Acids Research. 47, 309-314 (2019).
  49. Törönen, P., Medlar, A., Holm, L. PANNZER2: A rapid functional annotation web server. Nucleic Acids Research. 46, 84-88 (2018).
  50. Robinson, M., Mccarthy, D., Chen, Y., Smyth, G. K. . edgeR differential expression analysis of digital gene expression data User's Guide. , (2013).
  51. Huang, D. W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  52. Huang, D. W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: Paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  53. Letunic, I., Bork, P. Interactive tree of life (iTOL) v3: an online tool for the display and annotation of phylogenetic and other trees. Nucleic acids research. 44, 242-245 (2016).

転載および許可

このJoVE論文のテキスト又は図を再利用するための許可を申請します

許可を申請

さらに記事を探す

171BLASTMEGA

This article has been published

Video Coming Soon

JoVE Logo

個人情報保護方針

利用規約

一般データ保護規則

研究

教育

JoVEについて

Copyright © 2023 MyJoVE Corporation. All rights reserved