このコンテンツを視聴するには、JoVE 購読が必要です。 サインイン又は無料トライアルを申し込む。
Method Article
ここで示すプロトコルは、高度な統計分析アプローチへの品質管理と前処理のステップを含む、生の読み取りから機能分析までのRNAシーケンシングトランスクリプトームデータを分析するための完全なパイプラインを説明しています。
病原体は、多種多様な感染症を引き起こす可能性があります。感染に応答して宿主によって誘導される生物学的プロセスは、疾患の重症度を決定する。このようなプロセスを研究するために、研究者は、感染、臨床結果、または疾患重症度の異なる段階で宿主転写体の動的変化を測定するハイスループットシーケンシング技術(RNA-seq)を使用することができます。この調査は、病気のより良い理解につながるだけでなく、潜在的な薬物標的と治療を明らかにすることができます。ここで示すプロトコルは、生の読み取りから機能解析までの RNA シーケンシング データを分析するための完全なパイプラインを記述します。パイプラインは 5 つのステップに分けられます: (1) データの品質管理;(2)遺伝子のマッピングと注釈(3)遺伝子と共発現遺伝子の遺伝子を分化して同定する統計解析(4)サンプルの摂動の分子程度の決定;(5)機能分析。手順 1 では、下流解析の品質に影響を与える可能性のある技術的なアーティファクトを削除します。ステップ2では、遺伝子は標準ライブラリプロトコルに従ってマッピングされ、また、アポイントトされます。ステップ3の統計解析では、感染していないサンプルと比較して、感染したサンプルで差で発現または共発現している遺伝子を特定します。サンプルの変動性および潜在的な生物学的外れ値の存在は、ステップ4の摂動アプローチの分子程度を使用して検証される。最後に、ステップ5の機能解析は、疾患表現型に関連する経路を明らかにする。このパイプラインは、宿主と病原体の相互作用研究によるRNA-seqデータ分析を通じて研究者を支援し、感染の分子メカニズムを理解するために不可欠なインビトロ または インビボ実験の 未来を推進することを目的としています。
デング熱、黄熱病、チクングニア、ジカなどのアルボウイルスは、いくつかの流行の流行に広く関連しており、過去数十年でヒトに感染する主な病原体の1つとして出現しました1,2。チクングニアウイルス(CHIKV)に感染した人は、発熱、頭痛、発疹、ポリアルーギー、関節炎を持つことがよくあります3,4,5。ウイルスは、細胞の遺伝子発現を破壊し、様々な宿主シグナル伝達経路に影響を与える可能性があります。近年、血液転写酵素研究は、RNA-seqを利用して、回復期6または健康なコントロール7と比較して急性CHIKV感染に関連する微分発現遺伝子(DEG)を同定した。CHIKVに感染した小児は、ウイルスRNAの細胞センサー、JAK/STATシグナル伝達、TOLL様受容体シグナル伝達経路に関連するものなど、先天性免疫に関与する遺伝子を有していた。CHIKVに急性感染した成人は、単球および樹状細胞活性化に関連するもの、および抗ウイルス応答に関連するものなど、先天性免疫に関連する遺伝子の誘導も示した。ダウンレギュレーション遺伝子を豊富に含むシグナル経路には、T細胞の活性化やT細胞およびB細胞における分化および濃縮などの適応免疫に関連するものが含まれていた。
宿主および病原体遺伝子のトランスクリプトームデータを分析するために、いくつかの方法を使用することができる。多くの場合、RNA-seqライブラリー調製は成熟したポリA転写物の濃縮から始まります。このステップは、リボソームRNA(rRNA)の大部分を除去し、いくつかのケースではウイルス/細菌RNAを除去する。しかし、生物学的な質問が病原体転写物検出を伴い、RNAが以前の選択とは無関係に配列化される場合、他の多くの異なる転写物はシーケンシングによって検出され得る。例えば、サブゲノムmRNAは、疾患の重症度を確認する重要な因子であることが示されている8。さらに、CHIKVやSARS-CoV-2のような特定のウイルスに対して、ポリA濃縮ライブラリでさえ、下流の分析で利用できるウイルス読み取りを生成します9,10。宿主転写体の分析に焦点を当てると、研究者はサンプル間の生物学的摂動を調べ、微分発現された遺伝子および濃縮経路を同定し、共発現モジュール7,11,12を生成することができます。このプロトコルは、異なるバイオインフォマティクスアプローチを用いたCHIKV感染患者および健常者の転写分析を強調する(図1A)。以前に発表された研究からのデータ7は、20人の健康な人と39人のCHIKV急性感染者からなるが、代表的な結果を生成するために使用された。
このプロトコルで使用されるサンプルは、サンパウロ大学生物医学研究所の微生物学部門とセルジペ連邦大学の両方の倫理委員会によって承認されました(プロトコル:54937216.5.0000.5400.5467と54835916.2.0000.5546)。
1. Docker デスクトップのインストール
注: Docker 環境を準備する手順は、オペレーティング システム (OS) によって異なります。したがって、Mac ユーザーは 1.1 としてリストされている手順に従う必要があり、Linux ユーザーは 1.2 としてリストされている手順に従う必要があり、Windows ユーザーは 1.3 としてリストされている手順に従う必要があります。
2. データの品質管理
注: シーケンス読み取りでエラーの確率をグラフィカルに評価します。すべての技術的なシーケンス、例えば、アダプターを削除します。
3. サンプルのマッピングと注釈
注: 良質の読み取りを得た後、これらは参照ゲノムにマッピングされる必要があります。このステップでは、STAR マッパーを使用してサンプル例をマップしました。STARマッパーツールでは、読み込みとゲノムマッピングをロードして実行するために32 GBのRAMメモリが必要です。32 GB の RAM メモリを持たないユーザーは、既にマップされている読み取りを使用できます。このような場合は、ステップ3.3にジャンプするか、ボウタイ2マッパーを使用してください。このセクションには、STAR (すべての図に示す結果) と Bowtie2 (メモリ不足のマッパー) のスクリプトがあります。
4. 遺伝子と共発現遺伝子の発現
5. サンプルの摂動の分子程度の決定
6. 機能強化分析
トランスクリプトーム分析のコンピューティング環境は、Docker プラットフォームで作成および構成されました。このアプローチにより、初心者の Linux ユーザーは、事前管理知識を持たずに Linux 端末システムを使用できます。Docker プラットフォームは、ホスト OS のリソースを使用して、特定のユーザーのツールを含むサービス コンテナーを作成します (図 1B)。Linux OS U...
シーケンシングライブラリの準備は、可能な限り最善の方法で生物学的な質問に答えするための重要なステップです。研究の関心のあるトランスクリプトの種類は、どのシーケンシングライブラリが選択されるかの指針となり、バイオインフォマティクス分析を推進します。例えば、病原体と宿主相互作用のシーケンシングから、シーケンシングの種類に応じて、ホストトランスクリプトの?...
著者らは開示するものは何もない。
HNはFAPESP(助成金番号:#2017/50137-3、2012/19278-6、2018/14933-2、2018/21934-5、2013/08216-2)およびCNPq(313662/2017-7)によって資金提供されています。
私たちは、フェローのための次の助成金に特に感謝しています: ANAG (FAPESPプロセス2019/13880-5), VEM (FAPESPプロセス2019/16418-0), IMSC (FAPESPプロセス2020/05284-0), APV (FAPESPプロセス2019/27146-1) RLTO (CNPq プロセス 134204/2019-0)。
Name | Company | Catalog Number | Comments |
CEMiTool | Computational Systems Biology Laboratory | 1.12.2 | Discovery and the analysis of co-expression gene modules in a fully automatic manner, while providing a user-friendly HTML report with high-quality graphs. |
EdgeR | Bioconductor (Maintainer: Yunshun Chen [yuchen at wehi.edu.au]) | 3.30.3 | Differential expression analysis of RNA-seq expression profiles with biological replication |
EnhancedVolcano | Bioconductor (Maintainer: Kevin Blighe [kevin at clinicalbioinformatics.co.uk]) | 1.6.0 | Publication-ready volcano plots with enhanced colouring and labeling |
FastQC | Babraham Bioinformatics | 0.11.9 | Aims to provide a simple way to do some quality control checks on raw sequence data coming from high throughput sequencing |
FeatureCounts | Bioinformatics Division, The Walter and Eliza Hall Institute of Medical Research | 2.0.0 | Assign mapped sequencing reads to specified genomic features |
MDP | Computational Systems Biology Laboratory | 1.8.0 | Molecular Degree of Perturbation calculates scores for transcriptome data samples based on their perturbation from controls |
R | R Core Group | 4.0.3 | Programming language and free software environment for statistical computing and graphics |
STAR | Bioinformatics Division, The Walter and Eliza Hall Institute of Medical Research | 2.7.6a | Aligner designed to specifically address many of the challenges of RNA-seq data mapping using a strategy to account for spliced alignments |
Bowtie2 | Johns Hopkins University | 2.4.2 | Ultrafast and memory-efficient tool for aligning sequencing reads to long reference sequences |
Trimmomatic | THE USADEL LAB | 0.39 | Trimming adapter sequence tasks for Illumina paired-end and single-ended data |
Get Docker | Docker | 20.10.2 | Create a bioinformatic environment reproducible and predictable (https://docs.docker.com/get-docker/) |
WSL2-Kernel | Windows | NA | https://docs.microsoft.com/en-us/windows/wsl/wsl2-kernel |
Get Docker Linux | Docker | NA | https://docs.docker.com/engine/install/ubuntu/ |
Docker Linux Repository | Docker | NA | https://docs.docker.com/engine/install/ubuntu/#install-using-the-repository |
MDP Website | Computational Systems Biology Laboratory | NA | https://mdp.sysbio.tools |
Enrichr Website | MaayanLab | NA | https://maayanlab.cloud/Enrichr/ |
webCEMiTool | Computational Systems Biology Laboratory | NA | https://cemitool.sysbio.tools/ |
gProfiler | Bioinformatics, Algorithmics and Data Mining Group | NA | https://biit.cs.ut.ee/gprofiler/gost |
goseq | Bioconductor (Maintainer: Matthew Young [my4 at sanger.ac.uk]) | NA | http://bioconductor.org/packages/release/bioc/html/goseq.html |
SRA NCBI study | NCBI | NA | https://www.ncbi.nlm.nih.gov/bioproject/PRJNA507472/ |
このJoVE論文のテキスト又は図を再利用するための許可を申請します
許可を申請This article has been published
Video Coming Soon
Copyright © 2023 MyJoVE Corporation. All rights reserved