JoVE Logo

サインイン

このコンテンツを視聴するには、JoVE 購読が必要です。 サインイン又は無料トライアルを申し込む。

この記事について

  • 要約
  • 要約
  • 概要
  • プロトコル
  • 結果
  • ディスカッション
  • 開示事項
  • 謝辞
  • 資料
  • 参考文献
  • 転載および許可

要約

本手法はホルマリン固定パラフィン埋め込み(FFPE)RNAサンプルから得ることができる配列データの質と量を改善するステップを説明する。我々は、FFPE-RNAサンプルの品質をより正確に評価し、シーケンシングライブラリを準備し、FFPE-RNAサンプルからのデータを分析するための方法論を説明する。

要約

RNAシーケンシング(RNA-seq)による遺伝子発現解析により、臨床サンプルに対する独自の洞察が可能となり、さまざまな疾患の基礎や抵抗性や感受性のメカニズムを機械化的に理解する可能性があります。しかし、臨床検体における組織形態を保存する最も一般的な方法を表すFFPE組織は、遺伝子発現プロファイリング分析の最良の情報源ではありません。このようなサンプルから得られたRNAは、しばしば分解され、断片化され、化学的に修飾され、最適ではないシーケンシングライブラリにつながります。さらに、これらは、遺伝子発現解析や変異発見に信頼性がない可能性のある低品質のシーケンスデータを生成します。FFPEサンプルを最大限に活用し、低品質のサンプルから可能な限り最良のデータを得るためには、実験計画、シーケンスライブラリの準備、データ分析中に、一定の予防措置を講じる必要があります。これには、正確なサンプル品質管理(QC)、シーケンスライブラリ生成中のさまざまなステップに最適な方法の特定、および慎重なライブラリQCのための適切なメトリックの使用が含まれます。さらに、RNA-seqデータのアーチファクトを特定し、汚染や低品質の読み取り、遺伝子被覆の均一性を評価し、生物学的複製物間で遺伝子発現プロファイルの再現性を測定するためには、正しいソフトウェアツールと配列データ解析パラメータを適用することが重要です。これらのステップは非常に異質なRNAサンプルのプロファイリングのための高精度および再現性を保障できる。ここでは、サンプルQC、ライブラリ調製およびQC、シーケンシング、およびFFPE-RNA組織から得られるような低品質RNAから得られる有用なデータの量を増加させるデータ分析のための様々なステップを説明します。

概要

次世代シーケンシングアプローチを利用することで、さまざまな種類のサンプルから豊富な情報を収集することができました。ただし、古くて保存が不十分なサンプルは、一般的に使用されるシーケンスデータの生成方法では動作しないため、確立されたプロトコルを変更する必要が生じることが多い。FFPE,組織は、臨床検体1、2、32に広く利用されてきたこのようなサンプル型を表す。13FFPE保存は組織形態を維持するが、FFPE組織の核酸は通常、広範囲の損傷および分解を示し、様々な障害の根底にある分子メカニズムに関する重要な洞察につながる可能性のあるゲノム情報を取り出すことを困難にする。

RNAシーケンシングによって生成される遺伝子発現データは、疾患や抵抗のメカニズムの研究に役立ち、DNA変異解析を補完することがよくあります。しかし、RNAは分解の影響を受けやすく、FFPE組織から正確な遺伝子発現データを生成することがより困難になります。さらに、シーケンシングの幅広い可用性と手頃な価格が比較的最近であるため、古い標本はRNAの完全性を維持するために必要な条件で保存されなかったことが多かった。FFPEサンプルの問題のいくつかは、パラフィンに埋め込むことによるRNAの分解、シーケンシングに必要な酵素プロセスに対する断片化または屈折性につながるRNAの化学修飾、およびポリA尾の喪失、逆転写酵素4のプライマーとしてのオリゴ-dTの適用性を制限する。もう一つの課題は、最適でない条件下でのFFPEサンプルの取り扱い/保存であり、組織5におけるRNAなどの不安定分子のさらなる分解につながる可能性がある。これは、RNAシーケンシングによる遺伝子発現解析がサンプルに対して予想されていなかった時期に収集された可能性のある古いサンプルに特に関連しています。これらのすべては、有用な配列データを生成するために利用可能な抽出されたRNAの品質と量の減少につながります。成功の可能性が低く、シーケンシングのコストが高いと相まって、多くの研究者が潜在的に有用なFFPEサンプルから遺伝子発現データを生成して分析しようとすることを妨げている。近年のいくつかの研究では、遺伝子発現解析,,2、6、7、8、96に対2するFFPE組織の使用可能性が実証されていますが、最近のサンプルの数が少ない、および/またはより最近のサンプルの場合はあります。,789

実現可能性調査として、我々は、3つの残留組織リポジトリから得られたFFPE腫瘍組織標本から抽出されたRNAを使用して、監視、疫学、および末期結果(SEER)癌登録をRNAシーケンシングおよび遺伝子発現解析10に用いた。臨床病理ラボから調達した、高等度卵巣漿液腺癌からのFFPE組織は、RNA抽出前に様々な条件下で7〜32年保存された。ほとんどの場合、これらのブロックは、将来的に敏感な遺伝子解析を期待することなく、何年も異なる場所に保存されていたので、核酸を保存するためにあまり注意が払われていなかった。したがって、サンプルのほとんどは、細菌で汚染されたサンプルの大部分を有する、質の悪いRNAを示した。それにもかかわらず、遺伝子定量を行い、遺伝子被覆の均一性と連続性を測定し、生物学的複製物間でピアソン相関解析を行い、再現性を測定することができました。主要な遺伝子パネルのセットに基づいて、我々は研究のサンプルを癌ゲノムアトラス(TCGA)データと比較し、サンプルの約60%が同等の遺伝子発現プロファイル11を有することを確認した。各種QC結果とサンプルメタデータとの相関関係に基づいて、我々は、使用可能なシーケンスデータ11を生成する可能性が高いサンプルを同定するための良好な予測値を有する主要なQC指標を同定した。

ここでは、FFPE-RNAの品質評価に用いる方法論、抽出されたRNAサンプルから始まるシーケンシングライブラリの生成、シーケンシングデータのバイオインフォマティクス解析について説明します。

プロトコル

1. RNA量と品質評価

  1. 事前定義された基準に従ってFFPEサンプルを選択し、適切な方法(例えば、FFPE-核酸抽出キット、材料表)を用いてRNAを抽出する。
    注:FFPE-RNA抽出には、非常に少ない組織で動作し、良質のRNA12、13、14を抽出できる新しいマイクロディスセクション法を含む13,14いくつかの異なる方法があります。
  2. RNAの完全性を全ての段階で維持するために、細心の注意を払う必要があります。これには、RNaseフリー脱イオン水の使用、RNaseフリーのプラスチック製品の使用、およびRNase除染試薬でFFPEブロックに接触するすべての機器の洗浄が含まれます。
  3. RNAは、取り扱い中の分解を最小限に抑えるために特に指定しない限り、常に慎重に取り扱い、氷の中に保管する必要があります。
  4. 十分な材料が利用可能な場合は、FFPEブロック内の複数の領域からRNAを抽出し、できるだけ多くのサンプルから生物学的複製を生成します。十分なRNA収率を有するサンプルの中には、抽出したRNAを2つに分割して、技術的な複製として処理します。
  5. 可能であれば、少量のサンプルをQC(すなわちQCアリコート)用抽出後に別々に収集し、RNAの分解を招く可能性のあるサンプルの繰り返し処理および凍結融解サイクルを避ける。
  6. メーカーの指示に従ってRNA QCシステム(例えば、RNAナノチップを使用したAgilentバイオアナライザーシステム、材料表)でRNAを実行して、RNAの品質(好ましくはQCアリコートから)を確認してください。
  7. サンプル中のRNA断片の分布を解析し(例えば、バイオアナライザ2100エキスパートソフトウェアを使用して)、DV 200およびDV100値を200nt(DV200)または100nt(DV100)より大きい断片のパーセントとして計算してサイズを計算します。200
  8. DV200と DV100の中で、特定のサンプル セットの値の広がりが大きいメトリックを特定し、そのサンプルをその無傷性の程度に応じてグループ化する場合に選択します。
    注: より無傷の RNA 分子を持つサンプルセット(すなわち、DV200値が高い、DV200 > 40%)の全部または大部分の場合、DV200は有用な QC メトリックになる可能性があります。しかし、より劣化したトランスクリプトを持つサンプルセット(すなわち、DV200値が低く、DV200 <40%)のすべてまたは大部分のサンプルセットの場合、DV100は有用である可能性が高い。
  9. QC メトリックに基づいて、DV 100 <40%を持つサンプルを特定します。この程度の劣化は有用なシーケンシングデータ11を生成しない可能性が高いため、このようなサンプルの処理を避けることをお勧めします。このようなサンプルの代替品が利用可能な場合、DV 100 >50%のサンプルのみを含むように品質をチェックする必要があります。

2. シーケンシングライブラリの準備

  1. セクション 1 で評価されたサンプルの品質に基づいて、シーケンス ライブラリを生成するための適切な方法を特定します。
    1. 非常に低い劣化および高いDV200値を有するサンプルセットの場合、mRNAシーケンシング(すなわち、 ポリアデニル化されたトランスクリプトの捕捉、標的化されたRNAシーケンシング(すなわち、対象となる特定の遺伝子の捕獲プローブの使用)、RNAエキソームシーケンシング(すなわち、コードトランスクリプトームのために濃縮するための捕獲プローブの使用)、または全RNAシーケンシング(すなわち、RNAの逆転写に対するランダムプライマーの使用)しかし、固定プロセスは抽出されたRNAにバイアスを導入する可能性があることに注意することが重要です。したがって、DV200の値が高くても、キャプチャアプローチがすべての場合でうまく機能しない場合があります。
    2. サンプルセットに高分解サンプル(DV200 <30%)が含まれている場合は、分解されたサンプルに特定の領域が欠けている可能性があるため、トランスクリプトの特定の領域のキャプチャに依存しないトータルRNAライブラリ調製方法を使用しないでください。cDNAの生成にランダムプライマーを使用すると、最終的なライブラリで使用できるRNAの表現が高くなり、したがって、FFPE-RNAサンプルに適しています。
    3. 分解の高いサンプルセットのリボソームRNA枯渇には、RNaseHベースの方法を使用します。これらは、rRNA特異的DNAプローブがrRNAに結合し、二本鎖分子がRNaseHによって消化され、残ったプローブがDNaseによってクリーンアップされる方法である(例えば、NEBNext rRNA枯渇キット、材料表)。これらのメソッドは、他のいくつかの方法8よりも劣化サンプルに適しています。
  2. シーケンス ライブラリを生成する場合は、より劣化した RNA (DV100 < 60%) を持つサンプルに対して、より高い入力量 (可能であれば) を使用します。合理的に良い品質のRNA(DV100 > 60%)を持つサンプルより低い入力量(FFPE RNAを用いたこのプロトコルで最も低いテストされた最小のテストは〜20 ng)でも良好な配列データを得る可能性があり、より分解されたRNA(DV100 <60%)については、より高い入力量(例えば、>100 ng)から始める方が良い。
    注: 十分なサンプル (例えば、>500 ng) サンプルが利用可能な場合は、必要に応じて、ライブラリの準備を繰り返すためにサンプルの少なくとも半分を保存することをお勧めします。低入力サンプル(例えば、<100 ng)の場合、通常は全量を使用し、十分な多様性のライブラリを生成する方が良いです。
  3. 分解の高いサンプルから RNA の全ライブラリを生成するための適切なライブラリ調製キットを選択した後 (例: NEBNext Ultra II RNA ライブラリのイルミナ準備キット、材料表を参照)、ライブラリを生成するメーカーの指示に従います。
    注: ライブラリーの準備中は、分解されたサンプルの RNA 断片化ステップをスキップし、最初のストランド cDNA 合成にランダムプライマーを使用することが重要です。
  4. 効率と速度を向上させるために、特に低入力サンプルでは、ビードベースの精製およびサイズ選択手順に強力な固定磁石を備えた適切な磁気ラックを使用します(参考資料表を参照)。
  5. アダプター連結DNAのPCR濃縮の場合、ライブラリー分子の不要な重複を避けながら、最大の表現を確保するために、入力DNAの量に基づいて増幅サイクルの数を調整します。低入力のFFPE-RNAサンプル(<100 ng)の場合、16~18回の増幅サイクルを推奨し、高入力サンプル(1,000 ng)は通常12~14ラウンドの増幅で十分なライブラリ量を生成します。
  6. メーカーの指示に従ってPCR増幅とクリーンアップに従い、適切なプラットフォーム上でライブラリ濃度と分子分布を分析してライブラリの品質を評価します(例えば、AgilentバイオアナライザDNAチップ、材料表を参照)。プライマーピーク(約80 bp)またはアダプタダイマーピーク(約128 bp)のサンプルについては、クリーンアップを繰り返してピークを除去します。
  7. 各ライブラリの平均ライブラリサイズを計算します(たとえば、Bioanalyzer 2100 Expert ソフトウェアを使用)。

3. シーケンスライブラリ QC

  1. ライブラリに過剰なプライマーとアダプタダイマーが含まれず、その後のシーケンシングに十分な濃度が得られたことが確認されたら、qPCR でさらに定量します。
    注: ライブラリの集中に向けたクラスター生成の感度のために、コストのかかるシーケンス処理の実行がパフォーマンスの低下や過負荷を防ぐために、正確な定量化が不可欠です。定量的リアルタイム PCR (qPCR) 法は、過剰クラスタリングを行わずに、イルミナプラットフォーム上のクラスター密度を改善するのに役立ちます。qPCR法は、フローセル上にクラスタを形成する両端の両方のアダプタシーケンスを持つテンプレートを測定するため、すべてのライブラリ分子(例えば、Agilent Bioanalyzer)の定性的および/または定量的分析に基づく方法よりも正確かつ感度が高くなります。ただし、結果を標準曲線と比較できるように、ライブラリのサイズは、すべてのサンプルにサイズ補正を適用する必要があるため、事前に知っておかなければなりません。
    注意: qPCR を実行する場合はラボコートと手袋を着用する必要があり、手順は、製造元の指示に従ってバイオセーフティ キャビネットで実行する必要があります。
    1. 適切なキットを使用して、エラー防止のための各サンプルに3つの複製を持つ96ウェルプレートを設定します(例えば、イルミナライブラリのKAPA SYBR FAST qPCRマスターミックス、ライブラリ定量化キットの一部、材料表を参照)、標準、ポジティブコントロール(例えば、PhiXコントロール、材料を参照)、テンプレート制御なし(NTC))。NTCはDNAライブラリーなしでqPCRミックスである。陽性対照は、既知の濃度およびフラグメントサイズを有する任意のライブラリーであり得る。
      1. ベンダー・プロトコルに従って、最低 6 つの標準を準備します。
    2. すべてのコンポーネント(すなわち、qPCRマスターミックス、ライブラリ、標準)を追加した後、シールフィルムでプレートを覆い、フィルムがプレートとの接触を均等かつ確実に保つためにスキージを使用します。
    3. 渦と1,500 rpmでプレートを1分間回転させ、プレートを視覚的に検査して、ウェルの底に気泡がないことを確認します。
    4. メーカーの推奨設定を使用して、サーマルサイクラー(例えばCFX96タッチシステム、材料表を参照)にプレートを設定します。
    5. データ分析のためにアクセスできる実行フォルダーを保存します。
    6. データ解析中、傾斜角が-3.1~-3.6の範囲、効率が90%から110%、R2(標準曲線に2対して得られた相関係数)が0.98以下であることを確認します。
  2. プール: シーケンス処理可能なライブラリの qPCR 濃度が取得されると、各ライブラリのプールの等価量は、サンプルごとに必要なシーケンス読み込みの数と、計測器のシーケンス出力に応じて異なります。
  3. プールの QC: ステップ 3.1 で説明されているのと同じプロトコルに従って、qPCR によってライブラリー・プールを再度定量化します。

4. シーケンシング

  1. 実行パラメータに応じて、シーケンス化試薬キットを引き出し、ユーザーガイドに従って解凍します。イルミナの楽器のシーケンシングについては、すべてのユーザーガイドの最新バージョンについては、イルミナのウェブサイトをご確認ください。
  2. 試薬が完全に解凍されていることを確認し、4°Cに試薬トレイを置きます。試薬が解凍された後、2時間以上実行を開始する必要があります。これを行わない場合、実行結果の品質に影響を与える可能性があります。
  3. カートリッジ5倍を反転して試薬を混ぜ、ベンチを軽くタップして気泡を減らします。
  4. ラップされていないフローセルパッケージを室温で30分間脇に置きます。
  5. フローセルパッケージをアンラップし、リントフリーのアルコール拭きでフローセルのガラス表面をきれいにします。低糸くずした実験室組織でガラスを乾燥させます。
  6. イルミナ "実験マネージャ" アプリケーションを開きます。「サンプルシートを作成」を選択し、シーケンサーを選択して「次へ」をクリックします。
  7. イルミナシーケンサーの基準(例えば、イルミナ実験マネージャー、ソフトウェアガイド)に基づいてサンプルシートを作成してアップロードします。
  8. プロンプトで、試薬キットのバーコードをスキャンし、実行パラメータ設定を入力します(例えば、インデックス付きPE 75サイクルの実行を1回行う場合は、76-8-76と入力してください)。
  9. シーケンサーのユーザーガイドの推奨事項に基づいてライブラリプールを変性し、希釈します(例えば、イルミナのNextSeq 500システムガイド、資料表を参照)。
  10. 制御ライブラリーPhiX(材料表を参照)を適切な濃度(例えばNextSeqの場合は1.8pM)に変性し、希釈する。
  11. サンプルライブラリとPhiXコントロールを混合して、1%のPhiX制御体積比を生み出します。
  12. 変性し希釈されたサンプルを、指定された貯蔵所の試薬カートリッジに荷重します。
  13. フローセル、バッファーカートリッジ、試薬カートリッジをロードします。
  14. 自動チェックとレビューを実行して、実行パラメーターがシステム・チェックに合格することを確認します。
  15. 自動チェックが完了したら、[開始] を選択してシーケンス実行を開始します。

5. データ分析と品質評価

注: 典型的な RNA-seq データ解析ワークフロー (図 1) には、前処理と QC、ゲノムおよび後アライメント QC へのアライメント、遺伝子および転写の定量、サンプル相関分析、異なるサンプル群間の差動分析、処理条件、および遺伝子セット濃縮および経路解析が含まれます。

RNA-seq データには、遺伝子プロファイリングの精度に影響を与え、誤った結論につながる品質の問題が生じる可能性があります。したがって、初期 QC チェックの品質、汚染、シーケンシング カバレッジ バイアス、およびその他のアーティファクトソースは非常に重要です。ここで説明するワークフローと同様の RNA-Seq QC パイプラインを適用して、下流分析の前にアーティファクトを検出し、フィルタリングまたは補正を適用することをお勧めします。

  1. 前処理
    注: これには、デマルチプレクシング、シーケンス読み取り品質の評価、GC コンテンツ、シーケンス アダプタの存在、過剰表現されたk-mers、PCR 重複読み込みなどが含まれます。この情報は、シーケンス エラー、PCR アーティファクト、または汚染を検出するのに役立ちます。
    1. サンプルシートで定義された各サンプルの生のFASTQファイルを生成するために、イルミナソフトウェアツールbcl2fastq2を使用してデマルチプレックスイルミナシーケンシングを実行します。バーコードの競合がない場合、サンプルインデックスバーコードの1つの不一致がシーケンスエラーに耐えられます。
    2. FASTQC15ソフトウェアツールを実行して、生の FASTQ ファイルの品質チェックを実行して、シーケンス読み込みの品質や異常を検出します。
    3. アダプタと低品質のベーストリミングの場合は、Cutadapt16またはTrimmomatic17ソフトウェア ツールを使用して、シーケンス アダプタと低品質のベースをトリミングします。ペアエンドのfastqファイルにトリミングされた読み取りを保存します。
    4. 汚染スクリーン
      1. 種との交差汚染の可能性を検出するためにFASTQ_screen18を実行します。
      2. Kraken219ミニクラッケンを実行して、汚染種の分類を特定します。
  2. ゲノムおよびポストアライメントQCを参照するアライメント
    1. トリミングされた読み取り値は、STARアライナー20を使用して、参照ゲノム配列(GRCh Build hg19またはhg38)に整列させることができます。Gencode アノテーション GTF ファイルを適用して、スプライスされたトランスクリプトの配置をガイドします。STAR 2-passを実行して、新しいスプライス接合部に対する感度を高めることが推奨されます。2番目のパスでは、すべての読み取りは、1回のパスからアノテナ付き遺伝子とトランスクリプトと新しいジャンクションを使用して再マッピングされます。
    2. ポストアライメント QC を実行します。
      1. Picard の21MarkDuplicatesを実行して、サンプル内の一意または重複しない読み取りの量を決定して、ライブラリの複雑さを評価します。
      2. PicardのCollectRnaSeqMetricsプログラムを実行して、コーディング、イントロニック、インタージェニック、UTR領域、および遺伝子体のカバレッジに関するマッピングパーセンテージを収集します。
      3. RSeQC22を実行して、読み取りペアの内部距離を決定し、CDSエキソン、5'UTR、3'UTR、イントロン、TSS_up_1kb、TSS_up_5kb、TSS_up_10kb、TES_down_1kb、TES_down_5kb、TES_down_10kb、読み取りGCコンテンツ、ジャンクション飽和、およびライブラリストランド情報の間で読み取り分布を決定します。
      4. マルチ QC23を実行して、HTML 形式の集計レポートを生成します。
  3. 遺伝子定量・補正解析
    1. RSEM24を実行して、遺伝子と転写物の生のカウントと正規化された読み取り数を取得します。RPKM(100万読み当たりのエキソンモデルのキロベースあたりの読み取り)、FPKM(マッピングされた読み取り10万回当たりのエキソンモデルのキロベースあたりの断片)、TPM(100万人当たりのトランスクリプト)などの読み取りカウント測定は、最も頻繁に報告されるRNA-seq遺伝子発現値です。ノイズの閾値 (TPM < 1 または生の数 <5 など) より低い値で表現されたジーンは、フィルタリングできます。
    2. HTSeq カウントや featureCounts などのプログラムを使用して、各トランスクリプト シーケンスにマップされた読み取りの生のカウントを集計するために、トランスクリプトの定量を実行します。
    3. R スクリプトを使用して主成分分析(PCA) を実行し、バッチ効果を決定し、指定されたデータセット25の品質マップを評価します。サンプル相関分析は、異なるメトリック間のピアソン相関を使用して行うことができる。
  4. 遺伝子発現解析
    1. プログラムedgeR26、27および27/またはlimma-Voom28を使用してサンプル条件間の遺伝子差の解析を行い、TPM、TMM、DESeq、またはUpperQuartileを含む正規化方法を使用する。 TMM DESeq
    2. 比較のために2つのDEGリストのセットを呼び出し、最終的なDEGを取得して検出感度と精度を向上させるために、少なくとも2つの差分解析ソフトウェアツールを実行することをお勧めします。
  5. 遺伝子セットの濃縮と経路解析
    1. 遺伝子セット濃縮解析(GSEA)29,30を、差異発現遺伝子(DEGs)リストの測定値に基づく転写物の順位に基づいて行い、DEGが生物学的条件間で統計的に有意で一致する差異を示すかどうかを判断する。29,30
    2. 遺伝子オントロジー31、 DAVID32 、,33などの利用可能なソフトウェア ツールなどのリソースを使用して機能解析を実行します。32

結果

上記の方法論は、7~32年間のさまざまな条件下で保存されていた67個のFFPEサンプルに適用されました(サンプル保存時間の中央値は17.5年でした)。ここで示したデータセットと解析結果は、Zhaoら11で既に説明および公開されています。先に説明したサンプル品質(例えば図2のトレース)をチェックする上で、DV100は、高分解RNAサンプルに対する小さ?...

ディスカッション

ここで説明する方法は、FFPE-RNAサンプルから良好な配列データを得るために必要な主なステップを概説する。この方法で考慮すべき主なポイントは、(1)サンプルの取り扱いおよび凍結および解凍のサイクルを最小限に抑えることによって、抽出後にRNAを可能な限り保存することを確認することです。別々のQCアリコートは非常に便利です。(2) 所定のサンプル・セットに最適な QC メトリックを?...

開示事項

この研究は、国立がん研究所(NCI)、国立衛生研究所(NIH)によって資金提供されました。レイドスバイオメディカルリサーチ社は、NIHが全額出資するフレデリック国立がん研究研究所の運営および技術サポート請負業者です。いくつかの著者(YZ、MM、KT、YL、JS、BT)はレイドスバイオメディカルリサーチ社と提携していますが、著者の給与や研究資料を含む国立がん研究所から全額出資されています。Leidosバイオメディカルリサーチ社は、著者(YZ、MM、KT、YL、JS、BT)または研究のための材料に給与を提供しておらず、研究の設計、データ収集、分析、出版の決定、または原稿の準備に何の役割も持っていませんでした。

謝辞

ダニエル・キャリック博士(国立がん研究所がん対策人口科学部門)は、特にこの研究を始め、サンプルを提供し、データ分析中に役立つ提案をしてくれたことに感謝しています。フレデリック国立がん研究研究所のCCRシーケンシング施設のメンバー全員が、サンプル調製とシーケンシング中の支援、特にサンプルQC、オクサナドイツ語の図書館QC、テクサイダーを運営するためのタチアナ・スミルノワの支援に心から感謝します。また、シーケンシング・ファシリティ・バイオインフォマティクス・グループのツァイ・ウェイ・シェンとアシュリー・ウォルトンが、データ分析とRNA-seqパイプラインの実装を支援してくれたことに感謝します。また、RNaseq分析パイプラインおよびベストプラクティス開発に関する支援に対するCCBRおよびNCBRに感謝します。

資料

NameCompanyCatalog NumberComments
2100 BioanalyzerAgilentG2939BA
Agilent DNA 7500 KitAgilent5067-1506
Agilent High Sensitivity DNA KitAgilent5067-4626
Agilent RNA 6000 Nano KitAgilent5067-1511
AllPrep DNA/RNA FFPE KitQiagen80234
CFX96 Touch SystemBio-Rad1855195
Library Quantification kit v2-IlluminaKapaBiosystemsKK4824
NEBNext Ultra II Directional RNA Library Prep Kit for IlluminaNew England BiolabsE7765Shttps://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat)New England BiolabsE6310L
NextSeq 500 Sequencing SystemIlluminaSY-415-1001NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control KitIlluminaFC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS)Illumina20024907
10X Genomics Magnetic Separator10X Genomics120250
Rotator MultimixerVWR13916-822
C1000 Touch Thermal CyclerBio-Rad1851197
Sequencing reagent kitIllumina20024907
Flow cell packageIllumina20024907
Buffer cartridge and the reagent cartridgeIllumina20024907
Sodium hydroxide solution (0.2N)Millipore SigmaSX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0Fisher Scientific50-151-871

参考文献

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019)
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019)
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  22. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  23. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  24. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  25. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  26. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  27. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  28. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  29. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  30. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  31. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  33. Evaluating RNA Quality from FFPE Samples. Illumina Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016)

転載および許可

このJoVE論文のテキスト又は図を再利用するための許可を申請します

許可を申請

さらに記事を探す

160 RNA FFPE NGS RNA seq

This article has been published

Video Coming Soon

JoVE Logo

個人情報保護方針

利用規約

一般データ保護規則

研究

教育

JoVEについて

Copyright © 2023 MyJoVE Corporation. All rights reserved