我々のプロトコルは、自己が部分的にしか知られていない可能性がある共精製配列から分離できないゲノム配列を同定するために使用することができるので、重要である。この技術の主な利点は、それは、柔軟性だけでなく、ダウンロードすることができる主にフリーソフトウェアを使用して、安価であるということです。多くの生物学的な質問に適用することができます。
潜在的な用途には、細菌ワクチン標的の同定と、既知の微生物と配列が非常に異なるウイルスの同定が含まれる。この方法は、ゲノムターゲットを含まない参照配列が利用可能である限り、未知のシステムを実験的に分離できない任意のシステムに適用することができる。このテクニックは試行錯誤を要するので、忍耐は重要です。
プログラムを撮影するのに問題が発生する場合があります。ここで説明するプログラムとは異なるプログラムを使用することができます。可能な限りユーザーマニュアルを使用してください。
この方法の視覚的なデモンストレーションは、計算作業はコマンド ライン プログラミングの構造の基本的な理解に依存するため、役立ちます。まず、Trimmomatic 0.32 を使用して、イルミナ アダプタと低品質ベースを取り除く。Pear バージョン 0.9.11 を使用して、デフォルトのパラメータを使用して、トリミング出力ペアの読み込みから高品質のマージ読み込み値を作成します。
その後、Reptile バージョン 1.1 を使用して、Pear を介して生成された読み取りを誤って修正します。最後に、トリニティバージョン2.4.0をデフォルトモードで使用して、修正されたシーケンスを組み立てます。ストランド固有のライブラリの場合は、SS_lib_type パラメータを使用します。
出力は、TRINITY_OUTPUTと呼ばれる新しいディレクトリに置かれるFASTAファイルです。参照シーケンスの BLAST データベースをnucleotide_referenceします。コマンド ラインで fasta を指定します。
BLAST は、参照データベースにアセンブルされたクエリと一致しました。出力ファイルを取得するには、BLAST_resultsを使用します。txt Pythonスクリプトでのサブシーケンス処理ステップに必要な表形式出力を生成するには、outfmt6を使用してストリンジェンシーを増加させるために、ヌクレオチドデータベースの6ウェイ翻訳を行う翻訳ヌクレオチドBLASTを用いたBLASTクエリとしてアセンブリからのタンパク質配列を使用する。
クエリのタンパク質配列を取得するには、TransDecoder を実行します。long0rfs コマンドは、組み立てられたクエリ シーケンスから最長のオープン読み取りフレームを識別します。今、tblastnを実行します。
必要に応じて、適切なコードオプションを使用して研究されている生物に正しい遺伝コードが選択されていることを確認db_gencode。高品質のタンパク質参照が利用可能な場合は、tblastnではなくブラストと一致するタンパク質タンパク質を使用するタンパク質参照のBLASTデータベースを作成します。結果を下流処理用のファイルとして保存し、表形式の出力を使用して Python スクリプトが正しく解析できるようにします。
次に、一致するシーケンスを削除するには、減算 Python スクリプトを使用します。読み取りをアセンブリにマップするには、BWA-MEM バージョン 0.7.12 またはボウタイ 2 を使用して、ダウンロードした生読み取りをクエリ アセンブリにマップします。まず、アセンブリにインデックスを付け、次に読み取りをマップします。
出力は SAM 形式になります。Python スクリプトを実行してマップ解除します。入力として SAM ファイルを使用して py.
これにより、一致する読み取りなしでクエリ シーケンスの名前が識別され、新しいテキスト ファイルに保存されます。前の手順の出力は、txt ファイル内のシーケンス名のリストです。これらのシーケンスを使用して FASTA ファイルを抽出します。
出力は、fasta ファイルになります。Genius を使用して、最適なプライマー シーケンスを手動で決定します。前方プライマーの 21 ~ 28 の基本ペアの候補シーケンスをハイライト表示し、4 つ以上のベースの実行を回避します。
すべての基本ペアのかなり均一な組み合わせでリージョンをターゲットにしてみてください。3つのプライムエンドで単一のGまたはCが有益であり、プライマーを固定するのに役立ちます。画面の右側にある[統計]タブをクリックすると、候補領域がハイライト表示されるシーケンスの推定融解温度が表示されます。
55〜60°Cの融解温度を目指し、繰り返しを避けながら、G C.のロングランは、前方プライマーの3つのプライムに位置する150〜250塩基対に位置し、同じ方法で逆プライマーを選択します。プライマーの長さが一致する必要はありませんが、予測される融解温度は、フォワードプライマーの温度にできるだけ近いはずです。シーケンスがメニューオプションでハイライトされている間にGeniusを右クリックして、シーケンスを元に戻してください。
別の方法として、シーケンスウィンドウの上部のツールバーにある「プライマーデザイン」機能を使用する方法もあります。ターゲット領域の下に増幅する領域を挿入します。[特性]タブで、必要なサイズ、融解温度、パーセントGCを挿入し、[OK]をクリックしてプライマーを生成します。
残りのシーケンスの定量PCR検証を実行するには、まず、SYBRグリーンマスターミックス、フォワードプライマーとリバースプライマー、および水を使用して、25マイクロリットルの合計容量に対して、三重化中の各テンプレートの反応混合物を調製します。以前に検証された温度と延長時間によって通知されたqPCRプログラムを実行します。最終変性曲線は、少なくともプライマーが単一のDNA産物の増幅を検証するためにqPCRで初めて使用される場合に生成されるべきである。
Ctによるアクチンに対するqPCR SYBRグリーン信号を測定する すべての場合について、アクチンに対するCtに対する2つの平均と標準偏差を計算します。エンドポイントゲル電気泳動を行い、qPCRによる正しい製品サイズ検出を確認する。ここでは、200ボルトで200ボルトの200ボルトのアガロースゲルに6Xグリッタール染料の5マイクロリットルと混合qPCR製品の25マイクロリットルを実行します。
qPCR でターゲットシーケンスが特定されていない場合は、オンライン データベースから取得できる新しい参照でサイクル全体を繰り返します。この場合の減算プロジェクトは、男性と女性の成人シマウマフィンチの胚芽が並ぶ組織からRNAをシーケンシングすることから始まった。最終的に、これまで全ゲノムアノテーションに含まれていなかった935個の体細胞遺伝子が同定された。
計算フィルタリングの後、定量PCRは、鳥組織間の検出に違いがなかった負の結果をもたらす可能性があります。逆に、ゲノムDNAqPCRが参照に対して、関心のある組織において統計的に大きな検出を示す場合、真の標的配列の同定を表す陽性の結果が確認される。ここで、αスナップ遺伝子は、アクチンと同等のレベルが存在する精巣DNAに対して体細胞組織で枯渇したため、生殖細胞系に制限されていることが検証された。
各計算手順で正しい入力を使用することが重要です。ターゲットシーケンスを取得するために、サイクル減算を複数回実行する必要があります。発見された遺伝子に対して、様々な系統学的、構造的、および機能的な分析を行うことができます。
これらの追加の方法は、遺伝子の進化的および機能的役割に関する洞察を与える。生殖細胞系に制限されたソングバード染色体の最初の遺伝子を同定し、この驚くべきゲノム要素への関心を広げた。その後の研究は、多くの追加の遺伝子を含む多くのソングバード種で同様の染色体を示した。