このプロトコルは、候補遺伝子の分子進化と発現を調査するためのバイオインフォマティクスのステップを概説する。ここでは、バイオインフォマティクスの経験が最小限の人なら誰でもこのプロトコルを実行できるように、徹底的な指示を提供します。このパイプラインは、任意の生物および任意の遺伝子ファミリーに適用することができる。
バイオインフォマティクスを行う際の一般的な問題の 1 つは、シェル スクリプトの失敗です。このプロトコルを試す際には、最新のソフトウェアを使用していることを確認し、エラー ファイルを読み、マニュアルを慎重に確認してください。開始するには、ターミナルまたは PuTTY アプリケーション ウィンドウでコンピュータ クラスタ アカウントにログインします。
端末で、Wget を使用して SRA Toolkit バージョン 2.8.1 をダウンロードし、プログラムのインストールを完了します。NCBIで目的のサンプルのSRA受位数を検索し、次に端末ウィンドウでRNA配列データを取得します。ペアエンド ファイル タイプ用の FASTQ ファイルを 2 つ取得します。
参照ゲノムが存在する場合は、オンラインで参照ゲノムを検索します。参照アセンブリを取得するには、ターミナル ウィンドウに wget と入力し、リンク アドレスを貼り付けます。可能であれば、参照ゲノムのGTFファイルとプロテインFASTAファイルもコピーします。
ゲノムをインデックス化し、読み取りをマップし、各サンプルの式を計算します。結果ファイルの名前をわかりやすい名前にし、すべてのカウントの行列を生成します。インターネットブラウザウィンドウを開き、NCBI GenBankに移動します。
検索バーに、対象遺伝子の名前と、配列された密接に関連する種の名前を入力します。検索バーの左側にある [タンパク質] を選択し、[検索] をクリックします。[送信] をクリックしてシーケンスを抽出し、[ファイル] を選択します。
[フォーマット] で [FASTA] を選択し、[ファイルの作成] をクリックします。ローカル端末ウィンドウまたは FileZilla を使用して、同族語の FASTA ファイルをコンピュータクラスタに移動します。次に、BLAST+コンピュータクラスタを使用して候補遺伝子を検索し、ゲノムまたはトランスクリプトーム翻訳タンパク質FASTAからBLASTデータベースを作成します。
NCBIから目的の種のデータベースに相同遺伝子配列をBLASTし、その後、コマンドを使用して出力ファイルを表示する。対象の種から新しいテキスト ファイルに、一意の遺伝子 ID をコピーします。候補遺伝子の配列を抽出する。
相互BLASTを使用して遺伝子注釈を確認するには、BLASTローカルアライメント検索ツールに移動し、BLASTPを選択して候補配列を貼り付け、非冗長タンパク質配列データベースを選択し、BLASTをクリックします。MEGA を開き、[配置]をクリックし、[ビルドの配置を編集]をクリックして、[新しい線形を作成]を選択して、[OK]をクリックします。[タンパク質] を選択します。[配置]ウィンドウが開いたら、[編集]をクリックします。
[ファイルからシーケンスを挿入] をクリックし、候補遺伝子と可能性のある同族体のタンパク質配列を含む FASTA を選択します。[すべてのシーケンス] を選択します。アームシンボルを見つけて、その上にカーソルを合わせます。
それは筋肉アルゴリズムを使用して配列を整列させると言うべきです。アーム記号をクリックし、「タンパク質の位置合わせ」をクリックしてシーケンスを調整するパラメーターを編集するか、「OK」をクリックしてデフォルトのパラメーターを使用します。このプロトコルは、フィラムクニダリアに属する淡水無脊椎動物であるヒドラ下垂体の組織に適用されました。
オプシン遺伝子は、動物の目の進化と光検出に関する洞察を得るために研究された。H.vulgarisおよび他の種のオプシン関連遺伝子の配列をNCBI GenBankからFASTAファイルに抽出した。オプシン遺伝子をMEGAで整列させ、光感受性分子と結合するために必要な保存リジンアミノ酸が欠けていたヒドラオプシンを同定することを可能にした。
ヒドラ下垂器および他の種からのオプシン配列を使用して最も可能性の高い木が生成された。この系統は、オプチン遺伝子がクニダリアンにおける系統特異的複製によって進化しており、H.vulgarisにおけるタンデム複製によって進化している可能性を示唆している。次に、オプシン遺伝子の絶対発現を調べるべくedgeRでの微分発現解析を行った。
1つ以上のオプシンがハイポトーム、または頭部においてアップレギュレートされているかどうかを判断するために、ハイポトームとボディカラム、出芽ゾーン、足、触手の対比比較を行った。1,774の転写物が、ハイポトームとボディカラムの間で差で発現していることが分かった。複数の比較でアップレギュレートされた遺伝子を決定し、Blast2GOで機能的な濃縮を行った。
最後に、オプシン遺伝子の絶対発現を、異なる組織において、出芽の異なる段階、および異なる時間の再生中に調べた。アライメントとツリーを目視で調べると、候補遺伝子が対象家族に属しているかどうかを確認できます。配列が異なりすぎている遺伝子や他の全く外側のグループは、おそらく別の遺伝子ファミリーの一部です。
このプロトコルの結果は仮説生成と考えることができる。このパイプラインは、将来の研究で機能的に研究する候補遺伝子を強調することができます。ヒドラオプシン発現を探索した後、我々は現在、類似点と機能の違いを同定するために、種間の関連遺伝子を調査するために同様の技術を使用しています。