このプロトコルは、ウイルスの工学、多様化、層別化を可能にすることにより、ウイルスの自然進化とヒト遺伝子治療のための組換えベクターとしての使用との間の大きなギャップを埋めます。この技術により、新規、単離、または操作されたアデノ随伴ウイルス、つまりAAV変異体のハイスループット並行スクリーニングが可能になり、動物の数、作業、コスト、および時間を節約できます。同定されたAVVキャプシド変異体は、治療用導入遺伝子のAAVベースの送達の有効性および特異性を高め、それによって必要なウイルス量を減らすことができる。
これにより、遺伝子治療の安全性と適用性が向上する可能性があります。同じアプローチは、他の遺伝子送達ビヒクルのカプシドまたはプロモーターエンジニアリングにも使用でき、それらの生物学と遺伝子治療におけるそれらの使用についての理解を深めることができます。手順のデモンストレーションを支援するのは、博士課程の学生であるヨナス・ベッカーとジシン・リウ、ポスドクのジョアンナ・シュムスカとマルガリータ・ザヤス、そして私の研究室の研究助手であるエマ・ゲルストマンとエレン・ウィトケです。
まず、Python 3とBiopythonでNGSシーケンシングデータを分析します。NGS分析は2つのステップで構成されています。最初のステップでは、スクリプト 1 を使用して、側面シーケンス、長さ、位置などの特定の条件を満たすシーケンスと、必要な情報を提供する構成ファイルをシーケンス ファイルで検索します。
2番目のステップでは、スクリプト番号2と構成およびzuordnungを使用して、AGWGGCシーケンスから始まる抽出されたシーケンスを変換します。必要な情報を提供するTXTファイル。スクリプトとデータの2つのフォルダを用意します。
シーケンス処理の結果の Gzip 圧縮ファイルをデータ フォルダーにコピーします。次に、Pythonと構成ファイルを、テキスト原稿の説明に従ってスクリプトフォルダーにコピーします。スクリプトを実行する前に、zuordnung を開きます。
txt ファイルを作成し、タブ区切りの 2 つの列を追加します。列 1 に Gzip ファイルの名前を入力し、列 2 に目的の最終名を入力します。構成ファイル内の変数を、テキスト 原稿の説明に従って変更します。
特定のコマンドを使用して、バリアント配列の検出と抽出を開始します。出力は、抽出されたDNA配列とそのリード数を含むTXTファイルになります。このファイルのヘッダーには統計データが含まれており、これらのデータは次のファイルに転送されます。
これらのTXTデータは、DNA配列が翻訳、ランク付け、および分析されるスクリプト番号2の入力ファイルになります。特定のコマンドを使用して、テキスト原稿で説明されているように、スクリプト1のテキスト出力ファイルのPV翻訳と分析を開始します。スクリプト番号 2 の出力ファイルには、zuordnung のルックアップ テーブルの 2 番目の列を使用して名前が付けられます。
分析の種類に基づく拡張機能を持つ TXT。3 つの出力ファイルの最初の行と最初の列に、入力テキスト ファイルの各 DNA 配列のインデックスを含む統計データが含まれていることを確認します。残りのカラムは、DNA配列、リード数、順方向または逆方向リード、および翻訳ペプチド配列で構成されている必要があります。
無効なシーケンスは NA を持つ必要があり、最後の 2 つの列では無効です。ユーザーのニーズに基づいて、利用可能なソフトウェアを使用して出力ファイルを視覚化します。Python 3のカスタムコードを使用してNGSシーケンシングデータの分析を実行するためのワークフローは、隣接シーケンス、その長さと位置によって導かれるバーコードシーケンスの検出、および一連の組織に対するバーコードの濃縮と分布の分析で構成されます。
スクリプトとデータの2つのフォルダを用意します。シーケンス処理の結果の Gzip 圧縮ファイルをデータ フォルダーにコピーします。次に、テキスト原稿の説明に従って、Pythonファイルと構成ファイルをスクリプトフォルダーにコピーします。
スクリプトを実行する前に、2 つのタブ区切りテキスト ファイル、つまり capsidvariance を作成します。AAVキャプシドバリアント名に割り当てられたバーコードシーケンスと汚染を含むtxtファイル。汚染の可能性のあるバーコードシーケンスを含むTXTファイル。
最後に、構成ファイルを編集して、シーケンス データを含むフォルダーへのパス、バーコードの隣接領域のシーケンス、それらの位置、およびバーコード検出用のウィンドウ サイズの情報を含めます。それぞれのコマンドを使用して、指定されたパスと構成ファイルを使用してバーコード検出スクリプトを実行します。このコマンド実行の出力は、capsidバリアントごとの再カウントと生データから回復された読み取りの総数を含むTXTファイルになります。
ズオルドヌングにおける組織または臓器間のバーコードAAVキャプシドの分布を評価する。TXTファイルは、バーコード検出実行から得られた各テキストファイルの名前を組織または臓器名に割り当てる。最初の列にテキストファイルの名前を追加し、タブ区切りの割り当てに対応する組織または臓器の名前を追加します。
臓器を作成します。オンターゲット臓器とオフターゲット臓器の名前のリストを含むTXTファイルで、Zuordnungの割り当てで指定された名前に対応します。TXT ファイルにエクスポートします。
次に、normalization_organを作成します。TXTとnormalization_variant。TXTタブは、すべてのCAPSIDバリアントとすべての臓器および組織の正規化された値を持つ区切りテキストファイルです。
normalization_organの最初の列。TXTファイルに、各臓器に与えられた名前と、対応する組織の正規化値を含む2番目の列を書き込みます。normalization_variantの最初の列に入力します。
Txt ファイルには Capsid 名のリストが含まれ、2 番目の列にはプールされたライブラリ内の各 Capsid の読み取りカウントの正規化された値が含まれます。すべての追加ファイルへのフルパスを指定して構成ファイルを編集し、この特定のコマンドを使用してバーコード分析スクリプトを実行します。バーコード解析スクリプトは、前述の複数の正規化ステップに基づいて、異なる組織内のカプシド分布の相対濃度またはRC値を含むテキストファイルや、テキストファイルのデータをマージされたマトリックスデータに結合するスプレッドシートファイルなど、いくつかのファイルを出力します。
データを視覚化し、テキスト原稿に記載されているようにマトリックスデータのクラスター分析を実行します。スクリプトは相対濃度を入力します。XLSファイルを作成し、階層クラスターヒートマップと主成分分析の2つのプロットを生成します。
プロットまたはPNGパラメータを変更するには、Rスクリプトを開き、コメントセクションの指示に従います。AAV2 rep遺伝子の定量化された領域は、99.2%がITRに対して陽性であることを示し、AAVキャプシドがウイルスゲノム全体を含むことを示唆しています。3つのセットすべてにおいて、ライブラリに固有の署名配列に基づいて抽出されたリードは、全リードの約94%を占め、良好な品質を示しています。
これらのうち、99%以上が有効なPVリードであり、有効なPVリードの99%以上が一意であり、ライブラリが高い内部多様性とバランスが取れていることが示唆されました。ヒートマップ階層の2つの主要な分岐は、カプシド変異体の変換効率の違いを反映していました。カプシド変異体の大部分を有する左枝には、ほとんどの組織にわたって高い相対濃度値を示したすべてのカプシドが含まれていた。
著しく高い肝臓特異性とは別に、他の3つのカプシドは、横隔膜、骨格筋、上腕二頭筋、および脳において特異性を示した。階層的クラスタリングの右枝には、十二指腸と膵臓で最も明白な全体的な低い形質導入効率を持つカプシド変異体が含まれていました。元のサブセットの主成分分析は、肝臓特異性の高いカプシド変異体のクラスターを形成し、VAR60キャプシドの優れた筋向性を概説します。
このプロトコルを試みるときは、入力エラーに注意を払う必要があります。Windows コマンド プロンプトを使用している場合と Linux を使用している場合も、構文が異なります。新規AAV変異体の同定に続いて、治療および翻訳の可能性を死亡または大型の動物モデルで検証する必要があります。
この技術は、同一の条件下でAAVバリアントを直接並べて比較することを可能にし、非常に用途が広く、大型動物、さらにはヒトでの翻訳への道を開きます。