Dieses Protokoll schließt eine bedeutende Lücke zwischen der natürlichen Evolution von Viren und ihrer Verwendung als rekombinante Vektoren für die menschliche Gentherapie, indem es ihre Entwicklung, Diversifizierung und Stratifizierung ermöglicht. Diese Technik ermöglicht das parallele Hochdurchsatz-Screening auf neuartige, isolierte oder gentechnisch hergestellte Adeno-assoziierte Virusvarianten, kurz AAV-Varianten, wodurch Tierzahlen, Arbeit, Kosten und Zeit eingespart werden. Die identifizierten AVV-Kapsidvarianten können die Wirksamkeit und Spezifität der AAV-basierten Verabreichung von therapeutischen Transgenen erhöhen und dadurch die erforderliche Virusdosis reduzieren.
Dies könnte die Sicherheit und Anwendbarkeit der Gentherapie verbessern. Derselbe Ansatz könnte auch für das Kapsid- oder Promotor-Engineering anderer Gentransportvehikel verwendet werden, was unser Verständnis ihrer Biologie und ihrer Verwendung in der Gentherapie verbessert. An der Demonstration des Verfahrens beteiligen sich die Doktoranden Jonas Becker und Jixin Liu, die Postdoktorandin Joanna Szumska und Margarita Zayas sowie die wissenschaftlichen Mitarbeiterinnen Emma Gerstmann und Ellen Widtke aus meinem Labor.
Beginnen Sie mit der Analyse der NGS-Sequenzierungsdaten mit Python 3 und Biopython. Die NGS-Analyse besteht aus zwei Schritten. Durchsuchen Sie im ersten Schritt die Sequenzdateien nach Sequenzen, die bestimmte Kriterien erfüllen, z. B. flankierende Sequenzen, Länge und Position mithilfe von Skript eins und einer Konfigurationsdatei, die die erforderlichen Informationen enthält.
Für den zweiten Schritt übersetzen Sie die extrahierten Sequenzen beginnend mit der AGWGGC-Sequenz mit Skript Nummer zwei und der Konfiguration und Zuordnung. txt-Dateien, die die benötigten Informationen bereitstellen. Bereiten Sie zwei Ordner vor: Skript und Daten.
Kopieren Sie die Gzip-komprimierten Dateien, die sich aus der Sequenzierung ergeben, in den Datenordner. Kopieren Sie dann die Python- und Konfigurationsdateien in den Skriptordner, wie im Textmanuskript beschrieben. Öffnen Sie vor dem Ausführen der Skripte die Zuordnung.
txt-Datei und fügen Sie zwei durch Tabulatoren getrennte Spalten hinzu. Geben Sie die Namen der Gzip-Dateien in Spalte eins und den gewünschten endgültigen Namen in Spalte zwei ein. Ändern Sie die Variablen in der Konfigurationsdatei, wie im Textmanuskript beschrieben.
Starten Sie mit dem spezifischen Befehl die Erkennung und Extraktion von Variantensequenzen. Die Ausgabe sind TXT-Dateien mit den extrahierten DNA-Sequenzen und deren Anzahl der Lesevorgänge. Der Header dieser Datei enthält statistische Daten, die in die folgenden Dateien übertragen werden.
Diese TXT-Daten sind die Eingabedatei für Skript Nummer zwei, in dem die DNA-Sequenzen übersetzt, eingestuft und analysiert werden. Starten Sie mit dem spezifischen Befehl die PV-Übersetzung und Analyse der Textausgabedateien des ersten Skripts, wie im Textmanuskript beschrieben. Die Ausgabedateien von Skript Nummer zwei werden in der zweiten Spalte der Nachschlagetabelle in zuordnung benannt.
txt mit Erweiterungen, die auf der Art der Analyse basieren. Stellen Sie sicher, dass die drei Ausgabedateien statistische Daten in den ersten Zeilen und eine erste Spalte mit dem Index jeder DNA-Sequenz aus den Eingabetextdateien enthalten. Die verbleibenden Spalten sollten aus der DNA-Sequenz, der Anzahl der Lesevorgänge, dem Vorwärts- oder Rückwärtslesen und der translatierten Peptidsequenz bestehen.
Die ungültigen Sequenzen sollten NA haben und in den letzten beiden Spalten ungültig sein. Visualisieren Sie die Ausgabedateien mit verfügbarer Software basierend auf den Bedürfnissen des Benutzers. Um die Analyse der NGS-Sequenzierungsdaten mit benutzerdefiniertem Code in Python 3 durchzuführen, umfasst der Workflow die Erkennung von Barcode-Sequenzen, die durch flankierende Sequenzen geführt werden, deren Länge und Position sowie die Analyse der Barcode-Anreicherung und -Verteilung über den Satz von Geweben.
Bereiten Sie zwei Ordner vor: Skript und Daten. Kopieren Sie die Gzip-komprimierten Dateien, die sich aus der Sequenzierung ergeben, in den Datenordner. Kopieren Sie dann die Python- und Konfigurationsdateien in den Skriptordner, wie im Textmanuskript beschrieben.
Erstellen Sie vor dem Ausführen des Skripts zwei tabulatorgetrennte Textdateien: die Kapsidvarianz. txt-Datei mit den Barcode-Sequenzen, die den Namen der AAV-Kapsidvariante zugewiesen sind, und der Kontamination. TXT-Datei mit Barcode-Sequenzen, die von einer möglichen Kontamination herrühren.
Bearbeiten Sie schließlich die Konfigurationsdatei, um die Informationen des Pfads zum Ordner mit Sequenzierungsdaten, die Reihenfolge der flankierenden Bereiche der Barcodes, ihre Position und die Fenstergröße für die Barcode-Erkennung aufzunehmen. Führen Sie das Barcode-Erkennungsskript mit den bereitgestellten Pfaden und Konfigurationsdateien mit dem entsprechenden Befehl aus. Die Ausgabe dieser Befehlsausführung sind TXT-Dateien mit Nachzählungen pro Kapsidvariante und der Gesamtzahl der aus den Rohdaten wiederhergestellten Lesevorgänge.
Zur Beurteilung der Verteilung von barcodiertem AAV-Kapsid unter Geweben oder Organen in der Zuordnung. TXT-Datei, weisen Sie den Namen jeder Textdatei, die aus dem Barcode-Erkennungslauf erhalten wird, einem Gewebe- oder Organnamen zu. Fügen Sie die Namen der Textdateien in der ersten Spalte und die entsprechenden Gewebe- oder Organnamen in der durch Trennzeichen getrennten Zuordnung hinzu.
Erstellen Sie ein Organ. TXT-Datei mit der Liste der Namen für On- und Off-Target-Organe, die den in der Zuordnung angegebenen Namen entsprechen. txt-Datei.
Erstellen Sie dann normalization_organ. txt und normalization_variant. Durch txt getrennte Textdateien mit normalisierten Werten für alle Kapsidvarianten und alle Organe und Gewebe.
In der ersten Spalte mit dem normalization_organ. txt-Datei, schreiben Sie die Namen für jedes Organ und die zweite Spalte mit Normalisierungswerten für das entsprechende Gewebe. Füllen Sie die erste Spalte des normalization_variant.
TXT-Datei mit der Liste der Kapsidnamen und der zweiten Spalte mit den normalisierten Werten der Leseanzahl für jedes Kapsid in der gepoolten Bibliothek. Bearbeiten Sie die Konfigurationsdatei, indem Sie die vollständigen Pfade zu allen zusätzlichen Dateien angeben, und führen Sie das Barcode-Analyseskript mit diesem speziellen Befehl aus. Das Barcode-Analyseskript gibt mehrere Dateien aus, z. B. die Textdateien mit relativen Konzentrations- oder RC-Werten der Kapsidverteilung in verschiedenen Geweben basierend auf mehreren zuvor beschriebenen Normalisierungsschritten und die Tabellenkalkulationsdatei, die Textdateidaten zu zusammengeführten Matrixdaten kombiniert.
Visualisieren Sie die Daten und führen Sie eine Clusteranalyse der Matrixdaten durch, wie im Textmanuskript beschrieben. Das Skript gibt die relative Konzentration ein. XLS-Dateien und generieren zwei Diagramme der hierarchischen Cluster-Heatmap und der Hauptkomponentenanalyse.
Um Plots oder PNG-Parameter zu ändern, öffnen Sie das R-Skript und befolgen Sie die Anweisungen im Kommentarbereich. Die quantifizierten Regionen des AAV2-Rep-Gens zeigten, dass 99,2% positiv für ITR waren, was darauf hindeutet, dass die AAV-Kapside das gesamte virale Genom enthielten. In allen drei Sätzen machten die extrahierten Lesevorgänge basierend auf bibliotheksspezifischen Signatursequenzen etwa 94 % der gesamten Lesevorgänge aus, was auf eine gute Qualität hinweist.
Davon waren mehr als 99 % gültige PV-Lesevorgänge und über 99 % der gültigen PV-Lesevorgänge eindeutig, was darauf hindeutet, dass die Bibliothek mit hoher interner Diversität ausbalanciert war. Die beiden Hauptzweige der Heatmap-Hierarchie spiegelten den Unterschied in der Transduktionseffizienz von Kapsidvarianten wider. Der linke Ast mit der Mehrzahl der Kapsidvarianten umfasste alle Kapside, die in den meisten Geweben einen hohen relativen Konzentrationswert aufwiesen.
Abgesehen von einer auffallend hohen Leberspezifität zeigten drei weitere Kapside Spezifität im Zwerchfell, in der Skelettmuskulatur, im Bizeps und im Gehirn. Der rechte Zweig der hierarchischen Clusterbildung umfasste die Kapsidvarianten mit insgesamt geringerer Transduktionseffizienz, die am deutlichsten im Zwölffingerdarm und in der Bauchspeicheldrüse zu beobachten war. Die Hauptkomponentenanalyse für die ursprüngliche Untergruppe bildet den Cluster der Kapsidvarianten mit hoher Leberspezifität und skizziert den herausragenden Muskeltropismus des VAR60-Kapsids.
Wenn Sie dieses Protokoll versuchen, müssen Sie auf Tippfehler achten. Die Syntax unterscheidet sich auch, wenn Sie die Windows-Eingabeaufforderung im Vergleich zu Linux verwenden. Nach der Identifizierung neuer AAV-Varianten muss das therapeutische und translationale Potenzial in einem verstorbenen oder größeren Tiermodell überprüft werden.
Diese Technik ermöglicht einen direkten direkten direkten Vergleich von AAV-Varianten unter identischen Bedingungen und ist äußerst vielseitig einsetzbar und ebnet den Weg für ihre Übertragung in große Tiere oder sogar in Menschen.