Ce protocole comble un écart important entre l’évolution naturelle des virus et leur utilisation comme vecteurs recombinants pour la thérapie génique humaine en permettant leur ingénierie, leur diversification et leur stratification. Cette technique permet le criblage parallèle à haut débit de virus adéno-associés nouveaux, isolés ou modifiés, en abrégé AAV, ce qui permet d’économiser sur le nombre d’animaux, le travail, les coûts et le temps. Les variantes de capside du VHA identifiées peuvent augmenter l’efficacité et la spécificité de l’administration de transgènes thérapeutiques à base d’AAV, réduisant ainsi la dose virale requise.
Cela pourrait améliorer la sécurité et l’applicabilité de la thérapie génique. La même approche pourrait également être utilisée pour l’ingénierie de la capside ou du promoteur d’autres véhicules de livraison de gènes, ce qui améliore notre compréhension de leur biologie et de leur utilisation en thérapie génique. Les doctorants Jonas Becker et Jixin Liu, la post-doctorante Joanna Szumska et Margarita Zayas, ainsi que les assistantes de recherche Emma Gerstmann et Ellen Widtke de mon laboratoire aideront à démontrer la procédure.
Commencez par analyser les données de séquençage NGS avec Python 3 et Biopython. L’analyse NGS est composée de deux étapes. Pour la première étape, recherchez dans les fichiers de séquence des séquences qui répondent à des critères spécifiques tels que les séquences latérales, la longueur et l’emplacement à l’aide du script un, ainsi qu’un fichier de configuration qui fournit les informations nécessaires.
Pour la deuxième étape, traduisez les séquences extraites à partir de la séquence AGWGGC en utilisant le script numéro deux et la configuration et zuordnung. txt qui fournit les informations nécessaires. Préparez deux dossiers : script et données.
Copiez les fichiers compressés Gzip résultant du séquençage dans le dossier de données. Copiez ensuite les fichiers Python et de configuration dans le dossier de script comme décrit dans le manuscrit texte. Avant d’exécuter les scripts, ouvrez le zuordnung.
TXT et ajoutez deux colonnes séparées par des tabulations. Entrez les noms des fichiers Gzip dans la première colonne et le nom final souhaité dans la deuxième colonne. Modifiez les variables dans le fichier de configuration comme décrit dans le manuscrit texte.
À l’aide de la commande spécifique, lancez la détection et l’extraction de la séquence de variantes. La sortie sera des fichiers TXT avec les séquences d’ADN extraites et leur nombre de lectures. L’en-tête de ce fichier contient des données statistiques et ces données seront transférées dans les fichiers suivants.
Ces données TXT seront le fichier d’entrée du script numéro deux dans lequel les séquences d’ADN sont traduites, classées et analysées. À l’aide de la commande spécifique, lancez la traduction PV et l’analyse des fichiers de sortie texte du script un, comme décrit dans le manuscrit du texte. Les fichiers de sortie du script numéro deux seront nommés à l’aide de la deuxième colonne de la table de choix dans zuordnung.
TXT avec extensions basées sur le type d’analyse. Assurez-vous que les trois fichiers de sortie contiennent des données statistiques dans les premières lignes et une première colonne avec l’index de chaque séquence d’ADN des fichiers texte d’entrée. Les colonnes restantes doivent comprendre la séquence d’ADN, le nombre de lectures, la lecture directe ou inverse et la séquence peptidique traduite.
Les séquences non valides doivent avoir NA et ne pas être valides dans les deux dernières colonnes. Visualisez les fichiers de sortie à l’aide des logiciels disponibles en fonction des besoins de l’utilisateur. Pour effectuer l’analyse des données de séquençage NGS à l’aide de code personnalisé dans Python 3, le flux de travail comprend la détection de séquences de codes-barres guidées par les séquences latérales, leur longueur et leur emplacement, ainsi que l’analyse de l’enrichissement et de la distribution des codes-barres sur l’ensemble des tissus.
Préparez deux dossiers : script et données. Copiez les fichiers compressés Gzip résultant du séquençage dans le dossier de données. Copiez ensuite le python et les fichiers de configuration dans le dossier de script comme décrit dans le manuscrit texte.
Avant d’exécuter le script, créez deux fichiers texte délimités par des tabulations :capsidvariance. txt avec les séquences de codes-barres attribuées aux noms de variantes de capside AAV et la contamination. TXT avec des séquences de codes-barres provenant d’une contamination possible.
Enfin, modifiez le fichier de configuration pour inclure les informations du chemin d’accès au dossier avec les données de séquencement, la séquence des régions flanquantes des codes-barres, leur position et la taille de la fenêtre pour la détection des codes-barres. Exécutez le script de détection de code-barres avec les chemins d’accès et les fichiers de configuration fournis à l’aide de la commande correspondante. La sortie de l’exécution de cette commande sera des fichiers TXT avec des recomptages par variante de capside et le nombre total de lectures récupérées à partir des données brutes.
Évaluer la distribution de la capside AAV à code-barres parmi les tissus ou les organes, dans la zuordnung. TXT, attribuez le nom de chaque fichier texte obtenu à partir de l’exécution de détection de code-barres à un nom de tissu ou d’organe. Ajoutez les noms des fichiers texte dans la première colonne et les noms de tissus ou d’organes correspondants dans l’affectation délimitée par des onglets.
Créez un organe. TXT avec la liste des noms des organes sur et hors cible, qui correspondent aux noms donnés dans l’affectation Zuordnung. TXT.
Ensuite, créez normalization_organ. txt et normalization_variant. Fichiers texte délimités par la tabulation TXT avec des valeurs normalisées pour toutes les variantes de capside et tous les organes et tissus.
Dans la première colonne avec le normalization_organ. txt, écrivez les noms donnés pour chaque organe et la deuxième colonne avec les valeurs de normalisation du tissu correspondant. Renseignez la première colonne de la normalization_variant.
TXT avec la liste des noms de capside et la deuxième colonne avec les valeurs normalisées du nombre de lectures pour chaque capside dans la bibliothèque regroupée. Modifiez le fichier de configuration en spécifiant les chemins d’accès complets à tous les fichiers supplémentaires et exécutez le script d’analyse de code-barres à l’aide de cette commande spécifique. Le script d’analyse de code-barres génère plusieurs fichiers tels que les fichiers texte avec la concentration relative ou les valeurs RC de la distribution de la capside dans différents tissus en fonction de plusieurs étapes de normalisation décrites précédemment, et le fichier de feuille de calcul qui combine les données du fichier texte dans les données matricielles fusionnées.
Visualisez les données et effectuez une analyse groupée des données matricielles comme décrit dans le manuscrit texte. Le script saisira la concentration relative. xls et générer deux tracés de carte thermique de cluster hiérarchique et d’analyse en composantes principales.
Pour modifier des tracés ou des paramètres PNG, ouvrez le script R et suivez les instructions de la section des commentaires. Les régions quantifiées du gène AAV2 rep ont montré que 99,2% étaient positives pour ITR, ce qui suggère que les capsides AAV contenaient l’intégralité des génomes viraux. Dans les trois ensembles, les lectures extraites basées sur des séquences de signatures spécifiques à la bibliothèque représentaient environ 94% du total des lectures, ce qui indique une bonne qualité.
Parmi ceux-ci, plus de 99 % étaient des lectures PV valides et plus de 99 % des lectures PV valides étaient uniques, ce qui suggère que la bibliothèque était équilibrée avec une grande diversité interne. Les deux principales branches de la hiérarchie de la carte thermique reflétaient la différence d’efficacité de transduction des variantes de capside. La branche gauche avec la majorité des variantes de capside comprenait toutes les capsides qui montraient une valeur de concentration relative élevée dans la plupart des tissus.
Outre une spécificité hépatique étonnamment élevée, trois autres capsides présentaient une spécificité dans le diaphragme, le muscle squelettique, les biceps et le cerveau. La branche droite du regroupement hiérarchique comprenait les variantes de capside avec une efficacité de transduction globale plus faible plus évidente dans le duodénum et le pancréas. L’analyse en composantes principales pour le sous-ensemble original forme le groupe de variantes de capside avec une spécificité hépatique élevée et décrit le tropisme musculaire exceptionnel de la capside VAR60.
Lorsque vous essayez ce protocole, vous devez faire attention aux erreurs de frappe. La syntaxe est également différente si vous utilisez l’invite de commande Windows par rapport à Linux. Après l’identification de nouvelles variantes d’AAV, le potentiel thérapeutique et translationnel doit être vérifié dans un modèle animal décédé ou plus grand.
Cette technique permet une comparaison directe côte à côte des variantes AAV dans des conditions identiques et est extrêmement polyvalente, ouvrant la voie à sa traduction chez les grands animaux, voire chez l’homme.