Este protocolo cierra una brecha significativa entre la evolución natural de los virus y su uso como vectores recombinantes para la terapia génica humana al permitir su ingeniería, diversificación y estratificación. Esta técnica permite la detección paralela de alto rendimiento para variantes novedosas, aisladas o diseñadas de virus adenoasociados, en resumen AAV, ahorrando así en número de animales, trabajo, costo y tiempo. Las variantes identificadas de la cápside AVV pueden aumentar la eficacia y la especificidad de la administración de transgenes terapéuticos basados en AAV, reduciendo así la dosis viral requerida.
Esto podría mejorar la seguridad y la aplicabilidad de la terapia génica. El mismo enfoque también podría usarse para la cápside o la ingeniería promotora de otros vehículos de administración de genes, lo que mejora nuestra comprensión de su biología y su uso en la terapia génica. Ayudarán a demostrar el procedimiento los estudiantes de doctorado Jonas Becker y Jixin Liu, las postdoctorales Joanna Szumska y Margarita Zayas, así como las asistentes de investigación Emma Gerstmann y Ellen Widtke de mi laboratorio.
Comience analizando los datos de secuenciación NGS con Python 3 y Biopython. El análisis NGS se compone de dos pasos. Para el primer paso, busque en los archivos de secuencia secuencias que satisfagan criterios específicos, como secuencias de flanqueo, longitud y ubicación, utilizando el script uno, y un archivo de configuración que proporcione la información necesaria.
Para el segundo paso, traduzca las secuencias extraídas comenzando en la secuencia AGWGGC usando el script número dos y la configuración y zuordnung. TXT que proporciona la información necesaria. Prepare dos carpetas: script y data.
Copie los archivos comprimidos Gzip resultantes de la secuenciación en la carpeta de datos. A continuación, copie Python y los archivos de configuración en la carpeta de secuencias de comandos como se describe en el manuscrito de texto. Antes de ejecutar los scripts, abra el zuordnung.
txt y agregue dos columnas separadas por tabulaciones. Introduzca los nombres de los archivos Gzip en la columna uno y el nombre final deseado en la columna dos. Cambie las variables en el archivo de configuración como se describe en el manuscrito de texto.
Con el comando específico, inicie la detección y extracción de secuencias de variantes. La salida serán archivos TXT con las secuencias de ADN extraídas y su número de lecturas. El encabezado de este archivo contiene datos estadísticos y estos datos se transferirán a los siguientes archivos.
Estos datos TXT serán el archivo de entrada para el script número dos en el que se traducen, clasifican y analizan las secuencias de ADN. Usando el comando específico, inicie la traducción PV y el análisis de los archivos de salida de texto del script uno como se describe en el manuscrito de texto. Los archivos de salida del script número dos se nombrarán utilizando la segunda columna de la tabla de búsqueda en zuordnung.
TXT con extensiones basadas en el tipo de análisis. Asegúrese de que los tres archivos de salida contienen datos estadísticos en las primeras filas y una primera columna con el índice de cada secuencia de ADN de los archivos de texto de entrada. Las columnas restantes deben consistir en la secuencia de ADN, el número de lecturas, la lectura directa o inversa y la secuencia peptídica traducida.
Las secuencias no válidas deben tener NA y no ser válidas en las dos últimas columnas. Visualice los archivos de salida utilizando el software disponible según las necesidades del usuario. Para realizar el análisis de los datos de secuenciación NGS utilizando código personalizado en Python 3, el flujo de trabajo comprende la detección de secuencias de códigos de barras guiadas por secuencias de flanqueo, su longitud y ubicación, así como el análisis del enriquecimiento y distribución de códigos de barras sobre el conjunto de tejidos.
Prepare dos carpetas: script y data. Copie los archivos comprimidos Gzip resultantes de la secuenciación en la carpeta de datos. A continuación, copie los archivos de python y configuración en la carpeta de script como se describe en el manuscrito de texto.
Antes de ejecutar el script, cree dos archivos de texto delimitados por tabulaciones:capsidvariance. txt con las secuencias de códigos de barras asignadas a los nombres de variantes de cápside AAV y la contaminación. TXT con secuencias de códigos de barras que provienen de una posible contaminación.
Finalmente, edite el archivo de configuración para incluir la información de la ruta a la carpeta con datos de secuenciación, secuencia de regiones flanqueantes de los códigos de barras, su posición y tamaño de ventana para la detección de códigos de barras. Ejecute el script de detección de código de barras con las rutas proporcionadas y los archivos de configuración utilizando el comando respectivo. El resultado de la ejecución de este comando serán archivos TXT con recuentos por variante de cápside y el número total de lecturas recuperadas de los datos sin procesar.
Evaluar la distribución de la cápside AAV con código de barras entre tejidos u órganos, en el zuordnung. txt, asigne el nombre de cada archivo de texto obtenido de la ejecución de detección de código de barras a un nombre de tejido u órgano. Agregue los nombres de los archivos de texto en la primera columna y los nombres de tejidos u órganos correspondientes en la asignación delimitada por tabulaciones.
Crear un órgano. TXT con la lista de nombres para órganos dentro y fuera del objetivo, que corresponden a los nombres dados en la asignación Zuordnung. Txt.
A continuación, cree normalization_organ. txt y normalization_variant. Archivos de texto delimitados por la pestaña TXT con valores normalizados para todas las variantes de cápside y todos los órganos y tejidos.
En la primera columna con el normalization_organ. txt, escriba los nombres dados para cada órgano, y la segunda columna con valores de normalización para el tejido correspondiente. Rellene la primera columna del normalization_variant.
TXT con la lista de nombres de cápside y la segunda columna con los valores normalizados de los recuentos de lectura para cada cápside de la biblioteca agrupada. Edite el archivo de configuración especificando las rutas completas a todos los archivos adicionales y ejecute el script de análisis de código de barras utilizando este comando específico. El script de análisis de código de barras genera varios archivos, como los archivos de texto con concentración relativa o valores RC de distribución de cápside dentro de diferentes tejidos basados en múltiples pasos de normalización descritos anteriormente, y el archivo de hoja de cálculo que combina datos de archivos de texto en datos de matriz combinados.
Visualice los datos y realice un análisis de conglomerados de los datos de la matriz como se describe en el texto manuscrito. El script introducirá la concentración relativa. XLS y generar dos gráficos de mapa de calor de clúster jerárquico y análisis de componentes principales.
Para modificar trazados o parámetros PNG, abra el script de R y siga las instrucciones de la sección de comentarios. Las regiones cuantificadas del gen AAV2 rep mostraron que el 99,2% eran positivas para ITR, lo que sugiere que las cápsides AAV contenían todos los genomas virales. En los tres conjuntos, las lecturas extraídas basadas en secuencias de firmas específicas de la biblioteca representaron aproximadamente el 94% del total de lecturas, lo que indica una buena calidad.
De estos, más del 99% eran lecturas PV válidas y más del 99% de las lecturas PV válidas eran únicas, lo que sugiere que la biblioteca estaba equilibrada con una alta diversidad interna. Las dos ramas principales de la jerarquía del mapa de calor reflejaron la diferencia en la eficiencia de transducción de las variantes de cápside. La rama izquierda con la mayoría de las variantes de cápside incluía todas las cápsides que mostraron un alto valor de concentración relativa en la mayoría de los tejidos.
Además de la especificidad hepática sorprendentemente alta, otras tres cápsides exhibieron especificidad en el diafragma, el músculo esquelético, los bíceps y el cerebro. La rama derecha del agrupamiento jerárquico incluyó las variantes de cápside con una eficiencia de transducción general más baja más evidente en el duodeno y el páncreas. El análisis de componentes principales para el subconjunto original forma el grupo de variantes de cápside con alta especificidad hepática y describe el tropismo muscular sobresaliente de la cápside VAR60.
Al intentar este protocolo, debe prestar atención a los errores de escritura. La sintaxis también es diferente si está usando el símbolo del sistema de Windows en comparación con Linux. Tras la identificación de nuevas variantes de AAV, el potencial terapéutico y traslacional debe verificarse en un modelo animal fallecido o más grande.
Esta técnica permite una comparación directa lado a lado de variantes de AAV en condiciones idénticas y es extremadamente versátil, allanando el camino para su traducción en animales grandes, o incluso en humanos.