Nuestro protocolo es significativo porque se puede utilizar para identificar secuencias genómicas que no se pueden aislar de secuencias de co-purificación, que sólo pueden ser parcialmente conocidas. Las principales ventajas de esta técnica es que es barato, utilizando principalmente software libre que se puede descargar, así como flexible. Puede aplicarlo a muchas preguntas biológicas.
Las aplicaciones potenciales incluyen la identificación de objetivos de vacunas bacterianas y la identificación de virus cuyas secuencias son extremadamente diferentes de los microbios conocidos. Este método se puede aplicar a cualquier sistema en el que lo desconocido no se pueda separar experimentalmente, siempre y cuando la secuencia de referencia sin el objetivo genómico esté disponible. Esta técnica requiere un poco de prueba y error, por lo que la paciencia es importante.
Es posible que tenga problemas para filmar los programas. Puede utilizar programas diferentes de los que describimos aquí. Utilice los manuales de usuario tanto como sea posible.
La demostración visual de este método es útil porque el trabajo computacional depende de una comprensión básica de cómo se estructura la programación de línea de comandos. Para empezar, utilice Trimmomatic 0.32 para eliminar adaptadores de illumina y bases de baja calidad. Utilice la versión 0.9.11 de Pera para crear lecturas combinadas de alta calidad a partir de lecturas emparejadas de salida trimmomática utilizando parámetros predeterminados.
A continuación, utilice Reptile versión 1.1 para corregir errores las lecturas producidas a través de Pera. Por último, utilice la versión 2.4.0 de Trinity en el modo predeterminado para ensamblar las secuencias corregidas. Para bibliotecas específicas de hebras, utilice el parámetro SS_lib_type.
La salida es un archivo FASTA que se colocará en un nuevo directorio llamado trinity_output. Haga una base de datos BLAST de la secuencia de referencia nucleotide_reference. fasta en la línea de comandos.
BLAST emparejado la consulta ensamblada con la base de datos de referencia. Para obtener un archivo de salida, utilice BLAST_results. txt Para generar la salida tabular necesaria para los pasos de procesamiento de subsecuencia con scripts de Python, utilice outfmt 6 Para una mayor rigurosidad, utilice secuencias de proteínas del ensamblado como la consulta BLAST con NUCleótido BLAST traducido, que realiza la traducción de seis vías de la base de datos de nucleótidos.
Para obtener secuencias de proteínas para la consulta, ejecute TransDecoder. Comando Long0rfs para identificar los fotogramas de lectura abiertos más largos de las secuencias de consulta ensambladas. Ahora ejecuta tblastn.
Si es necesario, asegúrese de que se selecciona el código genético correcto para el organismo que se está estudiando utilizando la opción de código db_gencode con la opción de código adecuada. Si hay disponible una referencia proteica de alta calidad, utilice la coincidencia proteína-proteína con blastp en lugar de tblastn Make a BLAST database of the protein reference. Asegúrese de guardar el resultado como un archivo para el procesamiento de nivel inferior y utilice la salida tabular para asegurarse de que los scripts de Python pueden analizarlos correctamente.
Ahora, utilice la secuencia de comandos de Python sustractiva para eliminar las secuencias coincidentes. Para asignar las lecturas al ensamblado, utilice BWA-MEM Versión 0.7.12 o bowtie 2 para asignar las lecturas sin procesar descargadas al ensamblado de consulta. En primer lugar, indexe el ensamblado y, a continuación, asigne las lecturas.
La salida será el formato SAM. Ejecute la secuencia de comandos de Python removeUnmapped. py utilizando el archivo SAM como entrada.
Esto identifica los nombres de las secuencias de consulta sin ninguna lectura coincidente y los guarda en un nuevo archivo de texto. La salida del paso anterior es una lista de nombres de secuencias en un archivo txt. Extraiga un archivo FASTA con estas secuencias.
La salida será un archivo fasta. Utilice Genius para determinar manualmente las secuencias de imprimación óptimas. Resalte una secuencia candidata de 21 a 28 pares base para la imprimación delantera, evitando corridas de cuatro o más de cualquier base.
Trate de apuntar a una región con una combinación bastante uniforme de todos los pares base. Un solo G o C en tres Prime End es beneficioso, ayudando a anclar la imprimación. Haga clic en la pestaña Estadísticas en el lado derecho de la pantalla para ver la temperatura de fusión estimada de esa secuencia a medida que se resalta la región candidata.
Apunte a una temperatura de fusión entre 55 y 60 grados Celsius, evitando repeticiones, y largas corridas de G C.Elija una imprimación inversa de la misma manera, situada 150 a 250 pares base tres primos de la imprimación delantera. Mientras que las longitudes de imprimación no necesitan coincidir, la temperatura de fusión pronosticada debe ser lo más cercana posible a la de la imprimación delantera. Asegúrese de invertir el complemento de la secuencia haciendo clic con el botón derecho en Genius mientras una secuencia se resalta en una opción de menú.
Un método alternativo es utilizar la función Primer Design, que se encuentra en la barra de herramientas superior de la ventana Secuencia. Inserte la región que desea amplificar en Región de destino. En la pestaña Características, inserte el tamaño deseado, la temperatura de fusión y, por ciento, G C y, a continuación, haga clic en Aceptar para generar imprimaciones.
Para realizar la validación cuantitativa de PCR de la secuencia restante, primero prepare una mezcla de reacción para cada plantilla en triplicado, con nuestro SYBR Green Master Mix, imprimaciones hacia adelante y hacia atrás, y agua, para un volumen total de 25 microlitros. Ejecute un programa qPCR informado por la temperatura y el tiempo de extensión previamente validados. Las curvas de desnaturalizar finales deben generarse al menos la primera vez que se emplean las imprimaciones en qPCR para validar la amplificación de un solo producto de ADN.
Mida las señales QPCR SYBR Verde en relación con Actin by Ct Para todos los casos, calcule el promedio y la desviación estándar de dos a la Ct en relación con Actin. Realice la electroforesis de gel de punto final, para confirmar la detección correcta del tamaño del producto por qPCR. Aquí, ejecute 25 microlitros del producto qPCR mezclados con cinco microlitros de tinte 6X Glitterol en un gel de agarosa 2%TAE a 200 voltios durante 20 minutos.
Si su qPCR muestra que no ha identificado las secuencias de destino, repita todo el ciclo con una nueva referencia, que se puede obtener de una base de datos en línea. El proyecto sustractivo en este caso comenzó con la secuenciación del ARN del tejido forrado de gérmenes del pinzón cebra adulto macho y hembra. En última instancia, se identificaron 935 genes somáticos que no se incluyeron previamente en la anotación del genoma completo.
Después del filtrado computacional, la PCR cuantitativa puede producir un resultado negativo en el que no hubo diferencia en la detección entre los tejidos de las aves. Por el contrario, se confirma un resultado positivo que representa la identificación de una secuencia de destino real cuando el qPCR del ADN genómico muestra una detección estadísticamente mayor en el tejido de interés, en relación con la referencia. Aquí, el gen alfa snap fue validado para ser restringido por la línea germinal porque se agotó en tejido somático en relación con el ADN de los testículos donde estaba presente que los niveles equivalentes a Actin.
Es importante recordar utilizar las entradas correctas durante cada uno de los pasos computacionales. Es posible que tenga que pasar por la resta de ciclo varias veces para obtener la secuencia o secuencias de destino. Se puede realizar una variedad de análisis filogenéticos, estructurales y funcionales en los genes descubiertos.
Estos métodos adicionales dan una idea de los roles evolutivos y funcionales de los genes. Identificamos el primer gen en un cromosoma de pájaros cantores restringido por germinales, que amplió el interés en este sorprendente elemento genómico. El trabajo posterior mostró cromosomas similares en muchas especies de pájaros cantores que contienen muchos genes adicionales.