JoVE Logo

Iniciar sesión

Se requiere una suscripción a JoVE para ver este contenido. Inicie sesión o comience su prueba gratuita.

En este artículo

  • Resumen
  • Resumen
  • Introducción
  • Protocolo
  • Resultados
  • Discusión
  • Divulgaciones
  • Agradecimientos
  • Materiales
  • Referencias
  • Reimpresiones y Permisos

Resumen

Este artículo describe el procedimiento para la identificación y caracterización de una familia del gene en grapevine aplicada a la familia de Arabidopsis Tóxicos en Levadura (ATL) E3 ubiquitina ligasas.

Resumen

Clasificación y nomenclatura de los genes de una familia pueden contribuir considerablemente a la descripción de la diversidad de proteínas codificadas y a la predicción de funciones de la familia basada en varias características, tales como la presencia de motivos de secuencia o de particular sitios de modificación poste-de translación y el perfil de expresión de los miembros de la familia en diferentes condiciones. Este trabajo describe un protocolo detallado para la caracterización familiar gene. Aquí, el procedimiento es aplicado a la caracterización de la familia Arabidopsis Tóxicos en Levadura (ATL) E3 ubiquitina ligasa en vid. Los métodos incluyen la identificación del genoma de los miembros de la familia, la caracterización del gen localización, estructura y duplicación, el análisis de motivos conservados de la proteína, la predicción de sitios de localización y fosforilación de proteínas así como Perfil de expresión génica a través de la familia en diferentes conjuntos de datos. Tal procedimiento, que podría extenderse a otros análisis dependiendo de propósitos experimentales, se podría aplicar a cualquier familia de genes de cualquier especie de planta que están disponibles datos genómicos, y proporciona información valiosa para identificar a candidatos interesantes para los estudios funcionales, dando ideas sobre los mecanismos moleculares de adaptación de plantas a su entorno.

Introducción

Durante la última década, se ha realizado mucha investigación en genómica de la vid. Vid es un cultivo económicamente relevante reconocido, que se ha convertido en un modelo para la investigación en el desarrollo de la fruta y en las respuestas de las plantas leñosas a estreses bióticos y abióticos. En este contexto, la liberación del genoma de Vitis vinifera CV. PN40024 en 20071 y su versión actualizada en 20112 condujo a una rápida acumulación de datos a escala "ómicas" y a una explosión de estudios de alto rendimiento. Según los datos publicados de la secuencia, el análisis integral de una familia de determinado gen (generalmente compuesto de comparten motivos conservados, similitudes estructurales o funcionales y relaciones evolutivas de las proteínas), puede ahora realizarse para descubrir su funciones moleculares, evolución y perfiles de expresión génica. Estos análisis pueden contribuir a entender cómo familias génicas controlan procesos fisiológicos a nivel del genoma.

Muchos aspectos del ciclo de vida de planta están regulados por la degradación mediada por ubiquitina de proteínas clave, que requieren un volumen optimizado para regulares procesos celulares. Importantes componentes del proceso de degradación mediada por ubiquitina son las ligasas de ubiquitina E3, que son responsables de la flexibilidad del sistema, gracias a la contratación de objetivos específicos3. En consecuencia, estas enzimas representan una familia de genes enorme, con unos 1.400 E3 ligasa de codificación genes previstos en el thaliana de Arabidopsis genoma4, cada E3 ubiquitina ligasa de la ubiquitinación de proteínas específicos. A pesar de la importancia de la ubiquitinación de substrato-específica en la regulación celular en las plantas, poco se sabe sobre cómo se regula la vía de ubiquitinación y proteínas de la blanco han sido identificadas sólo en algunos casos. El desciframiento de tales mecanismos de especificidad y regulación basa primero en la identificación y caracterización de los diferentes componentes del sistema, en particular las E3 ligasas. Entre las ligasas de ubiquitina, la subfamilia ATL se caracteriza por 91 miembros identificados en a. thaliana mostrando un anillo-H2 dedo dominio5,6, algunos de ellos juega un papel en las respuestas de defensa y la hormona7.

El primer paso crucial para definir a los miembros de una nueva familia de genes es la definición precisa de las características familiares, tales como motivos consenso dominios claves y características de la secuencia de proteína. De hecho, la recuperación fiable de todos miembros de la familia génica basado en el análisis BLAST requiere algunas características de la secuencia obligatoria, en los dominios de la proteína en particular responsables de la función y actividad de la proteína, que sirve como firma de proteína. Esto puede ser facilitado por la anterior caracterización de la misma familia de genes de otras especies vegetales o logrado mediante el análisis de diversos genes supuestamente pertenecientes a la misma familia en diferentes especies de plantas, para aislar secuencias comunes. Los miembros de la familia pueden entonces ser individualmente nombrados siguiendo normas comunes que se establecieron por consorcios internacionales para una especie vegetal determinada. En vid, por ejemplo, dicho procedimiento se sujeta a las recomendaciones de la Comisión de nomenclatura súper para uva gen anotación (sNCGGa), establece la construcción de un árbol filogenético como V. vinifera y a. thaliana miembros de la familia gen para permitir la anotación de genes basan en secuencias de nucleótidos8.

Localización de cromosoma de miembros de la familia y estudio de la duplicación del gene permiten destacar la presencia de genes duplicados en tándem o de todo el genoma. Dicha información aparece útil para desentrañar las funciones del gen putativo, ya que podría demostrar la redundancia funcional o revelar situaciones diferentes, es decir, no funcionalización, neo-funcionalización o sub-funcionalización9. Tanto neo - y sub - functionalization es acontecimientos importantes que crean novedad genética, proporcionando nuevos componentes celulares para la adaptación de la planta a los cambiantes entornos10. En particular, las duplicaciones de genes ancestrales y la producción de nuevos genes fueron muy frecuentes durante la evolución del genoma de la vid y recién formados genes procedentes de duplicaciones en tándem y proximales en vid eran más propensos a producir nuevos funciones11.

Otro factor clave para descifrar la función familiar gene es el perfil transcriptómico. La disponibilidad de bases de datos públicas que da acceso a una gran cantidad de datos transcriptómicos puede explotarse así para asignar funciones putativas a miembros de la familia gen mediante análisis de expresión a gran escala en silico . De hecho, la peculiar expresión de algunos genes en órganos específicos de la planta o en respuesta a ciertas tensiones puede dar algunas pistas sobre los supuestos roles de las proteínas correspondientes en condiciones definidas y dar soporte a la hipótesis sobre la posible Sub-funcionalización de genes duplicados para responder a retos diferentes. Para ello, es importante considerar varios conjuntos de datos: estos pueden ser gene ya disponible matrices de expresión, como el atlas transcriptómico del genoma de los órganos de la vid y etapas de desarrollo12, o puede ser construidos ad hoc por recuperar datos transcriptómicos de la especie de planta en particular sometida a tensiones definidas. Por otra parte, un enfoque simple con dos matrices, uno con los datos de similitud pares y otro con coeficientes pares coexpresión pueden aplicarse para evaluar las relaciones entre patrones de similitud y la expresión de secuencia dentro de una familia de genes.

El objetivo de este trabajo es proporcionar un enfoque global, definir estructura gene, motivos conservados de la proteína, Localización cromosómica, las duplicaciones del gene y patrones de expresión, como también la predicción de la proteína phosphorylation y localización sitios web, para lograr un caracterización exhaustiva de una familia de genes en plantas. Este enfoque integral se aplica aquí a la caracterización de la familia de ligasa de ubiquitina E3 ATL en vid. Según el rol emergente de miembros de la subfamilia ATL en la regulación de procesos celulares claves7, este trabajo puede también ayudar a la identificación de los candidatos fuertes para estudios funcionales y finalmente desentrañar los mecanismos moleculares que regulan la adaptación de este cultivo importante a su entorno.

Protocolo

1. identificación de los miembros de familia de genes putativos ATL

  1. Versión de la web de PSI-BLAST
    1. Abra la página web de explosión13 y haga clic en la sección de alto de proteína.
    2. En el campo "Secuencia de Enter Query", introduzca la secuencia de aminoácidos de la proteína (aquí VIT_05s0077g01970) que se utilizará como la punta de prueba para identificar a los otros miembros de la familia.
      Nota: Debe ser una buena representante de proteína utilizada (una proteína que muestra todas las características importantes que caracterizan a la familia).
    3. En el campo "Set de búsqueda elige", seleccione la base de datos de "Proteína de referencia" (refseq_protein) y el organismo de interés (V. vinifera - taxid:29760).
    4. En el campo "selección de programa", seleccionar el algoritmo de PSI-BLAST y haga clic en el botón de ráfaga para ejecutar el análisis.
      Nota: Al hacer clic en "parámetros del algoritmo" es posible ajustar algunos parámetros avanzados (secuencias diana de Max, matriz de puntuación, umbral de PSI-BLAST, etc.).
    5. La primera explosión ronda recupera todas las secuencias de visualización de los partidos correspondientes a la consulta (e-valor por encima del umbral seleccionado - por defecto 0,005, 0,001 en este experimento). Deseleccionar todas las entradas, que claramente no pertenecen a la familia bajo examen haciendo clic sobre la garrapata en la columna "select para ISP-ráfaga" y ejecutar la segunda iteración de la PSI-BLAST haciendo clic en el botón de explosión como en el paso 1.1.4.
    6. Recientemente identificadas secuencias están resaltadas en amarillo. Deseleccionar los éxitos obtenidos claramente erróneo y descubrir más iteraciones como se describe en el paso 1.1.5.
    7. Continuar con iteraciones hasta que el algoritmo no encuentra ninguna entrada relevante o alcanza convergencia (no las entradas nuevas se encuentran). Descargar la lista de miembros de la familia gen putativo para mayores análisis. Inspeccione visualmente los éxitos obtenidos en cada iteración para evitar la presencia de falsos positivos.
  2. Versión independiente de PSI-BLAST
    1. Descargar la versión independiente de explosión haciendo clic en el botón "descargar ráfaga" en la explosión página13.
      Nota: El software de explosión independiente es una versión de línea de comandos de la interfaz web que se describe antes. Permite ejecutar la búsqueda PSI-BLAST contra una medida base de datos local o remota. Además, permite buscar con una predefinida posición específicos puntuación Matrix (PSSM).

2. manual inspección de PSI-BLAST-identificado miembros de la familia

  1. Alineamiento múltiple
    1. Recoger las secuencias ácidas aminos identificadas previamente en un archivo con formato FASTA y subirlo en MEGA software14 para proceder a la alineación múltiple.
    2. Abra el software MEGA, haga clic en el botón "Alinear", haga clic en "Editar/construcción alineación", haga clic en "Crear una nueva alineación", haga clic en "Proteína".
    3. Haga clic en "Editar" en el menú de alineación y "Secuencia insertar desde archivo". Busque el archivo FASTA creado antes y confirmar la carga de todas las secuencias de las encuestados.
    4. Haga clic en "Alineación" en el menú de alineación y "Alinear por músculo". Utilizar parámetros por defecto, haz clic en el botón "Calcular" y esperar a la finalización de la alineación múltiple.
    5. Inspeccione visualmente la alineación múltiple para excluir a miembros de la familia incorrectamente predichos. El canónico CxxC (13 x) PxCxHxxHxxCxxxW (x 7) CxxCW motivo, (en particular la presencia de los residuos de prolina antes la tercera cisteína), es una característica clave para definir a los miembros de la familia de ATL.
  2. Análisis del LOGO específico
    1. Presentar la lista definitiva de miembros de la familia (96 secuencias vid cumplan con los requisitos para ser considerado ATL) al Em múltiples para elicitación de adorno (MEME)15 definir motivos conservados en toda la familia.
    2. Desde la página de inicio MEME, haga clic en el botón de "MEME" y completar el "presentación formulario de datos" con información particular sobre la familia de interés.
    3. Utilice análisis MEME para confirmar la presencia de los dos motivos previstos dentro de los miembros de la familia Parra ATL, es decir, el anillo-H2 y los motivos GLD.
  3. Por otra parte, realice los pasos 2.1 y 2.2 simultáneamente utilizando la suite de software de Bioinformática (véase Tabla de materiales).
    1. Subir archivo FASTA (ver paso 2.1.1) en la suite. Seleccione "Archivo" en el menú, luego "Importar" y haga clic en "desde archivo". Busque el archivo FASTA y haga clic en "Abrir".
    2. Seleccionar todas las secuencias importadas en la lista y en "Alinear/ensamble" botón en la barra de herramientas, haga clic en "Parejas múltiples alineación". Seleccione "Alineación músculo" y haga clic en "Aceptar" para iniciar la alineación con parámetros por defecto.
    3. Para visualizar el LOGO de la alineación, haga clic en "Gráficos" → "opciones" y seleccione "Secuencia Logo".

3. Análisis de parámetros físicos de proteínas y dominios

  1. Como la definición de los diferentes parámetros físicos de los familiares encuestados es importante tener una descripción completa de la familia, presentar la lista de miembros de la familia de herramientas específicas.
    1. Punto isoeléctrico (pI) y peso molecular (kDa), utilizar la herramienta ProtParam del16 en el sitio web de Expasy con parámetros por defecto.
    2. Para la localización subcelular de la proteína, utilizar diferentes herramientas para obtener una predicción más confiable como ngLOC v1.017 con configuración predeterminada, targetP v1.118 con ajustes predeterminados y proteína prowler localización subcelular v1.219 con un corte de la probabilidad de 0.5. Sitios de fosforilación, use el MUsite v1.0 web herramienta20 con parámetros por defecto.
  2. Investigar dominios adicionales de la proteína en miembros de la familia.
    1. Abrir base de datos Pfam página21, seleccione la herramienta de "Búsqueda de la secuencia", presentar secuencias de la proteína en el cuadro de consulta y haga clic en "Go" para ejecutar el análisis.
      Nota: Cada secuencia de la proteína es analizada individualmente. Un e-valor de 1.0 en la configuración predeterminada permite discriminar entre golpes significativos y no significativos.
    2. Abra el servidor de TMHMM22 del centro de análisis biológico de la secuencia investigar la presencia de regiones transmembranales putativas.
Pegar todas las secuencias de proteínas simultáneamente en el cuadro de consulta (o también puede cargar un archivo de texto incluyendo todas las secuencias de la proteína en formato FASTA) y haga clic en "Enviar" para ejecutar el análisis.
  • Analizar proteínas carentes de dominios transmembrana predichos, según TMHMM (paso 3.2.2), con la herramienta ProtScale identificar regiones hidrofóbicas putativas. Abrir ProtScale página23. Pegar cada secuencia de la proteína en el cuadro de consulta y seleccione "Hphob. / Kyte & Doolittle "como escala de aminoácidos. Haga clic en "Enviar" para ejecutar el análisis.
  • 4. organización del exón-intrón, duplicaciones y distribución cromosómica

    1. Mapa de los miembros de la familia ATL en los cromosomas, basados en la información obtenida de la Página Web de centro de biotecnología de vid genoma CRIBI24.
      1. Buscar los denominados web página25. Escriba el "archivo de entrada" como un archivo de texto delimitado por tabulaciones con las características específicas de los genes que se asignará en los cromosomas, según las directrices exhaustivas y ejemplos con respecto a la compilación del archivo proporcionado siguiendo el camino "Denominados" → " Documentación"→"Opciones"→"Input file".
      2. Escribe el "título" de la obra. Seleccione el genoma que se elaborará. Para genomas no implementados en el software, como el genoma de la vid, seleccione "otro" en el menú desplegable. Escribir el archivo de genoma según las pautas y ejemplos que, siguiendo el camino "Denominados" → "Documentación" → "Opciones" → "Genoma" y lo subo.
      3. Utilizar parámetros por defecto de "Espaciado de fenotipo", "Color de fenotipo", "Formato de imagen" o seleccionadas alternativas en los respectivos menús y haga clic en "Complot" para obtener la visualización de los genes en los cromosomas.
    2. Definir el estado de la duplicación de los miembros de la familia utilizando el software de MCScanX26.
      1. Descargar y descomprimir una copia de MCscanX en un equipo local que ejecuta líneas de comandos 11 archivo complementario. Entrar en la carpeta MCscanX y crear los ejecutables necesarios ejecutar líneas de comandos 2 (archivo adicional 1).
        Nota: Instalación de MCscanX es conocido por fallar en algunas máquinas de Linux de 64 bits debido a un problema con respecto a la función chdir. Si un mensaje de error se devuelve relacionados con esta función el hacer ejecución del comando, se debe ejecutar el comando líneas 3 (complementario 1 de archivo) y el comando "make" debe intentarse posteriormente.
      2. Descargar las proteínas V. vinifera y el archivo de anotaciones ejecuta líneas de comandos 4 (archivo adicional 1).
        Nota: El archivo de anotación de vid debe ser descomprimido y el gato de información solo de los cromosomas en un único archivo ejecutando el comando líneas 5 (archivo adicional 1).
      3. Ejecutar un blastp "todos contra todos" con el archivo de la proteína V. vinifera como la consulta y el tema de búsqueda.
      4. Crear una base de datos de búsqueda blast utilizando el archivo de proteína V. vinifera ejecuta líneas de comandos 6 (archivo adicional 1). Realizar la búsqueda blastp mediante el archivo de proteínas V. vinifera como una consulta contra la base de datos creado previamente mediante la ejecución de líneas de comando 71 archivo complementario.
      5. Convertir el archivo de anotaciones en un formato adecuado para MCScanX. Ejecutar líneas de comandos 81 archivo complementariopara descargar la parseMSCanXgff.pl de secuencia de comandos perl personalizados. Realizar el análisis ejecuta líneas de comandos 9 (archivo adicional 1).
        Nota: Un archivo vitis.gff se genera que es gene coordenadas en el formato siguiente:
        SP # gene posición final posición inicial
        donde "sp" es un código de dos letras para la especie (Vv para vid) mientras que "#" es el nombre del andamio. Tenga en cuenta que el script de perl personalizados siempre es conveniente para la conversión de la mayoría, aunque algunos modificación del código puede ser necesario en algunos casos específicos debido a la diversidad de la información proporcionada en el archivo de anotaciones disponibles.
      6. Lanzamiento de MCScanX ejecuta líneas de comandos 10 (archivo adicional 1).
        Nota: El "vitis" es el prefijo de la anotación y el archivo de salida del chorro. Esto representa un requisito obligatorio para el software se ejecute.
      7. Analizar los resultados de la MCScanX. MCScanX produce un archivo de texto "vitis.collinearity", que contiene bloques de colineales. Dicho archivo se puede examinar por cualquier editor de texto (ver ejemplo 1 complementaria 1 archivode salida).
        Nota: Un directorio "mcscaxOutput.html" que contiene los archivos html con múltiples alineaciones de bloques colineares contra cada cromosoma de referencia se genera. Estos archivos pueden ser inspeccionados a través de un navegador web.
      8. Clasificar genes parálogos basados en su posición relativa en los cromosomas ejecutar líneas de comandos 11 (archivo adicional 1).
        Nota: Clasificación de genes parálogos se describe en II mesa complementaria. El archivo de salida generado "vitis.gene_type" contiene toda la información de origen con un formato delimitado por tabuladores simple.
      9. Realizar análisis de enriquecimiento para evaluar si la familia del gene ha originado fundamentalmente por un mecanismo específico de ejecutar líneas de comando 12 (archivo adicional 1).
        Nota: Archivo "vitis.gene_type" se genera en el paso 4.2.8, considerando que el archivo "gene_family_file" representa un archivo de texto de una línea en la que el nombre de la familia (por ejemplo, ATL_genes) es seguido por los nombres de lugar geométrico de todos los genes que pertenecen a la familia separados por un tabulador. La prueba estadística aplicada para el enriquecimiento es una prueba exacta de Fisher y el p-valores de diferentes orígenes se almacenan en el archivo "outputFile.txt".
    3. Visualizar la organización del exón-intrón de genes mediante árbol de la vida interactivo (elOL)27, una herramienta en línea para la visualización, anotación y manejo de árboles filogenéticos.
      1. Subir un árbol filogenético en la sección "Upload" de la Página Web de elOL. El árbol se construye según la sección 5 a continuación. Para cada gen de miembro de la familia, recuperar predicción de la estructura génica de la anotación de la V1 del genoma de la vid (Web CRIBI citado más arriba). Calcular la longitud (en PB) de supuestas exones, intrones y regiones no traducidas (UTRs).
      2. Utilizar el conjunto de datos de "Dominios de la proteína" para la visualización gráfica del patrón del exón-intrón.
    Escribir un archivo de texto plano, incluyendo longitudes calculadas según las especificaciones indicadas siguiendo la ruta "Ayuda" → "páginas de ayuda" → "Tipos de conjunto de datos" → "Dominios de la proteína" en la Página Web de elOL27. Utilizando el conjunto de datos de "Dominios de la proteína", el "rectángulo de (RE)" y las formas de la "brecha de rectángulo (GP)" representan el exón y NC, respectivamente.

    5. phylogenetic análisis y nomenclatura

    1. Analizar las relaciones entre los miembros de la familia a través de la construcción de un árbol filogenético de alta calidad y la definición de una nomenclatura familiar ATL.
      1. Para una familia de genes de la vid, seguir las reglas establecidas por el Comité de nomenclatura de vid Super8.
      2. Recuperar secuencias de a. thaliana ATL, necesarias como referencia para la nomenclatura del gene de vid8, de la base de datos de UniProt28 .
      3. Escribir un archivo FASTA incluyendo todas las secuencias de nucleótido de grapevine y genes a. thaliana familiares para ser incluidos en el análisis filogenético. Las secuencias de nucleótido permiten el máximo de variabilidad entre miembros de la familia (en comparación con secuencias de la proteína).
    2. Árbol filogenético
      Nota: El uso de la tubería de 29 Phylogeny.fr es recomendado para obtener un árbol filogenético de alta calidad, pero no es obligatorio.
      1. Ver la Página principal de Phylogeny.fr29y seleccione la tubería de "Análisis de la filogenia".
        Nota: "Un clic" es conveniente en la mayoría de los casos, pero si es necesario él es posible seleccionar específica configuración avanzada ("Advanced") o incluso un análisis completamente modificado para requisitos particulares ("a la Carte"; ver paso 5.2.5).
      2. Escriba el "nombre de análisis", subir el archivo FASTA creado previamente (paso 5.2.1 y haga clic en "Enviar" para ejecutar el análisis.
      3. Por otra parte, si el procedimiento descrito anteriormente (pasos 5.2.1, 5.2.2) resulta en un mensaje de error, complete cada paso de la tubería de la suite de filogenia individualmente, como sigue.
        1. El músculo software página30, subir el archivo FASTA en el "Paso 1", seleccione "Pearson/FASTA" como "Formato de salida" en el "Paso 2" y haga clic en "Enviar" en el "Paso 3" para alinear secuencias de consulta.
        2. Haga clic en "Descargar archivo de alineación" y guardar como archivo FASTA para nuevas medidas.
        3. Proceso el archivo FASTA de alineación para eliminar el mal alineado con Gblocks Server herramienta31posiciones. Subir el archivo FASTA de alineación, seleccione "ADN" como "Tipo de secuencia" y eligió la opción de rigor que mejor se ajuste con el análisis (por ejemplo, para vid ATL gen familia Seleccione las tres opciones propuestas para "menos rigurosa selección" porque de divergencia de la secuencia alta). Haga clic en "Obtener bloques" para ejecutar el análisis.
        4. Haga clic en "Alineación resultante" en la parte inferior de la página de salida y guardar los resultados como un archivo nuevo de FASTA.
        5. En la Página principal de Phylogeny.fr29, seleccione a "A la carta" como tubería de "Análisis de la filogenia". A continuación, anule la selección de "Alineación múltiple" y "Conservación de la alineación". Haga clic en "Crear flujo de trabajo", subir el archivo FASTA Gblocks curada (paso 5.2.5.4), seleccione "Procedimiento de Bootstrapping" con parámetros por defecto en "Configuración" y haga clic en "Enviar" para ejecutar el análisis.
      4. Ramas de colapso mal apoyada (es decir, valores de bootstrap < 70%) haciendo clic en "Sucursales de colapso" en la sección "Selección y acción" y descargar los resultados finales en el formato Newick a más análisis.
    3. Asignar un nombre gen basado en la filogenia.
      1. Revisar el árbol filogenético para evaluar la confiabilidad de la estructura de árbol por subir a la suite de elOL citada más arriba (sección 4.3).
      2. Asignar manualmente un nombre de gene a cada miembro de la familia. En el caso de orthologues uno a uno, asignar la Arabidopsis-como nombre (p. ej., AtATL3 → VviATL3). Diferenciar genes de la vid (dos o más) derivados de un único homólogo de Arabidopsis con la misma distancia filogenética utilizando números o letras si el gen de Arabidopsis termina con un número (p. ej., AtATL23 → VviATL23a, VviATL23b).
      3. En el caso de orthologues uno a muchos o muchos a muchos, asignar un nuevo nombre de gen compuesto de Arabidopsis-como nombre (aquí, "ATL") con un número mayor que el número más alto ya utilizado de V. vinifera y de Arabidopsis (por ej., VviATL83).
      4. Completar la nomenclatura de la familia acaba de definir descendente desde la parte superior a la parte inferior del árbol filogenético.

    6. vid órganos y etapa de perfiles de expresión

    1. Generar el trabajo matriz con expresión de datos para los miembros de la familia.
      1. Descargar el V. vinifera CV. Corvina gene expresión Atlas datamatrix desde el enlace distribuido en la plataforma ResearchGate del32. Este archivo contiene los valores de expresión de RMA normalizado para ser utilizado en siguiendo pasos.
      2. Extraer los valores de expresión de cada gen familiar el datamatrix Atlas y escribir un "trabajo datamatrix" que contiene la misma fila de encabezado que el datamatrix de Atlas. Guardar el "trabajo datamatrix" como un archivo de texto delimitado por tabuladores.
    2. Realizar el análisis jerárquico de Cluster de bi utilizando software Multi experimento Viewer (MeV).
      1. Descargar e instalar software de MeV33.
      2. Subir el "trabajo datamatrix" (paso 6.1.2) siguiendo la ruta "Archivo" → "Cargar datos" → "Browse" y seleccione el archivo de texto. Seleccione "solo color matriz" y quitar la señal de "Carga anotación" cuando no dispone de una anotación automática. Seleccione el valor de la expresión superior de la izquierda de la previsualización del cuadro de expresión y haga clic en el botón "Cargar".
      3. Ajustar los datos aplicando la transformación de Log2 ("Ajustar datos" → "Registro transformaciones" → "Log2 transformar") y la normalización de Gene/fila ("Ajustar datos" → "Ajustes de Gene/fila" → "mediana centro gen/Row"). Establecer el límite de la escala adecuada ("Display" → "configurar Color escala límites").
      4. Calcular el agrupamiento jerárquico, siguiendo el camino de "Análisis" → "Clustering" → "HCL".
    Seleccione "Optimizar Gene hoja orden" y "Optimizar la hoja de orden de la muestra" en "El campo pedido optimización", "Correlación de Pearson" en el campo de "Selección de la matriz de distancia" y "Vinculación promedio de clustering" en el campo de la "Selección del método de acoplamiento". A continuación, haga clic en "Aceptar" para ejecutar el análisis.
  • Ver los resultados en el menú "Resultados" → "HCL" en el panel izquierdo de la ventana. Exportar el mapa haciendo clic en "Guardar imagen" en el menú "Archivo".
  • 7. expresión de perfiles en respuesta a estreses bióticos y abióticos

    1. Repita el paso 6.1 con el ID de la adhesión de IgE obtenido de las respectivas publicaciones y estudios de investigación de estrés biótico y abiótico en vid. Por ejemplo, proporcionando el perfil de transcriptoma de las bayas de vid infectados con el hongo patógeno Botrytis cinerea utilizando el microarray de NimbleGen uva todo el genoma de los experimentos pueden ser navegados con GSE ID de GSE52586. Repita los pasos 6.1.1 y 6.1.2.
    2. Buscar secuencia de NCBI Lee archivo34 con el ID de la SRA/BioProject (p. ej., SRP055458 o PRJNA275778 para los experimentos de "sombra de flor de vid") y descargar Lee secuencia cruda asociados. RNA-seq conjuntos de datos de muchos estudios diferentes se procesan utilizando una sola tubería para consistencia.
      1. Brevemente, recortar lecturas de secuencia cruda FASTQ (solo y par final) y filtro de calidad con Trimmomatic35. Uso que una AVGQUAL y un MINLEN filtran de 20 y 40, respectivamente y todas por defecto de parámetros.
      2. Índice 12 X vid referencia genoma1 con Bowtie236. Descargar 12 X vid referencia genoma (p. ej., bowtie2-build) antes de ejecutar el comando bowtie2 .
      3. Obtener matriz mesas con htseq Conde37 utilizando el archivo de anotación (GFF/GTF) del modelo vid V1 gene.
    3. Realizar análisis de la expresión (re-) génica diferencial en R38 con limma39 bibliotecas de matrices normalizadas de RMA y DESeq240 para mesas matriz obtenidas de pasos 7.1.1 y 7.2.1, respectivamente.
      1. Realizar una comparación de "dos grupos" estándar (es decir, "tratamiento" "control"). Asegúrese de que el diseño matriz/agrupaciones de "controles" y "tratamiento" las condiciones se especifican correctamente.
        Nota: Un diseño típico para análisis de microarrays de expresión diferencial (GSE52586) para comparar EL 33 bayas infectadas con Botrytis cinerea contra bayas (sano) de control en la misma etapa de desarrollo con limma ejecuta líneas de comandos 13 se muestra en la archivo adicional 1. Se muestra un diseño típico para el análisis de expresión diferencial del RNA-seq (SRP055458 o PRJNA275778) para comparar flor (a los 7 días después de la caída de cap) bajo tratamiento de sombra contra el control con DESeq2 ejecutar líneas de comando 14 en archivo complementario 1 .
      2. Obtener las listas de genes diferencialmente expresados (DEG) en cada cambio, para limma, utilice las funciones lmFit(), seguido de eBayes()y luego por topTable() funciones, mientras que para DESeq2, la DESeqDataSetFromMatrix(), DESeq()y results() funciones. A continuación, un típico flujo de trabajo a seguir.
        1. Para análisis de expresión diferencial de microarrays, vea líneas de comando 15 (archivo adicional 1). Para el análisis de expresión diferencial del RNA-seq ver líneas de comando 16 (archivo adicional 1). Repita los pasos anteriores para todos los demás contrasta con el esquema de diseño apropiado (véanse los ejemplos en el paso 7.3.1)
    4. De las listas de DEGs generados, extraer todas las filas que no corresponden a la adhesión de ATL V1, conservan columnas que contienen el cambio de doble log2 (Control de tratamiento) > | 0.5 | y p-valores (FDR) < 0.05 y combinación de ellos en consecuencia en una tabla matriz, si un estudio cae en "abiótico" o recopilaciones de "interacción bióticos/patógeno".
    5. Construir el heatmaps cluster jerárquico (abióticos y bióticos compendios) en R usando las bibliotecas gplots.
      Nota: Llamada a la función heatmap.2 construye el mapa de calor junto con dendrogramas de fila de las tablas correspondientes de la matriz. Argumentos adicionales usando cellnote función ayuda a distinguir diferencialmente expresados (log2FC > FDR 0.5, < 0.05) genes ATL en cada comparación a través de una amplia gama de condiciones experimentales por un * símbolo. Aplicar el flujo de trabajo típico en R ejecuta líneas de comandos 17 (1 archivo suplementario) o alternativamente, repita los pasos 6.2.2 a 6.2.5 para construir los heatmaps utilizando el software de MeV.

    8. Análisis de las relaciones entre la divergencia de la secuencia parálogos y coexpresión génica

    1. Construir la matriz de similitud pares. Los elementos de la matriz de similitud son los valores de similitud de secuencia calculada a partir de los alineamientos de pares de proteínas.
      1. Utilizar el relieve aguja web servidor41 con ajustes predeterminados para hacer Alineaciones de la secuencia pares y guardar como archivo de texto. Abra el archivo de texto de salida y retire todas las líneas de comentario, junto con nombres de columna y fila para generar un archivo llamado "similarityTable.txt".
        Nota: Dicha tabla tiene una línea para cada gen ATL, reportando los valores de similitud calculados en cada uno de la pares alineación. El orden de los loci en filas y columnas es el mismo para que una matriz simétrica se genera con respecto a los valores de la diagonal.
    2. Construir la matriz con datos de coexpresión calculando el coeficiente de correlación de Pearson. El procedimiento siguiente requiere R y el módulo de perl PDL.
      1. Descargar los valores de expresión de los genes ATL 96 ejecuta líneas de comandos 18 (1 archivo suplementario) en una terminal. Realizar un análisis de la co-expresión mediante un script en perl personalizados que se puede descargar mediante la ejecución de líneas de comandos 19 (archivo adicional 1). Tal script calculará el coeficiente de correlación de Pearson entre pares de loci ATL según lo divulgados previamente.
      2. Iniciar la secuencia de comandos ejecuta líneas de comandos 20 (1 archivo suplementario) y siga las instrucciones de salida.
    El script generará un archivo de salida (es decir, "coexpressionTable.txt") que contiene una matriz de coexpresión con el mismo orden de nombres de lugar geométrico de la matriz obtenida en el paso 8.1 (este orden es esencial para ejecutar la prueba de la chimenea, ver abajo).
  • Realice una prueba de Mantel entre las matrices de datos obtenidas en los pasos 8.1 y 8.2. Después de entrar en el entorno de R (ejecutar el comando "R" desde dentro de un terminal), cargar la biblioteca de ade4 usando el siguiente comando: library(ade4)
    1. Ejecutar la prueba de Mantel cargando las matrices de dos datos y realizando las estadísticas ejecutar líneas de comando 21 (1 archivo complementario), con "nrep" que representa el número de permutaciones. La prueba consiste en calcular la correlación entre los elementos de estas matrices, permutando las matrices y luego calcular la estadística de prueba mismo otra vez.
      Nota: Todos los valores obtenidos de la prueba estadística se utilizan para construir una distribución de referencia de la prueba estadística, que se utilizará para el cálculo de un p-valor para probar la significación. El número de permutaciones define la precisión con que el p-valor puede ser obtenido.
  • Resultados

    El gen VIT_05s0077g01970, identificado como el más parecido a a. thaliana ATL2 (At3g16720) a través de una búsqueda BLASTp, fue utilizado como sonda para los familiares ATL en el genoma de la vid (V. vinifera cv Pinot Noir PN40024). El análisis PSI-BLAST converge después de algunos ciclos revela una lista de supuestos genes pertenecientes a la familia del gene ATL de vid (figura 1A). La presencia del dominio canónico del anillo-H2 para...

    Discusión

    En la era genómica, muchas familias de genes se han caracterizado profundamente en varias especies de plantas. Esta información es previa a los estudios funcionales y proporcionar un marco para investigar más a fondo el papel de los diferentes miembros de una familia. En este contexto, es necesario un sistema de nomenclatura que permite identificar unívocamente a cada miembro de una familia, evitando la redundancia y confusiones que pueden surgir cuando los nombres se asignan independientemente a diferentes genes por...

    Divulgaciones

    Los autores no tienen nada que revelar.

    Agradecimientos

    El trabajo fue financiado por la Universidad de Verona, en el marco de conjunto proyecto 2014 (caracterización de la familia del gene ATL en vid y de su participación en la resistencia a Plasmopara viticola).

    Materiales

    NameCompanyCatalog NumberComments
    Personal computer
    Basic Local Alignment Search Tool (BLAST)https://blast.ncbi.nlm.nih.gov/Blast.cgi
    Molecular Evolutionary Genetics Analysis (MEGA)http://www.megasoftware.net/
    Motif-based sequence analysis tools (MEME)http://meme-suite.org/
    GeneiousBiomatters Limitedhttp://www.geneious.com/
    ProtParam Toolhttp://web.expasy.org/protparam/
    ngLOChttp://genome.unmc.edu/ngLOC/index.html
    TargetP v1.1 Serverhttp://www.cbs.dtu.dk/services/TargetP/
    Protein Prowlerhttp://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
    MUsitehttp://musite.sourceforge.net/
    Pfamhttp://pfam.xfam.org/
    TMHMM Server v. 2.0http://www.cbs.dtu.dk/services/TMHMM/
    ProtScalehttp://web.expasy.org/protscale/
    Grape Genome Database (CRIBI)http://genomes.cribi.unipd.it/grape/
    PhenoGramhttp://visualization.ritchielab.psu.edu/phenograms/plot
    MCScanXhttp://chibba.pgml.uga.edu/mcscan2/
    Interactive Tree Of Life (iTOL)http://itol.embl.de/
    UniProthttp://www.uniprot.org/
    Phylogeny.frhttp://www.phylogeny.fr/index.cgi
    MUSCLEhttp://www.ebi.ac.uk/Tools/msa/muscle/
    Gblocks Serverhttp://molevol.cmima.csic.es/castresana/Gblocks_server.html
    Vitis vinifera cv. Corvina gene expression Atlas datamatrixhttps://www.researchgate.net/publication/273383414_54sample_
    datamatrix_geneIDs_Fasoli2012
    Multi Experiment Viewer (MeV)http://mev.tm4.org/#/welcome
    Sequence Read Archive (SRA)https://www.ncbi.nlm.nih.gov/sra
    Rhttps://www.r-project.org/
    EMBOSS Needle (EMBL-EBI)http://www.ebi.ac.uk/Tools/psa/emboss_needle/

    Referencias

    1. Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449 (7161), 463-467 (2007).
    2. Adam-Blondon, A. -. F., et al. . Genetics, Genomics, and Breeding of Grapes. , 211-234 (2011).
    3. Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6 (5), 1388-1404 (2013).
    4. Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10 (6), 385-397 (2009).
    5. Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62 (4), 434-445 (2006).
    6. Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6 (8), e23934 (2011).
    7. Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7 (8), 1014-1021 (2012).
    8. Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
    9. Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3 (11), 827-837 (2002).
    10. Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92 (1), 155-161 (2013).
    11. Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31 (4), 852-861 (2013).
    12. Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24 (9), 3489-3505 (2012).
    13. . BLAST2.6.0 Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016)
    14. . Vitis vinifera cv. Corvina gene expression Atlas Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015)
    15. . Sequence Read Archive (SRA) Available from: https://www.ncbi.nlm.nih.gov/sra (2017)
    16. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
    17. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9 (4), 357-359 (2012).
    18. Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31 (2), 166-169 (2015).
    19. . Version 3.4.1 Available from: https://www.r-project.org/ (2017)
    20. Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47 (2015).
    21. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
    22. Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
    23. Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14 (1), 99 (2014).
    24. Overbeek, R., Fonstein, M., D'Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96 (6), 2896-2901 (1999).
    25. Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5 (10), 1800-1806 (2013).
    26. Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314 (5), 1041-1052 (2001).
    27. Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33 (8), (2017).
    28. Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
    29. Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15 (9), 1292-1297 (2005).
    30. Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20 (1), 45-58 (2010).
    31. Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22 (12), 3142-3152 (2003).
    32. Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24 (3), 311-326 (2017).
    33. Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).

    Reimpresiones y Permisos

    Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos

    Solicitar permiso

    Explorar más artículos

    Gen tican mero 130ATL E3 ubiquitina ligasafamilia de genesgenomanomenclaturafilogeniameta an lisis de la expresi nduplicaci n del genevid

    This article has been published

    Video Coming Soon

    JoVE Logo

    Privacidad

    Condiciones de uso

    Políticas

    Investigación

    Educación

    ACERCA DE JoVE

    Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados