JoVE Logo

Entrar

É necessária uma assinatura da JoVE para visualizar este conteúdo. Faça login ou comece sua avaliação gratuita.

Neste Artigo

  • Resumo
  • Resumo
  • Introdução
  • Protocolo
  • Resultados
  • Discussão
  • Divulgações
  • Agradecimentos
  • Materiais
  • Referências
  • Reimpressões e Permissões

Resumo

Este artigo descreve o procedimento para a identificação e caracterização de uma família de gene em videira aplicada à família de Arabidopsis Tóxicos em Levadura (ATL) E3 ubiquitina ligases.

Resumo

Classificação e nomenclatura dos genes em uma família podem contribuir de forma significativa para a descrição da diversidade das proteínas codificadas e a previsão da família funções com base em diversas características, tais como a presença de motivos de sequência ou de particular sites para modificação pós-traducional e o perfil de expressão dos membros da família em diferentes condições. Este trabalho descreve um protocolo detalhado para a caracterização de família do gene. Aqui, o procedimento é aplicado para a caracterização da Arabidopsis Tóxicos em Levadura (ATL) E3 ubiquitina ligase família na videira. Os métodos incluem a identificação de todo o genoma dos membros da família, a caracterização da localização do gene, estrutura e duplicação, a análise dos motivos da proteína conservada, a previsão dos sites de localização e fosforilação de proteínas, bem como Gene expressão perfila através da família em diferentes conjuntos de dados. Tal procedimento, que poderia ser alargado a novas análises dependendo fins experimentais, poderia ser aplicado a qualquer família de gene em quaisquer espécies de plantas para as quais dados genomic estão disponíveis, e fornece informações valiosas para identificar candidatos interessantes para estudos funcionais, dando insights sobre os mecanismos moleculares de adaptação da planta para seu ambiente.

Introdução

Durante a última década, muita pesquisa realizada na genômica de videira. Videira é uma reconhecida cultura economicamente relevante, que se tornou um modelo para a investigação sobre o desenvolvimento do fruto e sobre as respostas de plantas lenhosas a estresses bióticos e abióticos. Neste contexto, o lançamento do genoma Vitis vinifera CV. PN40024 em 2007-1 e sua versão atualizada em 20112 levou a uma rápida acumulação de dados "Omics"-escala e a uma explosão de estudos de alto rendimento. Baseado nos dados de sequência publicada, a análise abrangente de uma família de determinado gene (geralmente composta por proteínas partilha motivos conservados, semelhanças estruturais e/ou funcionais e as relações evolutivas), agora pode ser realizada para descobrir sua perfis de expressão genética, evolução e funções moleculares. Essas análises podem contribuir para a compreensão de como as famílias gene controlam processos fisiológicos em um nível de todo o genoma.

Muitos aspectos do ciclo de vida da planta são regulados pela mediada por ubiquitina de degradação de proteínas chaves, que requerem um volume de negócios de aperfeiçoá-lo para assegurar o regulares processos celulares. Importantes componentes do processo de degradação mediada por ubiquitina são os E3 ubiquitina ligases, que são responsáveis pela flexibilidade do sistema, graças ao recrutamento de alvos específicos3. Por conseguinte, estas enzimas representam uma família enorme de gene, com cerca de 1.400 E3 ligase-codificação genes previstos em Arabidopsis thaliana genoma4, cada ligase de ubiquitina E3 atuando para o ubiquitination de proteínas alvo específico. Apesar da importância da ubiquitination substrato específico no Regulamento celular em plantas, pouco se sabe sobre como o caminho da ubiquitination é regulamentado e proteínas alvo foram identificadas somente em alguns casos. O deciframento de tais mecanismos de especificidade e regulamentação depende primeiramente a identificação e caracterização das diferentes componentes do sistema, em particular as ligases E3. Entre ubiquitina ligases, subfamília ATL é caracterizada por 91 Membros identificados em a. thaliana , exibindo um anel-H2 dedo domínio5,6, alguns deles desempenhando um papel na defesa e hormônio respostas7.

O primeiro passo crucial para definir os membros de uma família nova do gene é a definição precisa das características familiares, tais como motivos de consenso, domínios-chave e características da sequência da proteína. Com efeito, a recuperação confiável de todos os membros da família gene com base na análise de explosão requer algumas características de sequência obrigatória, em domínios de particular da proteína responsáveis pela proteína função/atividade, servindo como assinatura de proteína. Isto pode ser facilitado pela caracterização anterior da mesma família gene em outras espécies de plantas ou alcançado através da análise de diferentes genes presumidamente pertencentes à família mesma em diferentes espécies de plantas, para isolar as sequências comuns. Os membros da família podem então ser individualmente nomeados seguindo regras comuns colonizadas por consórcios internacionais para uma espécie de determinada planta. Em videira, por exemplo, tal procedimento é submetido às recomendações do Comité de nomenclatura super para anotação de Gene de uva (sNCGGa), que estabelece a construção de uma árvore filogenética, incluindo V. vinifera e a. thaliana membros da família para permitir a anotação de gene gene baseiam em sequências de nucleotídeos8.

Localização de cromossomo de membros da família e pesquisa de duplicação do gene permitir destacando a presença de genes duplicados do inteiro-genoma ou em tandem. Essa informação aparece útil para desvendar as funções do gene putativo, desde que pode mostrar a redundância funcional ou revelar situações diferentes, ou seja, não-functionalization, neo-functionalization ou functionalization sub9. Ambos os neo - e sub - functionalization é eventos importantes que criam novidade genética, fornecendo novos componentes celulares para adaptação da planta às mudanças ambientes10. Em particular, as duplicações de genes ancestrais e produção de novos genes eram muito frequentes durante a evolução do genoma de videira e recém-formado genes originários de duplicações em tandem e proximais em videira eram mais propensos a produzir novos funções de11.

Outro fator chave em decifrar a função dos genes familiares é o perfil de transcriptomic. A disponibilidade de bases de dados públicas, dando acesso a uma enorme quantidade de dados de transcriptomic pode ser explorada, assim, para atribuir funções putativos para membros da família gene usando análises de expressão em larga escala em silico . Com efeito, a expressão peculiar de alguns genes em órgãos da planta específica ou em resposta a certas tensões pode dar algumas dicas sobre os putativos papéis das proteínas correspondentes em condições definidas e dar suporte a hipóteses sobre possíveis sub functionalization dos genes duplicados para responder aos desafios diferentes. Para esse efeito, é importante considerar os vários conjuntos de dados: estas podem ser gene já disponível matrizes de expressão, tais como o atlas transcriptomic de todo o genoma da videira órgãos e estádios de desenvolvimento,12, ou podem ser construídas ad hoc por recuperação de conjuntos de dados transcriptomic para as espécies de planta particular sujeitados a tensões definidas. Além disso, uma abordagem simples, usando duas matrizes, uma com dados de similaridade emparelhadas e outro com os coeficientes emparelhadas expressão co podem ser aplicados para avaliar as relações entre padrões de semelhança e a expressão de sequência dentro de uma família de gene.

O objetivo deste trabalho é apresentar uma abordagem global, definindo a estrutura do gene, motivos de proteína conservada, localização cromossômica, duplicações do gene e padrões de expressão, como também a previsão de sites localização e fosforilação da proteína, para atingir uma caracterização exaustiva de uma família de genes em plantas. Uma abordagem abrangente é aplicada aqui, para a caracterização da família ATL E3 ubiquitina ligase em videira. De acordo com o papel emergente de membros da subfamília ATL na regulação de processos celulares chave7, este trabalho pode também auxiliar a identificação dos fortes candidatos para estudos funcionais e eventualmente a desvendar os mecanismos moleculares que regem o adaptação desta cultura importante para seu ambiente.

Protocolo

1. identificação da família do Gene ATL putativo membro (s)

  1. Versão web de PSI-BLAST
    1. Abra a página web de explosão13 e clique na seção de explosão de proteína.
    2. No campo "Sequência de consulta de Enter", digite a sequência de aminoácidos da proteína (aqui VIT_05s0077g01970) que será usada como sonda para identificar outros membros da família.
      Nota: Uma boa proteína representante deve ser usado (uma proteína mostrando todas as características importantes que caracterizam a família).
    3. No campo "Choose conjunto de pesquisa", selecione o banco de dados "Proteína de referência" (refseq_protein) e o organismo de interesse (V. vinifera - taxid:29760).
    4. No campo "programa seleção", selecionar o algoritmo de PSI-BLAST e clique no botão para executar a análise BLAST.
      Nota: Clicando em "parâmetros de algoritmo" é possível ajustar alguns parâmetros avançados (sequências de destino Max, matriz de Scoring, limiar de PSI-BLAST, etc.).
    5. A primeira explosão redonda recupera todas as sequências exibindo partidas relevantes com a consulta (e-valor acima do limiar selecionado - por padrão 0.005; 0,001 neste experimento). Desmarque todas as entradas, que claramente não pertencem à família sob exame clicando sobre o carrapato na coluna "Selecione para PSI-BLAST" e executar a segunda iteração do PSI-BLAST clicando no botão de explosão como na etapa 1.1.4.
    6. Recentemente identificadas sequências são destacadas em amarelo. Desmarcar o hits obtido claramente errado e descobrir ainda mais iterações, conforme descrito na etapa 1.1.5.
    7. Continue com iterações até que o algoritmo não encontra qualquer entrada relevante ou atingir convergência (não há novas entradas são encontradas). Baixe a lista de membros da família gene putativo para mais análises. Inspecione visualmente os sucessos obtidos em cada iteração para evitar a presença de falsos positivos.
  2. Versão autônoma de PSI-BLAST
    1. Baixe a versão autônoma do explosão clicando no botão "baixar explosão" na página inicial explosão13.
      Nota: O software de explosão independente é uma versão de linha de comando de interface web descrito antes. Permite executar a pesquisa PSI-BLAST contra um banco de dados local ou remoto personalizado. Além disso, ele permite pesquisar com um pré-definido posição específica Pontuação Matrix (PSSM).

2. manual inspeção dos membros da família PSI-BLAST-identificado

  1. Alinhamento múltiplo
    1. Recolher as sequências de ácido aminoácidas anteriormente identificadas em um arquivo no formato FASTA e enviá-lo para o MEGA software14 para prosseguir com o alinhamento múltiplo.
    2. Abra o software MEGA, clique no botão "Alinhar", clique em "Editar/construir alinhamento", clique em "Criar um novo alinhamento", clique em "Proteína".
    3. Clique em "Editar" no menu de alinhamento e "Inserir sequência de arquivo". Procure pelo arquivo FASTA criado antes e confirme o upload de todas as sequências pesquisadas.
    4. Clique em "Alinhamento" no menu de alinhamento e "Alinhar pelo músculo". Usar parâmetros padrão, clique o botão "Calcular" e aguarde a conclusão do alinhamento múltiplo.
    5. Inspecione visualmente o alinhamento múltiplo para excluir incorretamente previu os membros da família. O canonical Pedagoga (13 x) PxCxHxxHxxCxxxW (7x) CxxCW motivo, (em especial a presença do resíduo prolina antes o terceiro cisteína), é a característica chave necessária para definir os membros da família ATL.
  2. Análise do logotipo específico
    1. Apresenta a lista definitiva dos membros da família (96 sequências de videira cumpram os requisitos para ser considerado ATL) o Em múltiplas por motivo Elicitação (MEME)15 para definir motivos conservados toda a família.
    2. MEME página inicial, clique no botão "MEME" e complete o "submissão formulário de dados" com informações específicas sobre a família de interesse.
    3. Use a análise MEME para confirmar a presença dos dois temas esperados dentro de videira ATL os membros da família, ou seja, o anel-H2 e os motivos GLD.
  3. Como alternativa, execute os passos 2.1 e 2.2 simultaneamente usando a suíte de softwares de Bioinformática (ver Tabela de materiais).
    1. Upload de arquivo FASTA (consulte a etapa 2.1.1) para a suíte. Selecione "Arquivo" no menu, em seguida, "Importar" e clique em "do arquivo". Procure o arquivo FASTA e clique em "Abrir".
    2. Selecione todas as sequências de importados na lista e clique no botão "Alinhar/montar" na barra de ferramentas, clique em "Pairwise alinhamento múltiplo". Selecione "Alinhamento muscular" e clique em "Okey" para iniciar o alinhamento usando parâmetros padrão.
    3. Para visualizar o logotipo do alinhamento, clique em "Gráficos" → "opções" e selecione "Logotipo da sequência".

3. análise dos parâmetros físicos de proteína e domínios

  1. Como a definição dos diferentes parâmetros físicos dos membros da família pesquisados é importante ter uma descrição abrangente da família, apresentar a lista de membros da família de ferramentas específicas da web.
    1. Ponto isoelétrico (pI) e do peso molecular (kDa), use a ferramenta de ProtParam16 no site Expasy com parâmetros padrão.
    2. Para localização Subcellular da proteína, usar ferramentas diferentes para obter uma previsão mais confiável como ngLOC v 1.017 com configurações padrão, targetP v 1.118 com configurações padrão e proteína gatuno Localização subcellular v 1.219 com um corte de probabilidade de 0,5. Para sites de fosforilação, use o MUsite v 1.0 web ferramenta20 com parâmetros padrão.
  2. Investiga os domínios da proteína adicional em membros da família.
    1. Abra o banco de dados de Pfam Web page21, selecione a ferramenta "Busca", enviar sequências de proteínas na caixa de consulta e clique em "Ir" para executar a análise.
      Nota: Cada sequência da proteína é analisada individualmente. Um valor de 1.0, na configuração padrão e permite discriminar entre sucessos significativos e não-significativas.
    2. Abra o servidor TMHMM22 do centro para análise de sequências biológicas investigar a presença de regiões transmembranares putativos.
Cole todas as sequências de proteína simultaneamente na caixa consulta (ou alternativamente, carregar um arquivo de texto, incluindo todas as sequências de proteína em formato FASTA) e clique em "Enviar" para executar a análise.
  • Analise proteínas faltando domínios transmembranares previstos, de acordo com TMHMM (passo 3.2.2), com a ferramenta ProtScale para identificar regiões hidrofóbicas putativos. Abra ProtScale página23. Cole cada sequência da proteína na caixa de consulta e selecione "Hphob. / Kyte & Doolittle "como escala de aminoácido. Clique em "Enviar" para executar a análise.
  • 4. cromossômica distribuição, duplicações e organização intron-Exon

    1. Mapear os membros da família sobre os cromossomos com base na informação obtida do site Centro de biotecnologia do Grapevine genoma CRIBI24ATL.
      1. Procure o PhenoGram Web site Home Page25. Gravar o "arquivo de entrada" como um arquivo de texto delimitado por tabulação com as características específicas dos genes a serem mapeados a cromossomos, de acordo com as diretrizes exaustivas e exemplos sobre a compilação do arquivo fornecido, seguindo o caminho "Phenogram" → " Documentação"→"Opções"→"Input file".
      2. Escreva o "título" do trabalho. Selecione o genoma a ser desenhada. Para genomas não implementadas no software, tais como o genoma da videira, selecione "outros" no menu drop-down. Gravar o arquivo de genoma de acordo com as orientações e exemplos fornecidos, seguindo o caminho "Phenogram" → "Documentação" → "Opções" → "Genoma" e enviá-lo.
      3. Usar parâmetros de padrão de "Espaçamento de fenótipo", "Fenótipo cor", "Formato de imagem" ou selecionadas alternativas nos respectivos menus e clique em "Plot" obter a visualização dos genes em cromossomos.
    2. Defina o estado de duplicação dos membros da família usando o software de MCScanX26.
      1. Baixe e descompacte uma cópia do MCscanX em uma máquina local, executando o comando linhas 1 (arquivo complementar 1). Entrar na pasta MCscanX e criar os executáveis necessários executando as linhas de comando 2 (arquivo complementar 1).
        Nota: Instalação de MCscanX é conhecida por falhar em algumas máquinas de Linux de 64 bits devido a um problema em relação a função chdir. Se uma mensagem de erro é retornada relacionada a essa função após a fazer execução de comando, as linhas de comando 3 (arquivo complementar 1) deve ser executadas e o comando "make" deve ser tentado depois.
      2. Baixe as proteínas V. vinifera e o arquivo de anotação, executando o comando linhas 4 (arquivo complementar 1).
        Nota: A videira anotação arquivo precisa ser descompactado e o gato de informação único de cromossomos em um único arquivo executando as linhas de comando 5 (arquivo complementar 1).
      3. Executar um "todos contra todos" blastp de busca usando o arquivo de proteína de V. vinifera como tanto a consulta e o assunto.
      4. Crie um banco de dados pesquisáveis explosão usando o arquivo proteína V. vinifera executando o comando linhas 6 (arquivo complementar 1). Executar a busca de blastp usando o arquivo V. vinifera proteínas como uma consulta no banco de dados criado anteriormente, executando o comando linhas 7 (arquivo complementar 1).
      5. Converta o arquivo de anotação em um formato adequado para MCScanX. Execute o comando linhas 8 (arquivo complementar 1) para baixar a parseMSCanXgff.pl de script perl personalizados. Realizar a análise de linhas de comando 9 (arquivo complementar 1) em execução.
        Nota: Um vitis.gff de arquivo é gerado que contém as coordenadas do gene no seguinte formato:
        SP # gene posição terminando a posição inicial
        onde o "sp" é um código de duas letras para a espécie (Vv para videira) Considerando que o "#" é o nome do cadafalso. Note que o script perl personalizado fornecido é adequado para a maioria de conversão, embora algumas modificações de código podem ser necessária em alguns casos específicos, devido à diversidade das informações fornecidas no arquivo de anotação disponível.
      6. Lançamento MCScanX executando o comando linhas 10 (arquivo complementar 1).
        Nota: O "vitis" é o prefixo de anotação e o arquivo de saída de explosão. Isto representa um requisito obrigatório para o software executar.
      7. Analise os resultados de MCScanX. MCScanX produz um arquivo de texto "vitis.collinearity", que contém blocos colineares. Esse arquivo pode ser inspecionado por qualquer editor de texto (ver exemplo 1 complementar 1 arquivode saída).
        Nota: Um diretório "mcscaxOutput.html" é gerado, que contém os arquivos html com alinhamentos múltiplos de blocos colineares contra cada cromossomo de referência. Esses arquivos podem ser olhados através de um navegador da web.
      8. Classifica os genes parólogo, baseados em suas posições relativas em cromossomos 11 (arquivo complementar 1) de linhas de comando em execução.
        Nota: Classificação de gene parólogo é descrita no Quadro suplementar II. O arquivo de saída gerado "vitis.gene_type" contém todas as informações de origem com um formato delimitado por tabulação de simples.
      9. Realizar análise de enriquecimento para avaliar se a família do gene originou-se predominantemente através de um mecanismo específico, executando o comando linhas 12 (arquivo complementar 1).
        Nota: O arquivo "vitis.gene_type" é gerado no passo 4.2.8, Considerando que o arquivo "gene_family_file" representa um arquivo de texto uma linha em que o nome da família (por exemplo, ATL_genes) é seguido por locus nomes para todos os genes pertencentes à família separados por uma tabulação. O teste estatístico aplicado para o enriquecimento é um teste exato de Fisher e o p-valores de diferentes origens são armazenadas no arquivo "OutputFile".
    3. Visualize a organização intron-exon dos genes usando Interactive árvore da vida (iTOL)27, uma ferramenta on-line para a visualização, anotação e gestão de árvores filogenéticas.
      1. Carregar uma árvore filogenética na seção "Upload" do site iTOL. A árvore é construída de acordo com a seção 5 abaixo. Para cada gene de membro da família, recupere predição da estrutura genética de V1 anotação do genoma da videira (site CRIBI citado acima). Calcule o comprimento (em PA) de exões putativos intrões e regiões untranslated (UTRs).
      2. Use o dataset "Domínios da proteína" para visualização gráfica do padrão intron-exon.
    Gravar um arquivo de texto sem formatação, incluindo comprimentos calculados de acordo com as especificações fornecidas, seguindo o caminho "Ajudar" → "páginas de ajuda" → "Tipos de Dataset" → "Domínios da proteína" na iTOL site27. Usando o dataset "Domínios da proteína", "retângulo de (RE)" e as formas de "lacuna de retângulo (GP)" representam o exon e as UTRs, respectivamente.

    5. nomenclatura e análise filogenética

    1. Analise as relações entre os membros da família ATL através da construção de uma árvore filogenética de alta qualidade e a definição de uma nomenclatura de família.
      1. Para uma família de gene de videira, siga as regras estabelecidas pela videira Comité de nomenclatura de Super8.
      2. Recupere sequências da . thaliana ATL, necessárias como referência para videira gene nomenclatura8, a partir de banco de dados o UniProt28 .
      3. Gravar um arquivo FASTA, incluindo todas as sequências de nucleotídeos de videira e membros da família a. thaliana gene a ser incluídos na análise filogenética. As sequências de nucleótidos permitam o máximo de variabilidade entre membros da família (em comparação com sequências de proteínas).
    2. Árvore filogenética
      Nota: O uso do pipeline 29 Phylogeny.fr é recomendado para obter uma árvore filogenética de alta qualidade, mas não obrigatório.
      1. Procure o homepage de Phylogeny.fr29e selecione o pipeline "Análise da filogenia".
        Nota: "One Click" é adequado na maioria dos casos, mas se for necessário, é possível selecionar específicas configurações avançadas ("Advanced") ou até mesmo uma análise totalmente personalizada ("à la Carte"; Veja passo 5.2.5).
      2. Escrever o nome"da análise", o upload do arquivo FASTA criado anteriormente (passo 5.2.1 e clique em "Submit" para executar a análise.
      3. Alternativamente, se o procedimento descrito acima (passos 5.2.1, 5.2.2) resulta em uma mensagem de erro, concluir cada etapa do gasoduto filogenia suíte individualmente, da seguinte maneira.
        1. O músculo software homepage30, carregar o arquivo FASTA na "Etapa 1", selecione "Pearson/FASTA" como "Formato de saída" em "Passo 2" e clique em "Enviar" no "Passo 3" para alinhar sequências de consulta.
        2. Clique em "Carregar arquivo de alinhamento" e salvar como arquivo FASTA para novas etapas.
        3. Processo o arquivo FASTA de alinhamento para eliminar mal alinhados posições usando a ferramenta de servidor Gblocks31. Carregar o arquivo FASTA de alinhamento, selecione "DNA" como "Tipo de sequência" e escolheu a opção (ões) de rigor que melhor se encaixa com a análise (por exemplo, para videira ATL gene familiar selecione todas as três opções propostas para "menos rigorosa seleção" porque de divergência de alta sequência). Clique em "Obter blocos" para executar a análise.
        4. Clique em "Alinhamento resultante" na parte inferior da página de saída e salvar os resultados como um novo arquivo FASTA.
        5. O homepage de Phylogeny.fr29, selecione "A la Carte" como pipeline de "Análise de filogenia". Em seguida, desmarque a opção "Alinhamento múltiplo" e "Curadoria de alinhamento". Clique em "Criar fluxo de trabalho", carregar o arquivo Gblocks-curadoria FASTA (etapa 5.2.5.4), com parâmetros de padrão em "Configurações", selecione "Bootstrapping procedimento" e clique em "Enviar" para executar a análise.
      4. Ramos de colapso mal suportado (ou seja, valores de bootstrap < 70%), clicando em "Colapso ramos" na seção "Select e ação" e baixar os resultados finais no formato de Brasilia para novas análises.
    3. Atribua um nome de gene baseado a filogenia.
      1. Examine a árvore filogenética para avaliar a confiabilidade da estrutura de árvore por meio de upload para a suite iTOL citada acima (seção 4.3).
      2. Atribua manualmente um nome de gene para cada membro da família. No caso de um para um orthologues, atribuir a Arabidopsis-como o nome (por exemplo, AtATL3 → VviATL3). Diferenciar os genes de videira (dois ou mais) derivando de um homólogo Arabidopsis único com a mesma distância filogenética usando números, ou letras se o gene de Arabidopsis termina com um número (por exemplo, AtATL23 → VviATL23a, VviATL23b).
      3. No caso de orthologues um-para-muitos ou muitos-para-muitos, atribuir um novo nome de gene composto a Arabidopsis-como nome (aqui, "ATL") combinado com um número maior que o maior número já usado para V. vinifera e de Arabidopsis (ex., VviATL83).
      4. Complete a nomenclatura da família recém-definido decrescente da parte superior à parte inferior da árvore filogenética.

    6. grapevine órgão e fase de criação de perfil de expressão

    1. Gere os dados úteis dados matriz contendo expressão para os membros da família.
      1. Baixe o V. vinifera CV Corvina gene expressão Atlas datamatrix de link distribuído no ResearchGate plataforma32. Este arquivo contém os valores de expressão de RMA normalizado a serem utilizados em etapas.
      2. Extrair os valores de expressão de cada gene familiar do Atlas datamatrix e escrever um "datamatrix de trabalho", contendo a mesma linha de cabeçalho, como o Atlas datamatrix. Salve o datamatrix"trabalho" como um arquivo de texto delimitado por tabulação.
    2. Efectuar a análise hierárquica de bi-agrupado usando software Multi Visualizador de experimento (MeV).
      1. Baixe e instale o software de MeV33.
      2. Carregar o datamatrix"trabalho" (passo 6.1.2) seguindo o caminho do "Arquivo" → "Carregar dados" → "Browse" e selecione o arquivo de texto. Selecione "matriz de cor única" e remover o carrapato de "Anotação de carga", quando uma anotação automática não é fornecida. Selecione o valor da expressão superior mais à esquerda da visualização da tabela de expressão e clique no botão "Load".
      3. Ajuste os dados aplicando a transformação de Log2 ("Ajustar dados" → "Transformações de Log" → "Log2 transformar") e normalização de Gene/linha ("Ajustar dados" → "Gene/linha ajustes" → "Median Center Gene/Row"). Defina o limite de escala apropriada ("Exibir" → "definir cor escala limites").
      4. Calcular o Clustering hierárquico seguindo o caminho de "Análise" → "Clustering" → "HCL".
    Selecione "Otimizar o Gene folha ordem" e "otimizar amostra folha" no "Campo de otimização de ordenação", "Correlação de Pearson" no campo "Seleção de matriz de distância" e "Ligação média cluster" no campo "Seleção do método de Linkage". Em seguida, clique em "Okey" para executar a análise.
  • Exibir os resultados no menu "Resultados de análise" → "HCL", no painel esquerdo da janela. Exporte o mapa de calor, clicando em "Salvar imagem" no menu "Arquivo".
  • 7. expressão de criação de perfil em resposta a estresses bióticos e abióticos

    1. Repita a etapa 6.1 com o ID de adesão GSE Obtida de estudos investigando o estresse biótico e abiótico em grapevine e respectivas publicações. Por exemplo, experimentos, fornecendo o perfil de transcriptoma de bagas de videira infectada com o patógeno fungo Botrytis cinerea , usando o microarray NimbleGen uva todo-genoma podem ser visitados com GSE ID de GSE52586. Repita as etapas 6.1.1 e 6.1.2.
    2. Procurar o NCBI sequência lê arquivo34 com a SRA/BioProject ID (por exemplo, SRP055458 ou PRJNA275778 para experiências "sombreamento de flor de videira") e baixar tudo associado sequência primas leituras. RNA-seq datasets de muitos estudos diferentes são processadas usando um único pipeline para consistência.
      1. Brevemente, aparar leituras FASTQ sequência primas (single - e par-final) e filtro de qualidade com Trimmomatic35. Uso que um AVGQUAL e MINLEN filtro de 20 e 40, respectivamente e todos os parâmetros padrão.
      2. Índice do 12 X videira referência genoma1 usando Bowtie236. Baixe 12 X videira referência genoma (por exemplo, construir bowtie2) antes de executar o comando bowtie2 .
      3. Obter contagem matriz tabelas com htseq-Conde37 usando o arquivo videira V1 gene modelo anotação (GFF/GTF).
    3. Realizar análise de expressão (re-) gene diferencial em R38 com se39 bibliotecas para matrizes de RMA-normalizado e DESeq240 bibliotecas para contagem matriz tabelas obtidas medidas 7.1.1 e 7.2.1, respectivamente.
      1. Realizar uma comparação de "dois-grupo" padrão (isto é, o "tratamento" / "controle"). Certifique-se de que o projeto matriz/agrupamentos de condições "controla" e "tratamento" são especificados corretamente.
        Nota: Um design típico para a análise de expressão diferencial de microarray (GSE52586) para comparar EL-33 bagas infectadas com Botrytis cinerea contra bagas (saudável) de controle na mesma fase de desenvolvimento com se executando as linhas de comando 13 é mostrada no arquivo complementar 1. Um projeto típico para análise de expressão diferencial de RNA-seq (SRP055458 ou PRJNA275778) para comparar flor (em 7 dias após a queda do tampão) sob tratamento de sombra contra o controle com DESeq2 executando o comando linhas 14 é mostrado na complementar arquivo 1 .
      2. Obter as listas de genes diferencialmente expressos (DEG) em cada contraste, para se, use as funções lmFit(), seguido por eBayes()e então por topTable() funções, enquanto que para DESeq2, use o DESeqDataSetFromMatrix(), DESeq()e results() funções. Abaixo, um fluxo de trabalho típico a ser seguido.
        1. Para a análise da expressão diferencial de microarray, ver linhas de comando 15 (arquivo complementar 1). Para análise de expressão diferencial de RNA-seq ver linhas de comando 16 (arquivo complementar 1). Repita os passos acima para todos os outros contrastes com esquema diferente design apropriado (ver exemplos na etapa 7.3.1)
    4. Nas listas de DEGs gerados, extrair todas as linhas que não correspondem à adesão de ATL V1, reter colunas contendo a mudança de dobrar log2 (tratamento/controle) > | 0.5 | e ajustado p-valores (FDR) < 0,05 e mesclagem-los adequadamente em uma tabela de matriz, se um estudo cai "abióticos" ou colectâneas de "interação biótica/patógeno".
    5. Construa o heatmaps clusterizado hierárquica (colectâneas abióticas e bióticas) em R, usando as bibliotecas gplots.
      Nota: Chamar a função heatmap.2 constrói o heatmap juntamente com a linha dendrograms das tabelas respectivas matriz. Argumentos adicionais usando o cellnote função ajuda a distinguir diferencialmente expressos (log2FC > 0,5, FDR < 0.05) genes ATL em cada comparação entre uma grande variedade de condições experimentais por um * símbolo. Aplicar o fluxo de trabalho típico em R executando o comando linhas 17 (arquivo complementar 1) ou alternativamente, repita os passos 6.2.2 a 6.2.5 para construir o heatmaps usando software de MeV.

    8. análise das relações entre a sequência parólogo divergência e expressão de Gene co

    1. Construa a matriz de similaridade emparelhada. Os elementos da matriz de similaridade são os valores de similaridade da sequência calculadas a partir os alinhamentos de proteína emparelhadas.
      1. Use o alto-relevo agulha web servidor41 com as configurações padrão para fazer alinhamentos de sequência emparelhadas e salvar como arquivo de texto. Abra o arquivo de texto de saída e remover todas as linhas de comentário, juntamente com nomes de coluna e linha para gerar um arquivo chamado "similarityTable.txt".
        Nota: Uma mesa tão dispõe de uma linha para cada gene ATL relatando os valores de similaridade calculados em cada um do alinhamento emparelhado. A ordem dos loci em linhas e colunas é o mesmo modo que uma matriz simétrica é gerada com o respeito dos valores de diagonal.
    2. Construa a matriz com dados de expressão co calculando o coeficiente de correlação de Pearson. O procedimento a seguir exige R e o módulo perl PDL.
      1. Baixe os valores de expressão para os 96 genes ATL, executando o comando linhas 18 (arquivo complementar 1) dentro de um terminal. Realizar uma análise de expressão co usando um script perl personalizado que pode ser baixado através da execução de linhas de comando 19 (arquivo complementar 1). Esse script irá calcular o coeficiente de correlação de Pearson entre pares dos loci ATL como anteriormente relatado.
      2. Abra o script executando o comando linhas 20 (arquivo complementar 1) e siga as instruções de saída.
    O script irá produzir um arquivo de saída (ou seja, "coexpressionTable.txt") que contém uma matriz de expressão co apresentando a mesma ordem de nomes de locus de matriz obtida na etapa 8.1 (essa ordem é essencial para fazer o teste de Mantel, veja abaixo).
  • Execute um teste de Mantel entre as matrizes de dados obtidos em etapas 8.1 e 8.2. Depois de introduzir o ambiente R (executar o comando "R" de dentro de um terminal), carregar a biblioteca de ade4 usando o seguinte comando: library(ade4)
    1. Execute o teste de Mantel carregando as matrizes de dois dados e executando as estatísticas de execução de linhas de comando 21 (arquivo complementar 1), com "nrep" que representa o número de permutações. O teste consiste em calcular a correlação entre os elementos destas matrizes, permuting as matrizes e então calcular a estatística de teste a mesma novamente.
      Nota: Todos os valores obtidos do teste de estatística são usados para construir uma distribuição de referência do teste estatístico, que será usado para calcular um p-valor para testar a significância. O número de permutações define a precisão com que o p-valor pode ser obtido.
  • Resultados

    O gene VIT_05s0077g01970, identificado como o mais parecido com a. thaliana ATL2 (At3g16720), através de uma pesquisa BLASTp, foi usado como sonda para inspeccionar os membros da família ATL no genoma da videira (V. vinifera cv Pinot Noir PN40024). A análise de PSI-BLAST convergiu depois de alguns ciclos, revelando uma lista de putativos genes pertencentes à família de gene videira ATL (figura 1A). A presença do anel-H2 domínio canôn...

    Discussão

    Na era genômica, muitas famílias de gene foram caracterizadas profundamente em várias espécies de plantas. Esta informação é preliminar do estudos funcionais e fornecer um quadro para investigar mais profundamente o papel dos diferentes membros de uma família. Neste contexto, há também a necessidade de um sistema de nomenclatura que permite para identificar exclusivamente cada membro de uma família, evitando a redundância e confusões que podem surgir quando os nomes são atribuídos de maneira independente d...

    Divulgações

    Os autores não têm nada para divulgar.

    Agradecimentos

    O trabalho foi apoiado pela Universidade de Verona, dentro do quadro de comum projeto 2014 (caracterização da família do gene ATL em videira e da sua participação na resistência à Plasmopara viticola).

    Materiais

    NameCompanyCatalog NumberComments
    Personal computer
    Basic Local Alignment Search Tool (BLAST)https://blast.ncbi.nlm.nih.gov/Blast.cgi
    Molecular Evolutionary Genetics Analysis (MEGA)http://www.megasoftware.net/
    Motif-based sequence analysis tools (MEME)http://meme-suite.org/
    GeneiousBiomatters Limitedhttp://www.geneious.com/
    ProtParam Toolhttp://web.expasy.org/protparam/
    ngLOChttp://genome.unmc.edu/ngLOC/index.html
    TargetP v1.1 Serverhttp://www.cbs.dtu.dk/services/TargetP/
    Protein Prowlerhttp://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
    MUsitehttp://musite.sourceforge.net/
    Pfamhttp://pfam.xfam.org/
    TMHMM Server v. 2.0http://www.cbs.dtu.dk/services/TMHMM/
    ProtScalehttp://web.expasy.org/protscale/
    Grape Genome Database (CRIBI)http://genomes.cribi.unipd.it/grape/
    PhenoGramhttp://visualization.ritchielab.psu.edu/phenograms/plot
    MCScanXhttp://chibba.pgml.uga.edu/mcscan2/
    Interactive Tree Of Life (iTOL)http://itol.embl.de/
    UniProthttp://www.uniprot.org/
    Phylogeny.frhttp://www.phylogeny.fr/index.cgi
    MUSCLEhttp://www.ebi.ac.uk/Tools/msa/muscle/
    Gblocks Serverhttp://molevol.cmima.csic.es/castresana/Gblocks_server.html
    Vitis vinifera cv. Corvina gene expression Atlas datamatrixhttps://www.researchgate.net/publication/273383414_54sample_
    datamatrix_geneIDs_Fasoli2012
    Multi Experiment Viewer (MeV)http://mev.tm4.org/#/welcome
    Sequence Read Archive (SRA)https://www.ncbi.nlm.nih.gov/sra
    Rhttps://www.r-project.org/
    EMBOSS Needle (EMBL-EBI)http://www.ebi.ac.uk/Tools/psa/emboss_needle/

    Referências

    1. Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449 (7161), 463-467 (2007).
    2. Adam-Blondon, A. -. F., et al. . Genetics, Genomics, and Breeding of Grapes. , 211-234 (2011).
    3. Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6 (5), 1388-1404 (2013).
    4. Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10 (6), 385-397 (2009).
    5. Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62 (4), 434-445 (2006).
    6. Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6 (8), e23934 (2011).
    7. Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7 (8), 1014-1021 (2012).
    8. Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
    9. Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3 (11), 827-837 (2002).
    10. Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92 (1), 155-161 (2013).
    11. Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31 (4), 852-861 (2013).
    12. Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24 (9), 3489-3505 (2012).
    13. . BLAST2.6.0 Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016)
    14. . Vitis vinifera cv. Corvina gene expression Atlas Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015)
    15. . Sequence Read Archive (SRA) Available from: https://www.ncbi.nlm.nih.gov/sra (2017)
    16. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
    17. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9 (4), 357-359 (2012).
    18. Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31 (2), 166-169 (2015).
    19. . Version 3.4.1 Available from: https://www.r-project.org/ (2017)
    20. Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47 (2015).
    21. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
    22. Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
    23. Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14 (1), 99 (2014).
    24. Overbeek, R., Fonstein, M., D'Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96 (6), 2896-2901 (1999).
    25. Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5 (10), 1800-1806 (2013).
    26. Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314 (5), 1041-1052 (2001).
    27. Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33 (8), (2017).
    28. Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
    29. Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15 (9), 1292-1297 (2005).
    30. Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20 (1), 45-58 (2010).
    31. Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22 (12), 3142-3152 (2003).
    32. Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24 (3), 311-326 (2017).
    33. Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).

    Reimpressões e Permissões

    Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE

    Solicitar Permissão

    Explore Mais Artigos

    Gen ticaedi o 130ATL E3 ubiquitina ligase dofam lia do genegenoma largonomenclaturafilogeniaexpress o meta an liseduplica o de genesvideira

    This article has been published

    Video Coming Soon

    JoVE Logo

    Privacidade

    Termos de uso

    Políticas

    Pesquisa

    Educação

    SOBRE A JoVE

    Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados