Method Article
Apresentamos um sítio web público computacional para análise de seqüências genômicas. Ele detecta padrões de seqüência de DNA com vários não-aleatória composições de nucleotídeos. Este recurso também gera sequências ao acaso, com diversos níveis de complexidade.
Regiões não codificantes do genoma em eucariotos complexos, incluindo áreas intergênica, introns e exons segmentos não traduzida, são profundamente não-aleatórios em sua composição de nucleotídeos e consistem em um complexo mosaico de padrões de seqüência. Estes padrões incluem a chamada Faixa de Mid-homogeneidade (MRI) regiões - seqüências de 3-10 nucleotídeos de comprimento, que são enriquecidas por uma base ou combinação de bases (por exemplo, (G + T)-ricos, ricos em purinas, etc ). MRI regiões estão associadas com estruturas de DNA incomum (não-forma B) que muitas vezes são envolvidos na regulação da expressão gênica, recombinação, e outros processos genéticos (Fedorova & Fedorov 2010). A existência de um viés de fixação forte dentro das regiões de ressonância magnética contra mutações que tendem a reduzir sua heterogeneidade seqüência adicionalmente suporta a funcionalidade e importância dessas sequências genômicas (Prakash et al. 2009).
Aqui demonstramos um recurso Internet disponível gratuitamente - o pacote de programas Genomic MRI - (. Bechtel et al 2008) concebidos para a análise computacional de seqüências genômicas, a fim de encontrar e caracterizar vários padrões de ressonância magnética dentro deles. Este pacote também permite a geração de sequências ao acaso, com várias propriedades e nível de correspondência para as seqüências de DNA natural de entrada. O objetivo principal deste recurso é facilitar o exame das vastas regiões de DNA não-codificante que ainda são pouco investigados e aguardam exploração completa e reconhecimento.
Todos os programas usados no papel ter sido escrito usando perl, e todas as páginas web foram criados usando PHP.
1. Ponto de partida:
Abra a home page do pacote de Genomic on-line por ressonância magnética no http://mco321125.meduohio.edu/ ~ jbechtel / gmri /. O recurso da Web também oferece instruções / explicações sobre os programas do "Ajuda (How-to/README)" link, enquanto todos os materiais publicados no Genomic algoritmos de ressonância magnética e similares são listadas na seção "Links para recursos relevantes" link.
2. Preparação e Upload de seqüência de entrada (s).
Crie um arquivo com FASTA-formatado seqüência (s) para iniciar uma sessão de análise GMRI. Cada seqüência de nucleotídeos neste formato deve ser precedido com uma única linha de partida com o caracter ">" que representa um identificador, seguido na mesma linha por uma breve descrição dessa seqüência. Seqüências de nucleotídeos para análise GMRI também permite que personagens como R, Y, N, X, etc Hwever, não-A, T, C, G caracteres não serão processados pelo programa e será ignorado. Seqüências em que os elementos repetitivos têm sido "mascarados" (substituído por "N" s) pode ser usado como entrada. Observe que os caracteres seqüência são case insensitive.
NOTA: A partir de agora as seqüências de entrada são referidos como "userfile".
3. Obter uma distribuição de freqüência de Oligonucleotídeos das Seqüências de Entrada (opcional).
Clique no botão "Analyzer SRI" tab (linha superior), a fim de obter uma distribuição de freqüências de oligonucleotídeos para todo o conjunto de seqüências de entrada. A sigla SRI representa curto alcance não homogeneidade. Nesta conjuntura, o usuário pode especificar o comprimento máximo de oligonucleotídeos (de 2 até 9 nucleotídeos, padrão 6 nts) para os quais frequências serão calculados. Esta seleção é feita clicando na opção desejada dentro do "Maximum oligômero tamanho" caixa de listagem. Em seguida, pressione o botão "Analyze File" botão para iniciar a computação. Uma representação aproximada da composição seqüência de entrada será imediatamente aparecem como uma pequena tabela no meio desta página web e para download como "userfile.comp.tbl". Esta tabela representa apenas os oligonucleotides mais e menos abundantes no seqüências de entrada.
A tabela de freqüência inteira para todos oligonucleotides possível é gerado como um arquivo chamado "userfile.comp", que pode ser obtido através do "Download composição arquivo" link.
NOTA: SRI analisador conta todo o conjunto de todos os oligonucleotides sobrepostas.
4. Gerar seqüências aleatórias com a mesma composição de Oligonucleotídeos Como no seqüências de entrada (opcional).
(Conclusão da etapa 3 do protocolo é necessário para esta tarefa).
5. Análise do Médio heterogeneidade (MRI) de entrada e seqüências aleatórias.
6. Programas adicionais dentro do pacote Genomic MRI (opcional).
O recurso Genomic RM também tem duas opções avançadas para a geração de muito específico seqüências aleatórias. Eles estão disponíveis através do "Gerador de ressonância magnética" e "Generator CDS" tabs na linha superior.
7. Resultados representante
Este protocolo permite que um usuário para estudar falta de homogeneidade de composição de seqüências de nucleotídeos. Importante, ele também suporta a geração de uma variedade de sequências ao acaso, com uma composição de oligonucleotídeos que se aproxima daquela das seqüências de entrada. Geralmente, as seqüências genômicas dos eucariotos complexos não são homogêneos em composição, mas representam um complexo mosaico de segmentos seqüência enriquecida por nucleotídeos particular (por exemplo, rica em purinas, (G + T)-ricos, (A + T), rico em etc.) Estes padrões de mid-range escala (3-10 pb) são visualizados através da saída gráfica do analisador de ressonância magnética que mostra selecionados conteúdo rico segmentos como superior picos de azul e de conteúdo pobre em segmentos como menores picos de vermelho (ver figuras 1 e 2). Normalmente, o número de todas as regiões ricas em conteúdo e conteúdo dos pobres em uma seqüência natural (Figura 1) é da ordem de vezes maior do que o número dos mesmos tipos de regiões em seqüências correspondentes ao acaso (Figura 2) com o oligonucleotídeo mesmo composição. Estes segmentos seqüência com mid-range heterogeneidade na composição de nucleotídeos podem ser de interesse para o usuário. Eles estão disponíveis a partir da Genomic arquivos de saída de ressonância magnética para investigação adicional.
Figura 1. Um exemplo da saída analisador MRI gráfica a partir do passo 5.7. Os resultados foram obtidos em uma amostra de 44 introns humana. Barras azuis representam as posições de regiões ricas em GC ao longo destes íntrons. Barras vermelhas representam GC-pobre (ou AT-ricos) MRI regiões. O eixo y contém limiares superior e inferior para o tipo de conteúdo.
Figura 2. Analisador de saída MRI para a seqüência aleatória "userfile.rand1_4".
O graphical representação de ressonância magnética dentro de uma seqüência aleatória gerada utilizando o programa gerador de SRI.
Figura 3. Um exemplo do início de um arquivo de saída textual de analisador de ressonância magnética.
Todas as seqüências de conteúdo rico e pobre de conteúdo detectado pelo programa são apresentados na coluna (quarto) passado. Suas posições relativas, medido em número de janelas, são mostrados na primeira coluna. A segunda e terceira colunas são indicadores para as regiões ricas em conteúdo e conteúdo-pobres, respectivamente.
Regiões com a composição de nucleotídeos não homogênea na mid-range escalas (3-10 nucleotídeos) são superabundantes nos genomas de eucariotos complexos e podem ser encontrados em qualquer lugar (regiões intergênicas, íntrons, as regiões não traduzidas dos exons, elementos repetitivos). Estas regiões são freqüentemente associados com conformações DNA incomum. Por exemplo, sequências purine-/pyrimidine-rich tendem a formar triplexes DNA (H-DNA); seqüências com a alternância de purina / pirimidina bases estão associados com Z-DNA conformações; (G + C) regiões ricas apresentam anormalidades estruturais no B- DNA e pode ser propenso a clivagem backbone; (A + T) regiões ricas podem formar uma estrutura incomum - um elemento DNA descontrair, etc (revisado por Fedorov & Fedorova 2010). Alguns desses padrões de gama média (por exemplo, (G + T) regiões ricas) são mal investigados e ainda aguardam exploração completa e reconhecimento. O objetivo principal do nosso recurso web Genomic MRI é ajudar os usuários na identificação destas regiões RM para sua posterior análise experimental e para a exploração de suas possíveis funções. Conhecimento das regiões de ressonância magnética poderia ser incorporada e melhorar a nova geração de programas preditor gene (Shepard 2010) e avançar a nossa compreensão das funções do genoma e propriedades.
Somos gratos a Samuel Shepard, Bazeley Peter, David e John Bell para a administração da Genomic páginas web de ressonância magnética. Este trabalho foi financiado pela National Science Foundation Carreira prémio "Investigação de papéis intron celular" [número de concessão MCB-0643542].
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados