OpenProt é o primeiro banco de dados que permite uma anotação polisstanônica de genomas eucarióticos, reconhece o potencial de codificação de proto-genes e permite a descoberta de proteínas anteriormente indetectáveis. Projetamos este protocolo para que ele seja acessível a todos os usuários sem exigir extensas habilidades bioinformáticas Ele essencialmente coloca descobertas proteômicas ao alcance de qualquer pessoa. Para compreender e enfrentar os desafios atuais na medicina, precisamos compreender completamente a paisagem proteômica e todos os atores e suas dinâmicas.
O OpenProt fornece essa possibilidade. Embora aqui, o OpenProt seja usado para a análise de experimentos patonômicos, ele também pode ser usado com outros sistemas, pois simplesmente fornece uma definição mais clara do proteome. Comece abrindo o site do OpenProt e usando o link do menu de primeira página para abrir a página de downloads.
Clique na espécie de interesse com base nos dados experimentais das análises e no tipo de proteína desejada. Clique em AllProts, Isoforms e RefProds para gerar arquivos contendo todos os tipos de proteínas conhecidos e novos presentes no banco de dados OpenProt e, se disponível, clique na anotação da qual as sequências proteicas são desenhadas. Clique no nível de evidência de apoio necessária para a consideração da proteína de acordo com o objetivo da pesquisa.
Em seguida, clique, tudo previsto para gerar arquivos contendo todas as previsões do OpenProt e clique no formato de arquivo desejado para baixar. Para anásis proteômicas, selecione o arquivo de proteína FASTA. O arquivo readme conterá todas as informações necessárias sobre o formato do arquivo.
Para o manuseio do banco de dados, entre em uma instância de ferramenta proteômica apropriada e crie um novo histórico. Para importar o banco de dados OpenProt baixado, clique em Upload. Para inserir o fluxo de trabalho de manuseio do banco de dados, vá para a página de fluxo de trabalho, clique em carregar novamente e clique em executar o fluxo de trabalho.
Em seguida, selecione o banco de dados OpenProt importado como entrada e renomeie o arquivo Fasta obtido para algo significativo. O banco de dados está pronto para ser usado para análises de proteômica. Para a preparação do arquivo de espectrometria em massa, abra a ferramenta de conversão MS disponível livremente a partir do conjunto de assistentes proteo e carregue o arquivo de dados a ser analisado.
Selecione o diretório para a saída e defina o formato de arquivo desejado para mzML e use o algoritmo baseado em wavelet nos níveis de espectrometria de massa um e dois para selecionar um filtro de captação de pico e iniciar a conversão. Para quantificação de proteínas, crie uma nova história e arraste e largue o banco de dados criado anteriormente para a nova história. Clique em Carregar para importar o arquivo de dados mzML transformado.
Abra a página do fluxo de trabalho, clique em carregar novamente para importar o fluxo de trabalho desejado e selecione executar o fluxo de trabalho para revisar os diferentes parâmetros. Selecione o arquivo de dados mzML importado e insira o banco de dados criado anteriormente como o arquivo Fasta do banco de dados. Já que o fluxo de trabalho usa o X!
Tandem motor de busca, clique em Carregar para importar o X! Arquivo de configuração padrão tandem. Para explicar o aumento substancial do tamanho ao usar todo o databse OpenProt use uma rigorosa taxa de detecção falsa.
Para controle de qualidade, execute a ferramenta de informações de arquivo na saída do filtro de identificação para fornecer métricas comuns de desempenho, como o número de correspondências de espectro de peptídeos ou o número de peptídeos e proteínas identificados. Para mineração de banco de dados OpenProt, retorne ao site do OpenProt e abra a página de pesquisa. Clique na espécie de interesse para a qual a proteína foi identificada e digite o número de adesão proteica na caixa de consulta de proteínas.
Clique em surge e uma tabela contendo informações básicas para a proteína consultada aparecerá. Em seguida, clique no link de detalhes. A página recém-aberta conterá um navegador de genoma centrado na proteína consultada, bem como outras informações.
Para obter sequências de proteína ou DNA, clique nos links de proteína ou DNA das guias de informação, respectivamente, clique nas guias para navegar nas informações detalhadas sobre a evidência de espectrometria de massa, a detecção de perfil ribossomo e a conservação e os domínios proteicos identificados. Nesta anlise representativa, a maioria das proteínas identificadas no artigo original também foram identificadas utilizando-se o 2_pep OpenProt ou o banco de dados OpenProt_all, mostrando que os bancos de dados OpenProt são capazes de produzir identificação e quantificação de proteínas comparáveis aos procedimentos atuais baseados nos bancos de dados InterPro KB. 11 proteínas bem suportadas ainda não anotadas em bancos de dados foram identificadas em todos os conjuntos de dados com peptídeos confiantes usando o banco de dados 2_pep OpenProt.
29 novas proteínas foram descobertas em todos os conjuntos de dados com peptídeos confiantes usando o banco de dados OpenProt_all. A taxa de descoberta falsa recomendada não afetou as identificações de proteínas mais confiantes, embora tenha diminuido o número total de proteínas identificadas. Uma nova proteína foi descoberta como uma interajante da proteína Raf-1.
Estas proteínas não haviam sido detectadas anteriormente por espectrometria de massa ou perfil ribossomo e demonstrado um espectro de boa qualidade. Lembre-se de garantir que os parâmetros selecionados sejam adequados ao design experimental e sempre verifique a qualidade das evidências esportivas ao relatar novas descobertas proteicas. Este protocolo é adaptável a todos os experimentos de proteômica de cima para baixo, notadamente quando usado com proteômica funcional.
Isso permitirá uma triagem e compreensão muito profundas das interações proteicas e das vias celulares. OpenProt destaca a subestimação substancial da paisagem protómica retransmitida pelas notações genômicas atuais e enfatiza a natureza polissintestrônica dos genes eucarióticos. É um novo caminho para a pesquisa.
A beleza deste protocolo é que ele não requer extensas habilidades bioinformáticas e que, uma vez que usa servidores distantes, ele pode ser executado em qualquer computador.