NOTA: Neste protocolo, o uso do JUMPn é ilustrado utilizando um conjunto de dados publicado de perfil proteome inteiro durante a diferenciação de células B quantificada pelo reagente de etiqueta isobáica TMT27.
1. Configuração do software JUMPn
NOTA: Duas opções são fornecidas para configurar o software JUMPn: (i) instalação em um computador local para uso pessoal; e (ii) implantação de JUMPn em um servidor brilhante remoto para vários usuários. Para instalação local, um computador pessoal com acesso à Internet e ≥4 Gb de RAM é suficiente para executar a análise JUMPn para um conjunto de dados com um pequeno tamanho de amostra (n < 30); RAM maior (por exemplo, 16 Gb) é necessário para análise de coorte de grande porte (por exemplo, n = 200 amostras).
- Instale o software em um computador local. Após a instalação, permita que o navegador da Web inicie o JUMPn e deixe a análise ser executada no computador local.
- Instale anaconda42 ou miniconda43 seguindo as instruções on-line.
- Baixe o código-fonte JUMPn41. Clique duas vezes para descompactar o arquivo baixado JUMPn_v_1.0.0.zip; uma nova pasta chamada JUMPn_v_1.0.0 será criada.
- Terminal da linha de comando aberto. No Windows, use o Anaconda Prompt. No MacOS, use o aplicativo Terminal integrado.
- Crie o ambiente JUMPn Conda: Obtenha o caminho absoluto da pasta JUMPn_v_1.0.0 (por exemplo, /path/to/JUMPn_v_1.0.0). Para criar e ativar um ambiente Conda vazio digite os seguintes comandos no terminal
conda criar -p /path/to/JUMPn_v_1.0.0/JUMPn -y
conda ativar /path/to/JUMPn_v_1.0.0/JUMPn
- Instale as dependências do JUMPn: Instale R (no terminal, tipo conda-forge r=4.0.0 -y), altere o diretório atual para a pasta JUMPn_v_1.0.0 (no terminal, digite o caminho do CD/to/JUMPn_v_1.0.0) e instale os pacotes de dependência (no terminal, tipo Rscript bootstrap. R)
- Inicie o JUMPn no navegador da Web: Altere o diretório atual para a pasta de execução (no terminal, digite execução de CD) e inicie o JUMPn (no terminal, tipo R -e "brilhante::runApp()")
- Uma vez executado o acima, a tela do terminal aparecerá Ouvindo em http://127.0.0.1:XXXX (aqui XXXX indica 4 números aleatórios). Copie e cole http://127.0.0.1:XXXX no navegador da Web, no qual a página de boas-vindas da JUMPn aparecerá (Figura 2).
- Implantação no Servidor Brilhante. Exemplos de Servidor Brilhante incluem o servidor de shinyapps.io comercial ou quaisquer servidores brilhantes suportados institucionalmente.
- Baixe e instale o RStudio seguindo a instrução44.
- Obtenha a permissão de implantação para o Servidor Brilhante. Para o servidor shinyapps.io, configure a conta do usuário seguindo a instrução45. Para o servidor Brilhante institucional, entre em contato com o administrador do servidor para solicitar permissões.
- Baixe o código-fonte JUMPn41 para a máquina local; a instalação não é necessária. Abra ou o servidor. R ou ui. Arquivos R no RStudio e clique no menu suspenso publicar para servidor no canto superior direito do IDE RStudio.
- No painel Publicar para Conta , digite o endereço do servidor. Pressione o botão Publicar . A implantação bem-sucedida é validada mediante redirecionamento automático do RStudio para o servidor RShiny, onde o aplicativo foi implantado.
2. Demo executado usando um conjunto de dados de exemplo
NOTA: A JUMPn oferece uma demonstração usando o conjunto de dados de proteômica de células B publicado. A execução de demonstração ilustra um fluxo de trabalho simplificado que toma a matriz de quantificação de proteínas expressas diferencialmente como entrada e realiza agrupamento de co-expressão, enriquecimento de caminhos e análise de rede PPI sequencialmente.
- Na página inicial do JUMPn (Figura 2), clique no botão Iniciar análise para iniciar a análise do JUMPn.
- No canto inferior esquerdo da página Análise de Início (Figura 3), clique no botão Upload Demo B Cell Proteomic Data ; uma caixa de diálogo aparecerá notificando o sucesso do upload de dados.
- No canto inferior direito da página, clique no botão Enviar análise JUMPn para iniciar a execução de demonstração usando parâmetros padrão; uma barra de progresso aparecerá que denota o curso da análise. Aguarde até que a barra de progresso seja cumprida (3 min esperados).
- Uma vez terminado a execução da demonstração, uma caixa de diálogo aparecerá com a mensagem de execução de sucesso e o caminho absoluto para a pasta de resultado. Clique em Continuar para resultados para continuar.
- A página da Web guiará primeiro o usuário para os resultados do cluster de co-expressão pelo WGCNA. Clique em Exibir resultados na janela de diálogo para continuar.
- Encontre os padrões de co-expressão de proteínas à esquerda da página de resultado 1: WGCNA Output . Clique na caixa de seleção do formato de expressão para navegar entre dois formatos de figura:
- Selecione Tendências para exibir o enredo de tendências, com cada linha representando abundância de proteínas individuais entre as amostras. A cor de cada linha representa o quão próximo o padrão de expressão está do consenso do cluster de co-expressão (ou seja, "eigengene" definido pelo algoritmo WGCNA).
- Selecione Boxplot para exibir padrões de co-expressão em formato boxplot para cada amostra.
- Veja o mapa de calor do enriquecimento de caminhos/ontologia à direita da página de saída WGCNA. As vias mais enriquecidas para cada cluster são exibidas juntas em um mapa de calor, com a intensidade da cor refletindo o valor p ajustado de Benjamini-Hochberg.
- Role para baixo na página da Web para visualizar o padrão de expressão de proteínas individuais.
- Use a caixa de retirada Selecione o cluster de co-expressão para visualizar proteínas de cada cluster (padrão é Cluster 1). Selecione uma proteína específica na tabela, sobre a qual o gráfico da barra abaixo da tabela será atualizado automaticamente para refletir sua abundância proteica.
- Pesquise nomes de proteínas específicos usando a caixa de pesquisa no lado direito da tabela para obter uma proteína específica.
- Para ver os resultados do PPI, clique na Página de Resultados 2: Saída do PPI na parte superior.
- Clique em Selecionar o cluster de co-expressão para exibir os resultados de um cluster específico de co-expressão (o padrão é o cluster 1). As exibições de todos os painéis de figuras nesta página serão atualizadas para o cluster recém-selecionado.
- Veja as redes PPI para o cluster de co-expressão selecionado no painel de figuras esquerdas:
- Clique na caixa de subsistência Select by Group para destacar módulos PPI individuais dentro da rede. Clique na caixa de seleção de formato de rede para alterar o layout da rede (o padrão é de Fruchterman Reingold).
- Use o mouse e o trackpad para executar as etapas 2.11.3-2.11.5.
- Amplie ou amplie a rede PPI conforme necessário. Os nomes genéticos de cada nó na rede serão mostrados quando ampliados o suficiente.
- Quando ampliado, selecione e clique em uma determinada proteína para destacar essa proteína e seus vizinhos de rede.
- Arraste um certo nó (proteína) na rede para alterar sua posição no layout; assim, o layout da rede pode ser reorganizado pelo usuário.
- No painel direito da página de resultado do PPI, visualize as informações de nível de cluster de co-expressão que auxiliam na interpretação dos resultados do PPI:
- Exibir o padrão de co-expressão do cluster selecionado como boxplot por padrão.
- Clique na caixa de entrega do Formato de Expressão para obter mais informações ou exibições conforme mencionado nas etapas 2.12.3-2.12.5.
- Selecione Tendências para mostrar o gráfico de tendências para o padrão de co-expressão.
- Selecione Pathway Barplot para mostrar caminhos significativamente enriquecidos para o cluster de co-expressão.
- Selecione Pathway Circle Plot para mostrar caminhos significativamente enriquecidos para o cluster de co-expressão no formato de plot do círculo.
- Role para baixo a página de resultado 2: PPI Output webpage para exibir resultados no nível do módulo PPI individual. Clique na caixa de entrada do módulo 'Selecionar' , para selecionar um módulo PPI específico para exibição (Cluster1: O Módulo 1 é mostrado por padrão).
- Veja o módulo PPI no painel esquerdo. Para manipular o visor de rede, siga os passos 2.11.2-2.11.5.
- Veja os resultados de enriquecimento de caminhos/ontologia no painel direito. Clique na caixa de entrega do Estilo de Anotação do Caminho para obter mais informações e exibir:
- Selecione Barplot para mostrar caminhos significativamente enriquecidos para o módulo PPI selecionado.
- Selecione Circle Plot para mostrar caminhos significativamente enriquecidos para o módulo PPI selecionado no formato de um gráfico de círculo.
- Selecione o Heatmap para mostrar caminhos significativamente enriquecidos e os nomes de genes associados do módulo PPI selecionado.
- Selecione Tabela para mostrar os resultados detalhados de enriquecimento da via, incluindo o nome de termos de caminhos/ontologia, nomes de genes e o valor P pelo teste exato de Fisher.
- Veja a tabela de publicação em formato de planilha: siga o caminho absoluto (impresso na parte superior das duas páginas de resultados) e encontre a tabela de planilha de publicação chamada ComprehensiveSummaryTables.xlsx.
3. Preparação do arquivo de entrada e upload para JUMPn
NOTA: JUMPn toma como entrada a matriz de quantificação das proteínas expressas diferencialmente (método supervisionado) ou das proteínas mais variáveis (método não supervisionado). Se o objetivo do projeto é entender as proteínas alteradas em múltiplas condições (por exemplo, diferentes grupos de doenças ou análise em série temporal do processo biológico), é preferido o método supervisionado de realização da análise DE; caso contrário, uma abordagem não supervisionada de selecionar as proteínas mais variáveis pode ser usada para fins exploratórios.
- Gerar a tabela de quantificação de proteínas, com cada proteína como linhas e cada amostra como colunas. Consiga isso através do moderno pacote de software de software proteômico baseado em espectrometria de massa moderno (por exemplo, suíte JUMP 13,14,39, Proteome Discoverer, Maxquant 15,46).
- Defina o proteome variável.
- Utilize os resultados da análise estatística fornecidos pelo conjunto de software de proteômica para definir proteínas de DE expressos diferencialmente (por exemplo, com valor p ajustado < 0,05).
- Alternativamente, os usuários podem seguir o exemplo R code47 para definir tanto DE quanto a maioria das proteínas variáveis.
- Formate o arquivo de entrada usando o proteome variável definido.
NOTA: O formato de arquivo de entrada necessário (Figura 4) inclui uma linha de cabeçalho; as colunas incluem adesão de proteínas (ou quaisquer IDs exclusivos), GN (símbolos genéticos oficiais), descrição da proteína (ou qualquer informação fornecida pelo usuário), seguida pela quantificação proteica de amostras individuais.
- Siga a ordem das colunas especificadas na etapa 3.1, mas os nomes das colunas do cabeçalho são flexíveis para o usuário.
- Para mMT (ou similar) proteome quantificado, use a intensidade resumida do repórter TMT como valores de quantificação de entrada. Para dados sem rótulos, use contagens espectrais normalizadas (por exemplo, NSAF48) ou método baseado em intensidade (por exemplo, intensidade de LFQ ou intensidade de proteína iBAQ relatada por Maxquant46).
- Valores perdidos são permitidos para análise de JUMPn. Certifique-se de rotulá-los como NA na matriz de quantificação. No entanto, recomenda-se usar apenas proteínas com quantificação em mais de 50% das amostras.
- Salve o arquivo de entrada resultante como .txt, .xlsx ou .csv formato (todos os três são suportados pela JUMPn).
- Upload de arquivo de entrada:
- Clique no botão Navegador e selecione o arquivo de entrada (Figura 3, painel esquerdo); o formato do arquivo (xlsx, csv e txt são suportados) será detectado automaticamente.
- Se o arquivo de entrada contiver valores de quantificação semelhantes à intensidade (por exemplo, aqueles gerados pelo conjunto JUMP39) ou proporções (por exemplo, do Proteome Discoverer), selecione Sim para a Opção executar Log2-Transformation of Data Option; caso contrário, os dados podem já ter sido transformados em log, então selecione Não para esta opção.
4. Análise de agrupamento de co-expressão
NOTA: Nosso grupo 25,26,27 e outros 28,29,31 provaram o WGCNA49 um método eficaz para a análise de agrupamento de co-expressão de proteômica quantitativa. A JUMPn segue um procedimento de 3 etapas para a análise do WGCNA25,50: (i) definição inicial de aglomerados genéticos/proteicos de co-expressão por corte dinâmico de árvores51 com base na matriz de sobreposição topológica (TOM; determinada por semelhanças de quantificação entre genes/proteínas); (ii) fusão de clusters semelhantes para reduzir a redundância (com base no dendrograma das similaridades do eigengene); e (iii) atribuição final de genes/proteínas a cada aglomerado que exceda o corte mínimo de correlação de Pearson.
- Configure os parâmetros WGCNA (Figura 3, painel médio). Os três parâmetros a seguir controlam as três etapas, respectivamente:
- Defina o tamanho mínimo do cluster como 30. Este parâmetro define o número mínimo de proteínas necessárias para cada aglomerado de co-expressão na etapa inicial (i) do corte dinâmico híbrido baseado em TOM. Quanto maior o valor, menor o número de clusters devolvidos pelo algoritmo.
- Definir a distância mínima do cluster como 0,2. O aumento desse valor (por exemplo, de 0,2 para 0,3) pode causar mais fusão de clusters durante a etapa (ii), resultando em um número menor de clusters.
- Definir kME mínimo como 0,7. As proteínas serão atribuídas ao cluster mais correlacionado definido na etapa (ii), mas apenas proteínas com correlação de Pearson passando por esse limiar serão mantidas. As proteínas que falharem nesta etapa não serão atribuídas a nenhum cluster (cluster'NA' para as proteínas falhadas no relatório final).
- Inicie a análise. Existem duas maneiras de submeter a análise de agrupamento de co-expressão:
- Clique no botão Enviar análise JUMPn no canto inferior direito para iniciar a análise abrangente do WGCNA automaticamente seguido pela análise de rede PPI.
- Alternativamente, selecione executar apenas a etapa WGCNA (especialmente para fins de ajuste de parâmetros; veja as etapas 4.2.3-4.2.4):
- Clique no botão Parâmetros Avançados na parte inferior da página Análise de Início ; uma nova janela de parâmetros aparecerá. No widget inferior, selecione Modo de Análise, selecione WGCNA Somente e clique em Descartar para continuar.
- Na página Análise de Início , clique no botão Enviar análise JUMPn .
- Em ambos os casos acima, uma barra de progresso aparecerá após a submissão da análise.
NOTA: Uma vez concluída a análise (tipicamente < 1 min para análise apenas do WGCNA e <3 min para análise abrangente), uma caixa de diálogo aparecerá com uma mensagem de execução de sucesso e o caminho absoluto para a pasta de resultado.
- Examine os resultados do WGCNA conforme ilustrado nas etapas 2.4-2.8 (Figura 5). Observe que o caminho absoluto para o arquivo co_exp_clusters_3colums.txt é destacado no topo da Página de Resultados: WGCNA Output para registrar a adesão de cluster de cada proteína e usá-la como entrada para a análise apenas do PPI .
- Solucionando problemas. São discutidos os três casos comuns a seguir. Uma vez atualizados os parâmetros conforme discutido abaixo, siga as etapas 4.2.2-4.2.4 para gerar novos resultados do WGCNA.
- Se um importante padrão de co-expressão é esperado a partir dos dados, mas perdido pelo algoritmo, siga os passos 4.4.2-4.4.4.4
- Um aglomerado ausente é especialmente provável para pequenos clusters de co-expressão, ou seja, apenas um número limitado (por exemplo, <30) de proteínas que exibem esse padrão. Antes da re-análise, reexamine o arquivo de entrada da matriz de quantificação proteica e localize várias proteínas de controle positivas que aderem a esse importante padrão de co-expressão.
- Para resgatar os pequenos clusters, diminua o Tamanho do Cluster Mínimo (por exemplo, 10; tamanho de cluster inferior a 10 não pode ser robusto, portanto, não recomendado), e diminua a Distância Mínima de Cluster (por exemplo, 0,1; aqui também é permitido a configuração como 0, o que significa que a fusão automática de clusters será ignorada).
- Depois de executar a etapa de agrupamento de co-expressão com os parâmetros atualizados, primeiro, verifique se o cluster é resgatado das Parcelas de Padrão de Co-Expressão e, em seguida, verifique os controles positivos pesquisando suas adesões proteicas a partir de Quantificação de Proteína detalhada (certifique-se de selecionar o cluster de co-expressão apropriado do widget de esquerda antes da pesquisa).
NOTA: Podem ser necessárias várias iterações de ajuste de parâmetros e reprises para o resgate.
- Se houver muitas proteínas que não podem ser atribuídas a qualquer aglomerado, siga as etapas 4.4.6-4.4.7.
NOTA: Normalmente, uma pequena porcentagem (tipicamente <10%) das proteínas pode não ser atribuída a qualquer aglomerado, pois essas podem ser proteínas mais estranhas que não seguiram nenhum dos padrões comuns de expressão do conjunto de dados. No entanto, se esse percentual é significativo (por exemplo, >30%), sugere que existem padrões adicionais de co-expressão que não podem ser ignorados.
- Diminua tanto os parâmetros de distância do cluster mínimo quanto os de distância mínima do cluster para aliviar essa situação, detectando "novos" clusters de co-expressão.
- Além disso, diminua o parâmetro Minimal Pearson Correlation (kME) para encolher essas proteínas 'na cluster'.
NOTA: A sintonia deste parâmetro não gerará novos clusters, mas aumentará o tamanho dos clusters 'existentes', aceitando proteínas com falha mais prévia com o limiar inferior; no entanto, isso também aumentará a heterogeneidade de cada aglomerado, uma vez que proteínas mais ruidosas são agora permitidas.
- Dois clusters têm uma diferença muito pequena de padrões; mesclá-los em um cluster seguindo as etapas 4.4.9-4.4.11.
- Aumente o parâmetro Distância do Cluster Mínimo para resolver o problema.
- No entanto, em algumas situações, o algoritmo pode nunca retornar o padrão desejado; em tal instante, ajuste manualmente ou edite a adesão ao cluster no arquivo co_exp_clusters_3colums.txt (arquivo da etapa 4.3) para mesclar.
- Tome o arquivo pós-editado como entrada para a análise de rede PPI a jusante. Em caso de edição manual, justifique os critérios de atribuição do cluster e regise o procedimento de edição manual.
5. Análise da rede de interação proteína-proteína
NOTA: Ao sobrepor clusters de co-expressão na rede PPI, cada cluster de co-expressão é ainda mais estratificado em módulos PPI menores. A análise é realizada para cada cluster de co-expressão e inclui dois estágios: no primeiro estágio, o JUMPn sobrepõe proteínas do cluster de co-expressão para a rede PPI e encontra todos os componentes conectados (ou seja, múltiplos clusters de nós/proteínas conectados; como exemplo, ver Figura 6A); em seguida, comunidades ou módulos (de nódulos densamente conectados) serão detectados para cada componente conectado iterativamente usando o método52 da matriz de sobreposição topológica (TOM).
- Configure parâmetros para análise de rede PPI (Figura 3, painel direito).
- Ajuste o tamanho do módulo PPI mínimo como 2. Este parâmetro define o tamanho mínimo dos componentes desconectados da análise do primeiro estágio. Qualquer componente menor do que o parâmetro especificado será removido dos resultados finais.
- Defina o tamanho do módulo Maximal PPI como 40. Componentes grandes e desconectados que passam por esse limiar passarão por uma análise baseada em TOM de segundo estágio. A análise do segundo estágio dividirá ainda mais cada componente grande em módulos menores: cada módulo presumivelmente contém proteínas mais densamente conectadas do que o componente original como um todo.
- Inicie a análise. Existem duas maneiras de enviar a análise da rede PPI:
- Aperte o botão Enviar análise JUMPn para executar automaticamente a análise do PPI após a análise do WGCNA por padrão.
- Alternativamente, carregue resultados personalizados do cluster de co-expressão e realize a análise apenas do PPI seguindo as etapas 5.2.3-5.2.5.
- Prepare o arquivo de entrada seguindo o formato do arquivo co_exp_clusters_3colums.txt (ver subseção 4.4).
- Clique no botão Parâmetros Avançados na parte inferior da página Análise de Início ; uma nova janela de parâmetros aparecerá. Na sessão superior Upload Co-Expression Cluster Result for 'PPI Only' Analysis, clique em Navegador para carregar o arquivo de entrada preparado pela etapa 5.2.3.
- No widget inferior, selecione o modo de análise, selecione apenas PPI e clique em Descartar para continuar. Na página Análise de Início , clique no botão Enviar análise JUMPn .
- Uma vez concluída a análise (tipicamente <3 min), examine os resultados do PPI como ilustrados nas etapas 2.10-2.15 (Figura 6).
- Etapa avançada opcional) Ajuste a modularização do PPI por meio de parâmetros de ajuste:
- Aumente o parâmetro Maximal Module Size para permitir mais proteínas incluídas nos resultados do PPI. Carregue a rede PPI personalizada para cobrir interações não documentadas, seguindo as etapas 5.4.2-5.4.3.
- Clique no botão Parâmetros Avançados na parte inferior da página Análise de Início ; uma nova janela de parâmetros aparecerá. Prepare o arquivo PPI personalizado, que contém três colunas no formato de , onnection C e ; aqui são apresentados pelos nomes genéticos oficiais de cada proteína.
- No Upload de um banco de dados PPI, clique no botão Procurar para carregar o arquivo PPI personalizado.
6. Análise de enriquecimento de caminhos
NOTA: As estruturas hierárquicas derivadas do JUMPn de ambos os clusters de co-expressão e módulos PPI dentro são automaticamente anotadas com vias sobre-representadas usando o teste exato de Fisher. Os bancos de dados de pathway/topology usados incluem Gene Ontology (GO), KEGG, Hallmark e Reactome. Os usuários podem usar opções avançadas para carregar bancos de dados personalizados para a análise (por exemplo, no caso de analisar dados de espécies não humanas).
- Por padrão, a análise de enriquecimento de vias é iniciada automaticamente com agrupamento de co-expressão e análise de rede PPI.
- Veja os resultados do enriquecimento do caminho:
- Siga os passos 2.7, 2.12 e 2.15 para visualizar diferentes formatos nas páginas de resultado. Veja resultados detalhados na tabela de publicação de planilhas no arquivo ComprehensiveSummaryTables.xlsx (etapa 2.16).
- (Etapa avançada opcional) Carregar banco de dados personalizado para análise de enriquecimento de caminhos:
- Prepare o arquivo de fundo genético, que normalmente contém os nomes genéticos oficiais de todos os genes de uma espécie.
- Prepare o arquivo da biblioteca de ontologia seguindo as etapas 6.3.3-6.3.4.
- Baixe os arquivos da biblioteca de ontologia de sites públicos, incluindo EnrichR53 e MSigDB54. Por exemplo, baixe ontologia de Drosophila do site EnrichR55.
- Edite o arquivo baixado para o formato necessário com duas colunas: o nome da via como a primeira coluna e, em seguida, os símbolos genéticos oficiais (separados por "/") como a segunda coluna. O formato detalhado do arquivo é descrito na página Ajuda do software relizado JUMPn R.
NOTA: Encontre arquivos de exemplo de fundo genético e biblioteca de ontologia (usando Drosophila como exemplo) no site JUMPn GitHub56.
- Clique no botão Parâmetros Avançados na parte inferior da página Análise de Início; uma nova janela de parâmetros aparecerá.
- Encontre upload de um arquivo em segundo plano para o item Análise de Enriquecimento de Caminhos e clique no Navegador para carregar o arquivo em segundo plano preparado na etapa 6.3.1. Em seguida, na sessão, selecione o plano de fundo a ser usado para análise de enriquecimento de caminhos, clique em Fundo Fornecido pelo Usuário.
- Encontre upload de um arquivo da biblioteca de ontologia para o item Análise de Enriquecimento de Caminhos e clique no Navegador para carregar o arquivo da biblioteca de ontologia preparado nas etapas 6.3.2-6.3.4. Em seguida, na sessão, selecione bancos de dados para análise de enriquecimento de caminhos, clique em Banco de Dados Fornecido pelo Usuário em .xlsx Formato.
- Clique no botão Enviar análise JUMPn no canto inferior direito para iniciar a análise usando o banco de dados personalizado.
7. Análise do conjunto de dados com grande tamanho amostral
NOTA: JUMPn suporta análise de conjunto de dados com grande tamanho amostral (até 200 amostras testadas). Para facilitar a visualização de um grande tamanho de amostra, um arquivo adicional (chamado "meta file") que especifica o grupo de amostra é necessário para facilitar a exibição dos resultados de agrupamento de co-expressão.
- Prepare e carregue o meta- arquivo.
- Prepare o meta-arquivo que especifica informações de grupo (por exemplo, grupos de controle e doenças) para cada amostra seguindo as etapas 7.1.2-7.1.3.
- Certifique-se de que o arquivo meta contém pelo menos duas colunas: a coluna 1 deve conter os nomes da amostra idênticos aos nomes da coluna e a ordem do arquivo da matriz de quantificação de proteínas (conforme preparado na etapa 3.3); A coluna 2 em diante será usada para atribuição de grupo para qualquer número de recursos definidos pelo usuário. O número de colunas é flexível.
- Certifique-se de que a primeira linha do arquivo meta contenha os nomes das colunas para cada coluna; a partir da segunda linha em diante, devem ser listadas informações individuais de amostras de grupos ou outras características (por exemplo, sexo, idade, tratamento, etc.)
- Carregue o meta arquivo clicando no botão Parâmetros Avançados na parte inferior da página Análise de Início ; uma nova janela de parâmetros aparecerá. Prossiga para a etapa 7.1.5
- Encontre carregar um item meta arquivo e clique em Navegador para carregar o arquivo em segundo plano. Se o formato inesperado ou nomes de amostras incomparáveis forem detectados pelo JUMPn, uma mensagem de erro aparecerá para maior formatação do arquivo meta (etapas 7.1.1-7.1.3).
- Ajuste os parâmetros para análise de agrupamento de co-expressão: ajuste a correlação mínima de Pearson como 0,2. Este parâmetro precisa ser relaxado devido ao maior tamanho da amostra.
- Clique no botão Enviar análise JUMPn no canto inferior direito para enviar a análise.
- Ver os resultados da análise: toda a saída de dados é a mesma, exceto por exibir os padrões de cluster de co-expressão.
- Na página resultados página 1: WGCNA Output , visualize os clusters de co-expressão como boxplots com amostras estratificadas pelos grupos ou recursos amostrais definidos pelo usuário. Cada ponto na trama representa o eigengene (ou seja, o padrão de consenso do cluster) calculado pelo algoritmo WGCNA.
- Se o usuário forneceu vários recursos (por exemplo, idade, sexo, tratamento, etc.) para agrupar as amostras, clique na caixa de seleção do formato de expressão para selecionar outro recurso para agrupar as amostras.