Neste protocolo, apresentamos um fluxo de trabalho otimizado, que combina uma preparação eficiente e rápida de amostras de muitas amostras. Além disso, fornecemos um guia passo-a-passo para reduzir as variações analíticas para avaliação de alto rendimento de estudos metabólicos de GWAS.
Tanto a espectrometria de massa da cromatografia gasosa -masstrometria (GC-MS) quanto a espectrometria de massa cromatografia líquida (LC-MS) são abordagens metabolômicas amplamente utilizadas para detectar e quantificar centenas de milhares de características metabólicas. No entanto, a aplicação dessas técnicas a um grande número de amostras está sujeita a interações mais complexas, particularmente para estudos de associação genoma (GWAS). Este protocolo descreve um fluxo de trabalho metabólico otimizado, que combina uma preparação eficiente e rápida da amostra com a análise de um grande número de amostras para espécies de culturas de leguminosas. Este método de extração ligeiramente modificado foi inicialmente desenvolvido para a análise de tecidos vegetais e animais e é baseado na extração em éter de tert-butil metil: solvente de metanol para permitir a captura de metabólitos polares e lipídicos. Além disso, fornecemos um guia passo-a-passo para a redução das variações analíticas, essenciais para a avaliação de alto rendimento da variância metabólica no GWAS.
Abordagens "omics" em larga escala permitiram a análise de sistemas biológicos complexos 1,2,3 e maior compreensão da ligação entre genótipos e os fenótipos4 resultantes. Metabolômica usando espectrometria de massa líquida de alto desempenho (UHPLC-MS) e GC-MS permitiu a detecção de uma infinidade de características metabólicas, das quais apenas algumas estão anotadas em um certo grau, resultando em uma alta proporção de metabólitos desconhecidos. Interações complexas podem ser exploradas combinando metabolômicas em larga escala com a variação genotipica subjacente de uma população diversificada5. No entanto, o manuseio de grandes conjuntos amostrais está inerentemente associado a variações analíticas, distorcendo a avaliação da variância metabólica para outros processos a jusante. Especificamente, as principais questões que levam a variações analíticas são baseadas no desempenho da máquina e na deriva instrumental ao longo do tempo6. A integração da variação em lote a lote é desafiadora e especialmente problemática ao analisar populações estruturadas de plantas em larga escala. Foram sugeridos múltiplos procedimentos de normalização para corrigir para variações não biológicas, por exemplo, o uso de normas internas, externas e isótopos rotuladas para corrigir erros analíticos, dos quais cada um está inerentemente associado a problemas e armadilhas conhecidos 7,8,9,10.
Além da variação analítica, a escolha dos protocolos de extração geralmente varia dependendo do método analítico. Em última análise, deseja-se reduzir os custos materiais e trabalhistas, bem como a necessidade de utilizar várias alíquotas da mesma amostra para vários processos analíticos, realizando métodos de extração baseados em separação de fases. Estes métodos foram introduzidos pela primeira vez usando clorofórmio: solventes de metanol/água para fracionar compostos polares e hidrofóbicos11.
Este protocolo descreve um rápido pipeline de alto rendimento para uma plataforma multi-omics para traçar o perfil tanto metabólitos polares quanto lipídios em espécies de leguminosas. Além disso, mostra como esses conjuntos de dados podem ser adequadamente corrigidos para variação analítica e normalizados antes de integrar informações genotípicas para detectar loci de traço quantitativo metabólico (QTL) realizando GWAS.
1. Design experimental e cultivo de plantas
NOTA: Configurar o experimento dependendo da hipótese experimental, por exemplo, o uso de uma população gwas em larga escala diminui a necessidade de múltiplas réplicas, uma vez que os testes estatísticos serão realizados com base nos hapltipos de todos os SNPs individuais em vez da adesão. Em contraste, múltiplas réplicas são indispensáveis em outras abordagens experimentais. Os seguintes pontos devem ser considerados durante a preparação do experimento.
2. Preparação de material vegetal biológico
3. Reagentes de extração
4. Extração da amostra
5. Análise de lipídios utilizando UHPLC-MS
6. Análise de metabólitos polares e semipolares utilizando UHPLC-MS
7. Análise de Metabólitos derivatizados utilizando GC-MS17,18
NOTA: A análise dos metabólitos derivatizados baseia-se em um protocolo descrito anteriormente17. Manuseie todos os reagentes de derivatização no capô da fumaça. Certifique-se de que n-metil-N-(trimethylsilyl)trifluoracetamida (MSTFA) não entre em contato com água e umidade.
8. Processamento de cromatograma e anotação composta
9. Normalização do conjunto de dados metabolômicos em larga escala
10. Estudos de associação genoma (GWAS)32
11. Detecção de QTL
Os experimentos de metabolomia bem-sucedidas do GWAS devem começar com um design experimental adequado, seguido pela coleta de amostras, extração, aquisição de dados e processamento, conforme ilustrado na Figura 1. Neste protocolo, o método MTBE15 foi utilizado para extrair e analisar centenas de metabólitos pertencentes a diversas classes compostas. A cromatografia depende muito das propriedades da coluna utilizada, bem como das misturas de tampão de eluição. A Figura 2 mostra cromatógramas de amostras de QC, indicando o padrão de eluição de algumas classes lipídicas importantes neste sistema analítico. Os gradientes aplicados para cada plataforma são dados na Tabela 1. Foi dada forte ênfase no tratamento de erros sistêmicos em experimentos em larga escala. A realização de metabolômicas em larga escala está inerentemente associada a erros sistêmicos. Para demonstração, analisamos dados lipidómicos em várias espécies comuns de feijão. A Tabela Suplementar 1 fornece os dados lipidômicos brutos extraídos obtidos após o processamento do croromatograma utilizando o software indicado na Tabela de Materiais. Seguir este protocolo nos permitiu contornar grandes questões no tratamento de dados omics, especialmente durante o manuseio de grandes conjuntos de amostras. O procedimento de normalização rende na correção precisa dos erros analíticos em lote, conforme demonstrado na Figura 3. Embora o aumento do número de amostras de QC aumente o poder da normalização, isso nem sempre é viável devido às restrições de custo e tempo. Para a metabolômica de alta produtividade GWAS com características metabólicas não direcionadas, é essencial ilustrar um número maior de associação de marcadores de características adequadamente. Um mapa pleiotrópico38 combinando múltiplos resultados de GWAS poderia ser usado para destacar as regiões genômicas às quais vários traços estão ligados (Figura 4).
Figura 1: Fluxograma do GWAS baseado em metabolômica em plantas. Várias etapas que partem do projeto experimental até a detecção de QTL são mostradas no painel esquerdo. No painel direito, várias figuras são mostradas para suportar várias etapas mencionadas no painel esquerdo. A partir do topo direito, (1) uma sequência sugerida de amostras é mostrada para LC-MS, (2) parcelas de pontuação pré e pós-normalizadas de PCA, incluindo uma distribuição de recursos representativos pré e pós-processamento, com intensidades de amostra QC indicando vermelho e (3) um lote de Manhattan com associações significativas às quais foram geradas distribuições de LD e haplotipos. Abreviaturas: GWAS = estudos de associação genoma;; QTL = traço quantitativo loci; PCA = análise de componentes principais; QC = controle de qualidade; LD = desequilíbrio de ligação; MS = espectrometria de massa; LC-MS = espectrometria de massa cromatografia líquida; GC-MS = espectrometria de massa cromatografia gasosa; LOESS = alisamento de dispersão localizado localmente; MLM/MLMM = modelo linear misto/modelo misto multi-lócus. Clique aqui para ver uma versão maior desta figura.
Figura 2: Processamento de cromatograma. Dois cromatógramas QC (pico base; dados lipídes) de diferentes lotes demonstram a variação em lote para certas classes lipídicas nas amostras de QC agrupadas. Quatro classes lipídicas principais são indicadas com suas respectivas janelas de elução no sistema interno LC-MS. Os cromatogramas foram exportados de MzMine21. Abreviaturas: QC = controle de qualidade; LC-MS = espectrometria de massa cromatografia líquida. Clique aqui para ver uma versão maior desta figura.
Figura 3: Correção de erro sistemático. Análise componente principal dos dados lipidómicos adquiridos, pré-(dados brutos esquerdos) e pós-correção para erros sistêmicos (à direita, loess em lote). Os painéis inferiores ilustram a distribuição do recurso (Cluster_00005) sobre as amostras (n=650) e os lotes (n=10) pré-(esquerda) e pós (direita)-correção para variação analítica. Abreviaturas: PCA = análise de componentes principais; QC = controle de qualidade; LOESS = esteleia de dispersão estimada localmente. Clique aqui para ver uma versão maior desta figura.
Figura 4: Mapa pleiotrópico ilustrando os resultados combinados do GWAS. O mapa pleiotrópico destaca regiões de todo o genoma que estão associadas a vários traços. Os números nos anéis externos indicam os cromossomos correspondentes. Cada círculo representa um traço individual com seus SNPs significativamente associados. As cores representam diferentes classes compostas (cinza = composto classe 1; verde = composto classe 2; roxo = classe composta 3; amarelo = composto classe 4). No caso de associações intera compostas de classe com a mesma região genômica, destacam-se os genes. O círculo cinzento interno mostra a soma de todos os SNPs significativos associados a uma posição genômica específica. As associações mostradas nesta figura são geradas artificialmente apenas para ilustração. Abreviaturas: GWAS = estudos de associação genoma;; SNPs = polimorfismos de nucleotídeos únicos. Clique aqui para ver uma versão maior desta figura.
Configurações UHPLC-MS para lipídios | ||||
Tempo [min] | Eluente A a B [%]* | Informação | ||
0 - 1.00 | 45% A | Eluent A: 1% 1M NH 4-Acetato, 0,1% ácido acético na água (grau UHPLC) | ||
1.00 - 4.00 | lg 45% - 25% A | Eluente B: 1% 1M NH 4-Acetato, 0,1% ácido acético em acetonitrilo/2-propanol 7:3 (grau UHPLC) | ||
4.00 - 12.00 | lg 25% - 11% A | Taxa de fluxo: 400 μL/min | ||
12.00 - 15.00 | lg 11% - 0% A | Volume de injeção: 2 μL | ||
15.00 - 19.50 | cw 0% A | |||
19.50-19.51 | 0% - 45% A | |||
19.51-24.00 | eq 45% | |||
Configurações UHPLC-MS/MS para metabólitos polares e semipolares | ||||
Tempo [min] | Eluente A e B [%]* | Informação | ||
0 - 1.00 | 99% A | Eluente A: 0,1% de ácido fórmico na água (grau UHPLC) | ||
1.00 - 11.00 | lg 99% -60% A | Eluente B: 0,1% de ácido fórmico em acetonitrilo (grau UHPLC) | ||
11.00 - 13.00 | lg 60% - 30% A | Taxa de fluxo: 400 μL/min | ||
13.00 - 15.00 | lg 30% - 1% A | Volume de injeção: 3 μL | ||
15.00 - 16.00 | cw 1% A | |||
16.00 - 17.00 | lg 1% - 99% A | |||
17.00 - 20.00 | eq 99% A | |||
Configurações GC-MS para metabólitos derivatizados | ||||
Tempo [min] | Temperatura [°C] | Informação | ||
0 - 2.00 | 85 | Gás transportador: Hélio | ||
2.00 - 18.66 | LG 80 - 330 | Taxa de fluxo: 2 mL/min | ||
18.66 - 24.66 | cw 330 | Gradiente de temperatura: 15 °C/min | ||
24.66 | resfriamento rápido | Volume de injeção: 1 μL |
Tabela 1: Configurações de gradiente para cada uma das plataformas analíticas7. Abreviaturas: lg = gradiente linear; cw = lavagem de coluna; eq = equilíbrio; UHPLC-MS = espectrometria de massa líquida de alto desempenho; UHPLC-MS/MS = espectrometria de massa de cromatografia líquida de alto desempenho; GC-MS = espectrometria de massa cromatografia gasosa. * = valor percentual corresponde ao eluente A; o valor percentual restante corresponde ao eluente B.
Tabela Suplementar 1: Dados lipidómicos crus. Indica as intensidades máximas para cada um dos aglomerados detectados sobre cada amostra. Clique aqui para baixar esta Tabela.
Tanto o GC-MS quanto o LC-MS são ferramentas amplamente utilizadas para traçar misturas complexas de várias classes metabólicas. O manuseio de grandes conjuntos de dados com essas ferramentas está inerentemente associado a uma variação não biológica, por exemplo, variação analítica, que interfere e viese a interpretação dos resultados. Este protocolo apresenta um robusto e de alto rendimento de extração de gasodutos de extração para perfis metabólicos abrangentes para eliminar a variação de origem não biológica e realizar estudos de "omics" em larga escala. Os volumes e concentrações utilizados neste protocolo foram ajustados para espécies de leguminosas em diferentes tecidos. No entanto, esses parâmetros podem ser ligeiramente modificados e usados para amostras metabólicas em larga escala de outras espécies vegetais também.
As15 extrações descritas anteriormente baseadas em MTBE podem ser usadas para analisar metabólitos derivatizados, metabólitos semipolares e lipídios. Isso pode ser expandido para extrações de proteínas e hormônios vegetais39, que estavam fora do escopo deste protocolo. Outros protocolos de extração dependem de diclorometano: misturas de etanol40,41. Desses protocolos de extração, o protocolo de extração de metanol MTBE:fornece uma alternativa favorável e menos perigosa aos protocolos de extração baseados em clorofórmioexistentes 42 e não resulta em uma pelota de proteína como uma interfase entre as fases polar e lipídica. Além disso, os métodos MTBE já foram utilizados em diversos estudos para diversas amostras biológicas 43,44,45.
Este protocolo discute várias etapas cruciais que podem levar a uma potencial variação ao manusear um grande número de amostras, por exemplo, durante a colheitade 12,13, extração14, bem como randomização46. Além disso, há questões adicionais que não foram discutidas neste protocolo que devem ser consideradas para garantir dados metabolômicos de alta qualidade, por exemplo, efeito matricial e supressão deíons 14.
O poder dos métodos de normalização baseados em QC depende inerentemente do número de amostras de QC em cada lote. Como mencionado anteriormente, embora o aumento do número aumente a potência, a variação intra-lote dos QCs é relativamente marginal em comparação com a variação entre lotes nesses sistemas analíticos, como ilustrado na Figura 3. No geral, existem outros métodos de normalização baseados em QC, como a remoção de erros sistêmicos usando a floresta aleatória (SERRF), que têm sido mostrados para superar a maioria dos outros métodos de normalização, como a relação em lote-wise, a normalização usando uma seleção ideal de vários padrões internos (NOMIS) e a normalização probabilística (PQN)47 . No entanto, a SERRF conta com várias amostras de QC em cada lote, por exemplo, cada décima amostra, o que não é viável durante o manuseio de um grande número de amostras. A principal vantagem da normalização baseada em QC em relação a outros métodos baseados em padrões baseados em dados ou internos é que ela retém a variação biológica essencial, ao mesmo tempo em que acomoda a variação técnica indesejada28. Os leitores podem consultar esta revisão sobre o manuseio da variação28.
Uma questão principal no GWAS é a taxa de falsos positivos, que se originam principalmente devido à ligação de sítios causais e não causais 48,49. Em segundo lugar, as abordagens conservadoras de correção estatística, por exemplo, Bonferroni e FDR, corrijam para o número de testes independentes, o que não é igual ao número de SNPs testados no GWAS devido à ligação entre os SNPspróximos 50,51 Portanto, o número real de testes independentes é muitas vezes menor. Outra forma de reduzir o limiar estatístico conservador seria reduzir o número de SNPs testados usados para GWAS com base na decadência de ligação sobre as regiões genômicasdefinidas 52. A plataforma de metabolômica de alto rendimento integrada pela GWAS descrita neste protocolo tem uma ampla gama de aplicações. Em particular, facilitará melhorias na criação de culturas, alterando a composição metabólito/lipída para níveis industrial e nutricionalmente desejados. No geral, a metabolômica forneceu uma visão aprofundada da arquitetura genética de uma infinidade de metabólitos e diversificação metabólica que ocorreu durante a domesticação das culturas nas últimas décadas, indicando o vasto potencial de reprodução associada à metabolômica53. As abordagens biológicas moleculares para validação de QTL a jusante incluem a geração de linhas mutantes CRISPR/Cas954, linhas de inserção T-DNA55, linhas de superexpressão estável e/ou transitória56, VIGS, ex vivo metabolômica se aproxima57 ao lado da abordagem convencional na geração de populações transversais F2, bem como validação cruzada em diferentes populações.
Ao realizar a correção necessária para as variações analíticas descritas acima, várias abordagens integradas podem ser realizadas além do GWAS, como metabólito-metabólito, análise de correlação metabólica-lipídica, análise de correlação com dados fenomicos para esclarecer traços mais complexos e/ou análise de co-expressão para desvendar ainda mais a base dos sistemas biológicos58.
Os autores não têm conflitos de interesse para declarar.
O M.B. é apoiado pelo IMPRS-PMPG 'Metabolismo Primário e Crescimento Vegetal'. A A.R.F. e a S.A. reconhecem o apoio financeiro do Programa de Pesquisa e Inovação da EU Horizon 2020, do projeto PlantaSYST (SGA-CSA No. 739582 sob o FPA nº 664620) e do projeto INCREASE (GA 862862).
Name | Company | Catalog Number | Comments |
Reagents and standards | |||
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC) | Avanti Polar Lipids | 850360P | Internal standard for lipids |
Chloroform | Supleco | 67-66-3 | FAME solvent |
Isovitexin | Sigma Aldrich | 38953-85-4 | Internal standard for metabolites |
Lignoceric Acid Methylester | Sigma Aldrich | 2442-49-1 | FAME |
Methanol (MeOH) | Biosolve Chemicals | 13684102 | ULC-MS grade |
Methoxyamin -hydrochlorid | Sigma Aldrich | 593-56-6 | Metabolite deriviatization |
Methyl laurate | Sigma Aldrich | 111-82-0 | FAME |
Methyl myristate | Sigma Aldrich | 124-10-7 | FAME |
Methyl palmitate | Sigma Aldrich | 112-39-0 | FAME |
Methyl stearate | Sigma Aldrich | 112-61-8 | FAME |
Methyl tert-butyl ether (MTBE) | Biosolve Chemicals | 13890602 | HPLC grade |
Methyl-caprat | Sigma Aldrich | 110-42-9 | FAME |
Methylcaprylat | Sigma Aldrich | 111-11-5 | FAME |
Methyldocosanoat | Sigma Aldrich | 929-77-1 | FAME |
Methyleicosanoat | Sigma Aldrich | 1120-28-1 | FAME |
Methyl-hexacosanoat | Sigma Aldrich | 5802-82-4 | FAME |
Methyl-octacosanoat | Sigma Aldrich | 55682-92-3 | FAME |
Methyl-pelargonate | Sigma Aldrich | 1731-84-6 | FAME |
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) | Macherey-Nagel | 24589-78-4 | Metabolite deriviatization |
Pyridine | Supleco | 110-86-1 | Metabolite deriviatization |
Ribitol | Supleco | 22566-17-2 | Internal standard for derivatized metabolites |
Triacontanoic Acid Methyl Ester | TCI Chemicals | 629-83-4 | FAME |
Water | Biosolve Chemicals | 23214102 | ULC-MS grade |
Equipment | |||
1.5 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120086 | |
2 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120094 | |
Balance | Sartorius Corporation | 14 557 572 | |
DB-35ms, 30 m, 0,25 mm, 0,25 µm | Aglient | 123-3832 | Analysis of derivatized metabolites |
GC-MS system | Leco Pegasus HT TOF-MS (LECO Corporation) | Analysis of derivatized metabolites | |
Grinding Balls, Stainless Steel | OPS DIAGNOSTICS | GBSS 196-2500-10 | |
MS system | Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific) | Analysis of lipids | |
MS system | Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™ Massenspektrometer, Thermo Fisher Scientific) | Analysis of metabolites | |
Refrigerated microcentrifuge | Eppendorf, model 5427R | 22620701 | |
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column (100 mm × 2.1 mm containing 1.7 μm diameter particles) | Waters | 186002878 | Analysis of lipids |
RP High Strength Silica (HSS) T3 column (100 mm × 2.1 mm containing 1.8 μm diameter particles) | Waters | 186003539 | Analysis of metabolites |
Shaker | Eppendorf Thermomixer 5436 | 2050-100-05 | |
Sonicator | USC 300 TH | 142-0084 | |
Tissue grinding mixer mill | Retsch, Mixer Mill MM 300 | 20.746.0001 | |
UPLC system | Waters Acquity UPLC system (Waters) | ||
Vacuum concentrator | Scan Speed Maxi Vac Alpha Evaporators | 7.008.500.002 | |
Vortex mixer | Vortex-Genie 2, Model G560 | SI-0236 | |
Software | |||
MetAlign | Chromatogram processing | ||
MzMine | Chromatogram processing | ||
R package "data.table" | |||
R package "fujiplot" | pleiotrpoic map | ||
R package "genetics" | |||
R package "Ime4" | BLUPs calculation | ||
R package "LDheatmap" | LD plots | ||
R package "MASS" | transformation | ||
R package "rMVP" | GWAS | ||
R version 4.0.4 | |||
RefinerMS | Chromatogram processing | ||
RefinerMS Genedata | Expressionist | Chromatogram processing | |
Tassel 5 | Genotype filtering | ||
Xcalibur | Thermo Fisher Scientific | OPTON-30965 | Chromatogram processing |
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoExplore Mais Artigos
This article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados