在该协议中,我们提出了一个优化的工作流程,该工作流程结合了许多样品的高效快速样品制备。此外,我们还提供分步指南,以减少代谢GWAS研究高通量评估的分析变异。
气相色谱-质谱(GC-MS)和液相色谱-质谱(LC-MS)都是广泛用于检测和量化数十万种代谢物特征的代谢组学方法。然而,将这些技术应用于大量样品会受到更复杂的相互作用的影响,特别是对于全基因组关联研究(GWAS)。该协议描述了一种优化的代谢工作流程,它将高效快速的样品制备与豆科植物物种的大量样品分析相结合。这种稍加修饰的提取方法最初是为分析植物和动物组织而开发的,并且基于甲基叔丁基醚的提取:甲醇溶剂,以允许捕获极性和脂质代谢物。此外,我们还为减少分析变异提供了分步指南,这对于GWAS代谢变异的高通量评估至关重要。
大规模的“组学”方法使复杂生物系统1,2,3的分析成为可能,并进一步了解基因型与所得表型4之间的联系。使用超高效液相色谱-质谱(UHPLC-MS)和GC-MS的代谢组学能够检测出过多的代谢物特征,其中只有一些被注释到一定程度,导致高比例的未知代谢物。通过将大规模代谢组学与不同人群的潜在基因型变异相结合,可以探索复杂的相互作用5。然而,处理大型样本集本质上与分析变异有关,扭曲了进一步下游过程的代谢方差评估。具体而言,导致分析变化的主要问题基于机器性能和仪器随时间的变化漂移6。在分析大规模结构化植物种群时,批次间变异的整合具有挑战性,尤其成问题。建议采用多种归一化程序来纠正非生物变异,例如,使用内部、外部和同位素标记的内部标准来纠正分析错误,其中每个标准都与已知问题和陷阱固有关联7,8,9,10。
除了分析变化之外,提取方案的选择通常因分析方法而异。最终,希望通过执行基于相分离的提取方法,降低材料和劳动力成本,以及将同一样品的多个等分试样用于各种分析过程的必要性。这些方法首先使用氯仿引入:甲醇/水溶剂来分馏极性和疏水性化合物11。
该协议描述了一种用于多组学平台的快速高通量管道,用于分析豆科植物物种中的极性代谢物和脂质。此外,它显示了如何在整合基因型信息以通过执行GWAS检测代谢物数量性状位点(QTL)之前,如何针对分析变异适当地校正这些数据集并进行归一化。
1. 实验设计与植物栽培
注意:根据实验假设设置实验,例如,使用大规模GWAS群体可以减少多次重复的必要性,因为统计测试将基于所有单个SNP的单倍型而不是加入进行。相比之下,在其他实验方法中,多个重复是必不可少的。在准备实验时必须考虑以下几点。
2. 生物植物材料的制备
3. 萃取试剂
4. 样品提取
5. 使用超高分子色谱-MS分析脂质
6. 使用 UHPLC-MS 分析极性和半极性代谢物
7. 使用GC-MS17,18分析衍生化代谢物
注意:衍生化代谢物的分析基于先前描述的方案17。处理通风橱中的所有衍生化试剂。确保 N-甲基-N-(三甲基硅基)三氟乙酰胺 (MSTFA) 不与水和湿度接触。
8. 色谱图处理和化合物注释
9. 大规模代谢组学数据集的归一化
10. 全基因组关联研究 (GWAS)32
11. 质量检测
成功的代谢组学GWAS实验应从适当的实验设计开始,然后是样品收集,提取,数据采集和处理,如图 1所示。在该协议中,MTBE方法15用于提取和分析属于几种化合物类别的数百种代谢物。色谱高度依赖于所用色谱柱以及洗脱缓冲液混合物的性质。图2显示了QC样品的色谱图,表明该分析系统中一些主要脂质类别的洗脱模式。 表 1 给出了每个平台应用的梯度。重点放在处理大规模实验中的系统性错误上。进行大规模代谢组学与全身性错误有内在关联。为了进行演示,我们分析了几种常见豆类的脂质组学数据。 补充表 1提供了使用 材料表中指示的软件进行色谱图处理后提取的原始脂质组数据。遵循该协议使我们能够规避处理组学数据的主要问题,特别是在处理大型样本集时。归一化过程可以精确地校正批次分析误差,如图 3所示。虽然增加QC样品的数量会增加归一化的力量,但由于成本和时间的限制,这并不总是可行的。对于具有非靶向代谢特征的高通量代谢组学GWAS,必须适当地说明更多数量的性状- 标志物关联。结合多个GWAS结果的多效性图谱38可用于突出显示与多个性状相关的基因组区域(图4)。
图1:植物中基于代谢组学的GWAS的流程图。 从实验设计到QTL检测的几个步骤显示在左侧面板中。在右侧面板中,显示了多个图形以支持左侧面板中提到的几个步骤。从右上方开始, (1) 显示了LC-MS的建议样本序列, (2) PCA的归一化前和归一化后评分图,包括具有代表性的特征分布预处理和后处理,红色表示QC样本强度,以及 (3) 与LD和单倍型分布具有显着关联的曼哈顿图。缩写:GWAS =全基因组关联研究;QTL = 数量性状位点;PCA = 主成分分析;质量控制= 质量控制;LD = 联动不平衡;MS = 质谱;LC-MS = 液相色谱-质谱;GC-MS = 气相色谱-质谱;黄土 = 局部估计散点图平滑;MLM/MLMM = 混合线性模型/多轨迹混合模型。 请点击此处查看此图的大图。
图2:色谱图处理。 来自不同批次的两个QC色谱图(碱基峰,脂质数据)证明了合并QC样品中某些脂质类别的批次变化。四种主要的脂质类别在内部LC-MS系统中用各自的洗脱窗口表示。色谱图是从MzMine21导出的。缩写:QC =质量控制;LC-MS = 液相色谱-质谱。 请点击此处查看此图的大图。
图 3:系统误差的校正。 对采集的脂质组数据进行主成分分析,对系统误差进行前期(左图,原始数据)和校正后(右图,批次黄土)。下图说明了样品 (n=650) 和批次 (n=10) 在分析变异校正前(左)和后(右)校正上的特征(Cluster_00005)分布。缩写:PCA = 主成分分析;质量控制= 质量控制;黄土 = 局部估计的散点图平滑。 请点击此处查看此图的大图。
图 4:多效性图,说明 GWAS 综合结果。 多效性图突出显示了整个基因组中与几个性状相关的区域。外环上的数字表示相应的染色体。每个圆圈代表一个具有显著相关性 SNP 的个体特征。颜色代表不同的化合物类别(灰色=化合物类别1;绿色=化合物类别2;紫色=化合物类别3;黄色=化合物类别4)。在具有相同基因组区域的化合物类间关联的情况下,突出显示基因。内侧的灰色圆圈显示了与特定基因组位置相关的所有重要SNP的总和。此图中显示的关联是人为生成的,仅用于说明。缩写:GWAS =全基因组关联研究;SNP = 单核苷酸多态性。 请点击此处查看此图的大图。
脂质的超高密度脂蛋白-MS 设置 | ||||
时间 [分钟] | 淋洗液 A 至 B [%]* | 信息 | ||
0 - 1.00 | 45% 一 | 淋洗液A:1%1M NH4-乙酸盐,0.1%乙酸在水中(UHPLC级) | ||
1.00 - 4.00 | lg 45% - 25% A | 淋洗液 B:1% 1M NH4-乙酸盐,0.1% 乙酸乙腈/2-丙醇 7:3(UHPLC 级) | ||
4.00 - 12.00 | 25% - 11% A | 流速: 400 μL/分钟 | ||
12.00 - 15.00 | lg 11% - 0% A | 注射量: 2 μL | ||
15.00 - 19.50 | 连续波 0% A | |||
19.50-19.51 | 0% - 45% A | |||
19.51-24.00 | 当量 45% | |||
极性和半极性代谢物的超高纯化循环-MS/MS 设置 | ||||
时间 [分钟] | 淋洗液 A 和 B [%]* | 信息 | ||
0 - 1.00 | 99% A | 淋洗液A:水中0.1%甲酸(超高纯碱级) | ||
1.00 - 11.00 | 99% -60% A | 淋洗液 B:乙腈中 0.1% 甲酸(UHPLC 级) | ||
11.00 - 13.00 | lg 60% - 30% A | 流速: 400 μL/分钟 | ||
13.00 - 15.00 | lg 30% - 1% A | 注射量: 3 μL | ||
15.00 - 16.00 | 连续 1% A | |||
16.00 - 17.00 | LG 1% - 99% A | |||
17.00 - 20.00 | 当量 99% A | |||
衍生化代谢物的 GC-MS 设置 | ||||
时间 [分钟] | 温度 [°C] | 信息 | ||
0 - 2.00 | 85 | 载气: 氦 | ||
2.00 - 18.66 | lg 80 - 330 | 流速: 2 毫升/分钟 | ||
18.66 - 24.66 | 连续波 330 | 温度梯度: 15°C/分钟 | ||
24.66 | 快速冷却 | 注射量: 1 μL |
表 1:每个分析平台的梯度设置7. 缩写:lg = 线性梯度;cw = 柱洗;等式 = 平衡;超高效液相色谱-质谱= 超高效液相色谱-质谱;超高效液相色谱-MS/MS = 超高效液相色谱-串联质谱;GC-MS = 气相色谱-质谱。* = 百分比值对应于淋洗液 A;剩余百分比值对应于淋洗液B。
补充表1:原始脂质组学数据。 指示每个样本上每个检测到的簇的峰值强度。 请按此下载此表格。
GC-MS和LC-MS都是广泛用于分析各种代谢物类别的复杂混合物的工具。使用这些工具处理大型数据集固有地与非生物变异(例如,分析变异)相关联,这会干扰和偏倚结果的解释。该协议为全面的代谢分析提供了一个强大且高通量的提取管道,以消除非生物来源的变化并进行大规模的“组学”研究。该方案中使用的体积和浓度针对不同组织中的豆科植物物种进行了调整。然而,这些参数可以稍作修改,并用于来自其他植物物种的大规模代谢样品。
前面描述的15种基于MTBE的提取物可用于分析衍生化代谢物,半极性代谢物和脂质。这可以扩展到蛋白质和植物激素提取39,这超出了本方案的范围。其它萃取方案依赖于二氯甲烷:乙醇混合物40,41。在这些提取方案中,MTBE:甲醇提取方案为现有的基于氯仿的提取方案42提供了有利且危害较小的替代方案,并且不会导致蛋白质沉淀作为极相和脂质相之间的中间相。此外,甲基叔丁基醚方法已在若干研究中用于各种生物样品43,44,45。
该协议讨论了在处理大量样品时可能导致潜在变异的几个关键步骤,例如,在收获过程中12,13,提取14以及随机化46。此外,本方案中尚未讨论的其他问题必须考虑以确保高质量的代谢组学数据,例如基质效应和离子抑制14。
基于QC的归一化方法的强大功能本身取决于每个批次中的QC样品数量。如前所述,尽管增加数量会增加功率,但与这些分析系统中的批次间变化相比,QCs的批次内变化相对较小,如图 3所示。总体而言,还有其他基于 QC 的归一化方法,例如使用随机森林 (SERRF) 的系统误差消除,这些方法已被证明优于大多数其他归一化方法,例如批量比率、使用多个内部标准的最优选择进行归一化 (NOMIS) 和概率商归一化 (PQN)47.然而,SERRF依赖于每批中的多个QC样品,例如,每十分之一的样品,这在处理大量样品时是不可行的。与其他数据驱动或基于内部标准的方法相比,基于QC的归一化的主要优点是它保留了基本的生物学变异,同时适应了不需要的技术变异28。读者可以参考本综述,了解变体28的处理方式。
GWAS的一个主要问题是假阳性率,这主要是由于因果和非因果站点的联系而产生的 48,49。其次,保守的统计校正方法,例如Bonferroni和FDR,对独立测试的数量是正确的,由于近端SNP之间的联系,这不等于GWAS中测定的SNP的数量50,51因此,独立测试的实际数量通常较低。降低保守统计阈值的另一种方法是根据定义的基因组区域上的连锁衰减来减少用于GWAS的测试SNP的数量52。本方案中描述的GWAS集成的高通量代谢组学平台具有广泛的应用。特别是,它将通过改变代谢物/脂质组成来促进作物育种的改进,使其达到工业和营养所需的水平。总体而言,代谢组学提供了对过去几十年中作物驯化过程中发生的大量代谢物和代谢多样化的遗传结构的深入见解,表明代谢组学相关育种的巨大潜力53。用于下游QTL验证的分子生物学方法包括生成CRISPR / Cas9突变品系54,T-DNA插入线55,稳定和/或瞬时过表达线56,VIGS, 离体 代谢组学方法57,仅次于生成交叉F2群体的传统方法以及不同群体中的交叉验证。
通过对上述分析变异进行必要的校正,除了GWAS之外,还可以执行几种综合方法,例如代谢物 - 代谢物,代谢物 - 脂质相关分析,与表型组数据的相关性分析以阐明更复杂的性状,和/或共表达分析以进一步解开生物系统的基础58。
作者没有利益冲突需要声明。
医学博士得到了IMPRS-PMPG“初级代谢和植物生长”的支持。A.R.F.和SA.感谢欧盟地平线2020研究与创新计划、PlantaSYST项目(FPA No. 664620下的SGA-CSA第739582号)和项目“增加”(GA 862862)的财政支持。
Name | Company | Catalog Number | Comments |
Reagents and standards | |||
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC) | Avanti Polar Lipids | 850360P | Internal standard for lipids |
Chloroform | Supleco | 67-66-3 | FAME solvent |
Isovitexin | Sigma Aldrich | 38953-85-4 | Internal standard for metabolites |
Lignoceric Acid Methylester | Sigma Aldrich | 2442-49-1 | FAME |
Methanol (MeOH) | Biosolve Chemicals | 13684102 | ULC-MS grade |
Methoxyamin -hydrochlorid | Sigma Aldrich | 593-56-6 | Metabolite deriviatization |
Methyl laurate | Sigma Aldrich | 111-82-0 | FAME |
Methyl myristate | Sigma Aldrich | 124-10-7 | FAME |
Methyl palmitate | Sigma Aldrich | 112-39-0 | FAME |
Methyl stearate | Sigma Aldrich | 112-61-8 | FAME |
Methyl tert-butyl ether (MTBE) | Biosolve Chemicals | 13890602 | HPLC grade |
Methyl-caprat | Sigma Aldrich | 110-42-9 | FAME |
Methylcaprylat | Sigma Aldrich | 111-11-5 | FAME |
Methyldocosanoat | Sigma Aldrich | 929-77-1 | FAME |
Methyleicosanoat | Sigma Aldrich | 1120-28-1 | FAME |
Methyl-hexacosanoat | Sigma Aldrich | 5802-82-4 | FAME |
Methyl-octacosanoat | Sigma Aldrich | 55682-92-3 | FAME |
Methyl-pelargonate | Sigma Aldrich | 1731-84-6 | FAME |
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) | Macherey-Nagel | 24589-78-4 | Metabolite deriviatization |
Pyridine | Supleco | 110-86-1 | Metabolite deriviatization |
Ribitol | Supleco | 22566-17-2 | Internal standard for derivatized metabolites |
Triacontanoic Acid Methyl Ester | TCI Chemicals | 629-83-4 | FAME |
Water | Biosolve Chemicals | 23214102 | ULC-MS grade |
Equipment | |||
1.5 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120086 | |
2 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120094 | |
Balance | Sartorius Corporation | 14 557 572 | |
DB-35ms, 30 m, 0,25 mm, 0,25 µm | Aglient | 123-3832 | Analysis of derivatized metabolites |
GC-MS system | Leco Pegasus HT TOF-MS (LECO Corporation) | Analysis of derivatized metabolites | |
Grinding Balls, Stainless Steel | OPS DIAGNOSTICS | GBSS 196-2500-10 | |
MS system | Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific) | Analysis of lipids | |
MS system | Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™ Massenspektrometer, Thermo Fisher Scientific) | Analysis of metabolites | |
Refrigerated microcentrifuge | Eppendorf, model 5427R | 22620701 | |
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column (100 mm × 2.1 mm containing 1.7 μm diameter particles) | Waters | 186002878 | Analysis of lipids |
RP High Strength Silica (HSS) T3 column (100 mm × 2.1 mm containing 1.8 μm diameter particles) | Waters | 186003539 | Analysis of metabolites |
Shaker | Eppendorf Thermomixer 5436 | 2050-100-05 | |
Sonicator | USC 300 TH | 142-0084 | |
Tissue grinding mixer mill | Retsch, Mixer Mill MM 300 | 20.746.0001 | |
UPLC system | Waters Acquity UPLC system (Waters) | ||
Vacuum concentrator | Scan Speed Maxi Vac Alpha Evaporators | 7.008.500.002 | |
Vortex mixer | Vortex-Genie 2, Model G560 | SI-0236 | |
Software | |||
MetAlign | Chromatogram processing | ||
MzMine | Chromatogram processing | ||
R package "data.table" | |||
R package "fujiplot" | pleiotrpoic map | ||
R package "genetics" | |||
R package "Ime4" | BLUPs calculation | ||
R package "LDheatmap" | LD plots | ||
R package "MASS" | transformation | ||
R package "rMVP" | GWAS | ||
R version 4.0.4 | |||
RefinerMS | Chromatogram processing | ||
RefinerMS Genedata | Expressionist | Chromatogram processing | |
Tassel 5 | Genotype filtering | ||
Xcalibur | Thermo Fisher Scientific | OPTON-30965 | Chromatogram processing |
请求许可使用此 JoVE 文章的文本或图形
请求许可探索更多文章
This article has been published
Video Coming Soon
版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。