Method Article
该协议提出了指纹的方法,并探索通过综合二维气相色谱图与质谱学相结合收集的多维数据。应用专用模式识别算法(模板匹配)来探索特级初榨橄榄油挥发性分数(即挥发性)中加密的化学信息。
数据处理和评价是综合二维气相色谱 (GCxGC) 的关键步骤,尤其是在与质谱学相结合时。数据中加密的丰富信息可能非常有价值,但难以有效访问。数据密度和复杂性可能导致长时间的阐述时间,并且需要费力的、依赖分析师的程序。因此,有效但可访问的数据处理工具是使这种先进的多维技术在实验室中推广和接受供日常使用的关键。本作品中提供的数据分析协议使用色谱指纹和模板匹配,以实现将复杂的二维色谱高度自动解构为单个化学特征的目标,从而高级识别单个色谱图和跨色谱图中的信息模式。该协议提供高一致性和可靠性,很少干预。同时,分析员的监督可以在各种设置和约束功能中进行,这些设置和约束功能可以定制,以提供灵活性和能力来适应不同的需求和目标。模板匹配在这里显示是一个强大的方法来探索特级初榨橄榄油挥发性。山峰的交叉对齐不仅针对已知目标,也针对非目标化合物,这显著提高了各种应用的表征功率。举例证明在类似条件下分析的样本集对色谱模式进行分类和比较的性能。
综合二维气相色谱学与飞行时间质谱检测(GC×GC-TOF MS)相结合,是目前对复杂样品1、2、3、4、5的化学特征最翔实的分析方法。在 GC 中×GC 中,列由调制器(例如热或基于阀门的对焦接口)串联和接口,该调节器在将组件从第一维度(1D) 列捕获,然后再重新注入第二维度(2D) 列。此操作在固定调制时间段(PM)内完成,一般在 0.5–8 s 之间。通过热调节,该过程包括低温捕获和对焦的流光带,对整体分离功率有一定的好处。
虽然 GC ×GC 是一种二维分离技术,但该过程会产生顺序数据值。探测器模拟数字转换器(A/D)以一定频率获得色谱信号输出。然后,数据以特定的专有格式存储,不仅包含数字化数据,还包含相关元数据(有关数据的信息)。GC×GC 系统中采用的 A/D 转换器有助于将色谱信号的强度映射到数字数字 (DN) 中,作为两个分析维度中的时间函数。单通道探测器(如火焰电阻探测器 (FID)、电子捕获探测器 (ECD)、硫化学发光探测器 (SCD) 等)每次采样时间产生单个值,而多通道探测器(例如质谱探测器 (MS))在分析运行中每个采样时间产生多个值(通常超过光谱范围)。
要可视化 2D 数据,详细阐述首先将单个调制周期(或周期)数据值的 raster 化为像素列(与探测器事件相对应的图片元素)。沿着定向(Y轴,从下到上)可视化 2D分离时间。像素列按顺序处理,以便腹肌(X轴,从左到右)报告 1D分离时间。此命令在右手笛卡尔坐标系中显示 2D 数据 ,1D 保留通常作为进入阵列的第一个索引。
2D 色谱图的数据处理使访问的信息水平高于原始数据,从而实现2D 峰值检测、峰值识别、提取响应数据进行定量分析和交叉比较分析。
2D 峰值模式可被视为样品的独特指纹,检测到的化合物可作为细枝末节特征,以便进行有效的交叉比较分析。这种方法,被称为基于模板的指纹6,7,灵感来自生物识别指纹6。事实上,自动生物识别指纹验证系统依赖于独特的指尖特征:脊裂和末端,本地化,并从墨迹或详细图像中提取。这些特征,称为细枝末节功能,然后与可用的存储模板8,9交叉匹配。
如上所述,每个GC×GC分离模式由 2D峰值组成,合理分布在二维平面上。每个峰值对应于单个分析,具有其信息潜力,可视为比较模式分析的单一特征。
在这里,我们提出了一个有效的化学指纹方法,由GC×GC-TOFMS具有串联电电。目标是从一组色谱图中全面和定量地对特征进行编目。
与现有的商业软件或内部程序10,11采用峰值功能方法相比,基于模板的指纹识别的特点是高特异性、高效率和有限的计算时间。此外,它有一个内在的灵活性,使小数功能(即2D峰值)之间的交叉对齐严重不对齐的色谱图作为那些由不同的仪器或长期框架研究12,13,14获得。
简要介绍了建议方法的基本操作,引导读者对 二维模式的复杂性和信息能力有一个良好的理解。然后,通过探索仪器输出数据矩阵,在二维空间上进行化学识别并识别目标分析。然后构建目标峰值的模板并应用于在同一分析批次中获得的一系列色谱图。与保留时间、光谱签名和响应(绝对和相对)相关的元数据从目标峰值的重新对齐模式中提取,并用于揭示样本集的组成差异。
作为该过程的一个额外、独特的步骤,还将在预先瞄准的色谱图上进行非目标和有针对性的 (UT) 指纹组合,以将指纹潜力扩展到已知和未知的分析。该过程生成一个UT模板,用于真正全面的比较分析,基本上可以自动化。
作为最后一步,该方法在两个平行探测器信号中执行特征的交叉对齐,这两个信号产生于高低电子电离能量(70 和 12 eV)。
该协议在支持单色谱或一组色谱分析以及可变色谱和/或多个探测器方面相当灵活。在这里,协议通过市售的 GC ×GC 软件套件(参见材料表)与 MS 库和搜索软件(参见材料表)相结合进行演示。其他软件中也有一些必要的工具,类似的工具可以独立于Reichenbach和同事15、16、17、18、19的文献描述来实施。演示的原始数据来自在作者的实验室14进行的特级初榨橄榄(EVO)油的研究。特别是,意大利EVO油的挥发性部分(即挥发性)通过头部空间固体相微缩(HS-SPME)进行采样,由GC×GC-TOF MS进行分析,以捕获诊断指纹,获得样品的质量和感官资格。材料表中提供了样品、取样条件和分析设置的详细信息。
步骤 1–6 描述色谱图的预处理。步骤 7–9 描述单个色谱图的处理和分析。步骤 10–12 描述模板创建和匹配,这是交叉样本分析的基础。步骤 13–16 描述在一组色谱图中应用协议,步骤 14–16 用于 UT 分析。
1. 导入原始数据
注意:这创建了用于可视化和处理的二维流氓阵列。
2. 改变调制阶段
注意:这使每个调制周期中的所有峰值都进入相同的图像列,包括环绕调制期末端的峰值,进入下一个调制周期20的空隙时间。
3. 基线修正21
4. 使用值图和彩色地图着色色图20
5. 分析18的2D 峰值(即斑点)检测
6. 2D 峰值过滤
注意:这样做是为了自动删除由于沿 1D 的列出血和沿 2D 的罢工或尾矿而导致的毫无意义的检测。
7. 线性保留指数校准
注意:执行此步骤22 (IT),针对保留指标 (RI) 标准(通常 为 n-alkanes)的特定保留时间。
8. 在 NIST17 MS 库23中搜索峰值光谱
9. 审查和更正分析身份
10. 创建具有目标峰值15的模板
11. 匹配并应用模板
注意:匹配识别检测到的峰值中的模板模式,新色谱图。在模板中的新色度图中应用匹配的组标识和其他元数据。
12. 将模板转换为完全不同的色谱
注意:除非色谱条件发生重大变化,导致模板与新色谱失调,例如在长期研究中或安装新列后的情况,否则此步骤是没有必要的。在这种情况下,模板可以在色谱保留时间平面上几何形状,以更好地适应新的色谱图12,13。在此示例中,模板和色谱的峰值模式相似,但在保留时间几何形状上有所不同,例如在不同的色谱条件下可以看到。
13. 在一组色谱图上执行非目标和有针对性的综合分析
注:一个组合的非目标和目标 (UT) 模板,也称为功能模板24,25,当匹配到每组色谱图时,建立非目标分析与目标分析之间的对应关系,然后提取一致的交叉样本功能以进行模式识别。
14. 修改UT模板以进行平行MS分析
注:分析同时使用70 eV和12 eV(即高低)电子电电化能量26、27进行。
15. 在 12 个 eV 色谱图上执行非目标和定向综合分析
GC×GC-TOF MS 优质特级初榨橄榄油伏洛美模式显示约 500 2D 峰值高于 100 的信号与噪声比 (SNR) 阈值。先前对食物挥发性14、27的调查将这一阈值定义为超过阈值的最低相对信号,以获得可靠的光谱进行交叉比较分析。组件根据两个色谱维度的相对保留分布在色谱空间中,并特别根据其在 1D 中的波动性/极性和2D 中的波动性进行分布。在这里,列组合是极性×半极(即卡博瓦克斯20米×OV1701)。
2D 模式显示高度的顺序。同源系列和类的相对保留模式显示在图1A中,注释(组图形和峰值气泡图)用于线性饱和碳氢化合物(黑色)、不饱和碳氢化合物(黄色), 线性饱和醛(蓝色)、单不饱和醛(红色)、多不饱和醛(鲑鱼)、原醇(绿色)和短链脂肪酸(氰酸)。
然后,通过比较从整个2D 峰值(blob频谱) 或最大频谱 (顶点频谱) 中提取的平均 MS 频谱,可以识别检测到的2D 峰值。图 2说明了顶点频谱搜索 blob 5 的输出,并为(E)-2-hexenal 返回了高相似性匹配(前 10 次命中)。所探索的数据库是分析员在方法的第 8 步中预先选择的数据库。
通过主动保留索引验证标识。实验性 IT值是针对2D 峰值计算的,因此在现阶段,库搜索会优先考虑具有表化IT的连贯值的结果。可根据分析员经验、根据静止阶段对参考数据库值的可靠性以及应用的分析条件定制公差窗口。雷琴巴赫等人最近开发并讨论了无需与n-alkanes进行实验校准的线性保留指数的智能校准新工具。
可采用已识别的 2D 峰值(即目标峰值)的集合来构建目标峰值模板,以便迅速在所有样本色谱图上建立同一化合物之间的可靠对应关系。目标模板峰值的集合可视化为 图 1B。红圈对应于 196 种目标化合物,包括两个与连接线模板峰值相连的内部标准 (IS)。IS 用于响应规范化,连接线有助于可视化所包含的 IS 中的哪一个,以使每个 2D 峰值/blob 响应正常化。
在图 1B中,填充圆表示模板峰值与实际模式之间的正匹配,而空圆表示未验证通信的模板峰值。假负匹配可以通过适当选择阈值参数、参考光谱和约束功能 13、14、18、19 来加以限制。对于具有多个共发的复杂模式,基于光谱去卷积的离子峰值检测功能是可取的,并且可能是一个有效的选项19。模板峰值元数据显示在图 1B的放大面板中,用于(E)-2-六位体。
模板匹配的特殊性依赖于应用约束功能的可能性,这些约束功能限制了与属于算法搜索窗口、MS 光谱相似性超过一定阈值的考生峰值的正对应函。在这种情况下,在第11步,相似性阈值23被设置为700根据以前的实验旨在定义最佳参数限制假负匹配14。图 1B中模板峰值属性的突出区域显示有关参考 MS 频谱字符串和 qCLIC 约束功能(即匹配("匹配"("
通过将模板应用于一组的所有色谱图,人们可能会遇到具有挑战性的情况,例如模式部分不对齐的情况。这可能是由于烤箱温度不一致,载体气体流动/压力不稳定,或由于手动干预系统的情况下,列替代或调制器环毛细线更换14,28。图3显示了目标模板与实际色谱图之间部分不对齐的情况。对于最小的不对齐,交互式模板转换(图 3,控制面板)可以重新定位模板峰值,以便更好地配合。重新定位后,模板可以匹配以建立通信。在示例中,模板(图 3,步骤 12)峰值与实际的 2D 模式正确匹配。如果出现严重错位,这里没有讨论,重复匹配转换更新操作可以反复调整模板峰值位置,以实际峰值模式12,13,14。
在这里,目标峰(即已知分析)提供约40%的色谱结果(平均约500个可探测峰的196个目标峰)。其他60%的化合物,连同它们带来的信息,在有针对性的分析中没有考虑到。为使调查真正全面,还应建立非目标 2D峰值的一致交叉对齐。模板匹配扩展到所有可检测的分析人员处理烤咖啡7的复杂伏拉托姆的第一个应用程序。此过程使用软件(例如,调查员)实现自动化,此处以步骤 14-15 显示。
在此过程中,通过交叉匹配所有图像模式29来定义可靠的峰值,用于定义所研究样本(20 个样本)的预先定位的图像。随后,构建了复合色谱图,从中可以识别 UT 可靠的峰值和峰值区域(即 2D 峰值足迹)在所谓的功能模板17中。
对于在 70 eV 获得的分析,该过程确定了 144 个可靠峰值,可靠性宽松29个,其中 76 个属于目标峰值列表。基于这 144 个可靠的峰值,该过程将所有色谱图与可靠峰值的平均保留时间一致,然后将其组合在一起创建复合色谱图。 图4 显示了根据石油(左)生产区域标记的所有样品的列表,以及每个样品(右)中可靠的峰值/blob体积列表。
非目标功能模板由合成色度图中检测到的分析中的2个 D 峰值组成,这些峰值与可靠的峰值模板(n = 168 - 目标峰值的红色圆圈和非目标峰值的绿色圆圈)相匹配。复合峰的质谱及其保留时间记录在扩大区域中(Z) -3-六酚醋酸的特征模板中。峰值区域以红色图形显示在图 5B中:相反,它们是由复合色谱图(n = 3578)中检测到的所有2D 峰值的轮廓来定义的。
当主要成分分析的无监督模式识别应用于 20 个分析样本中的目标峰值分布时,西西里岛和托斯卡纳油团分别表明,pedo-气候条件和风土会影响挥发物的相对流行。结果显示在图 6A 中,PCA 结果来自可靠的峰值分布,如图 6B所示。这两种方法交叉验证了来自不同地理区域的油具有不同的,而相干的化学特征,无论是靶向化合物还是非目标化合物,或者两者兼有。
最后,该软件能够在并行检测通道上快速有效地重新调整模式。在此应用程序中,建议对串联电电化信号进行重新对齐。MS 的离子源在两个电离能量(即 70 和 12 eV)之间发生多路复用,每通道 30 的采集频率为50Hz 。由此产生的两种色谱模式紧密对齐,而光谱数据(即光谱特征和响应)则带来具有不同动态响应范围的补充信息26、27。对齐的模式允许提取具有单声道 ID 的特征(2D 峰和峰值区域)(即目标山峰的化学名称和未定向峰和峰值区域的唯一编号 # )。
模板匹配允许有效的交叉对齐。在这种情况下,没有太多的不对齐,但MS限制必须放宽,以允许匹配UT峰值。另一方面,没有 MS 限制的特色 UT 峰值区域会及时匹配,而不会出现任何虚假的负面匹配。 图 5C 显示了 12 eV 色谱图的放大区域,其中匹配了从 70 个 eV 数据构建的功能模板。由于 qCLIC 限制降低(例如 DMF 阈值为 600),可靠的 UT 峰值与之正匹配。需要注意的是,在 12 eV 时,由于低电离能引起的有限碎片,检测到的峰值较少。
图1:投标的轮廓图和目标模板。(A) 托斯卡纳特级初榨橄榄油挥发部分的轮廓图。同源系列和类的有序模式以不同的颜色和线突出显示:线性饱和碳氢化合物(黑线和 2D轮廓)不饱和碳氢化合物(黄色)、线性饱和醛(蓝色)单不饱和醛(红色)、多不饱和醛(鲑鱼)、原醇(绿色)和短链脂肪酸(氰酸)。(B) 将已知分析(红色圆圈)的目标模板与连接内部标准 (ISs) 的连接线过度放大。面板显示 2D 峰值/blob 属性元数据 (十进制) 或模板峰值属性。 请单击此处查看此图的较大版本。
图2:顶点MS搜索。输出的顶点MS搜索斑点5。具有最高相似性匹配的数据库条目列表和库提供的相关元数据。 请单击此处查看此图的较大版本。
图3:模板调整。工作流说明允许通过转换重新调整模板的步骤。 请单击此处查看此图的较大版本。
图4:GC调查员界面。调查人员小组根据石油生产区域(左)和每个样品(右)中可靠的峰值/blob体积列表标记所有选定的图像。 请单击此处查看此图的较大版本。
图5:目标和UT模板。(A) 第11步自动处理产生的可靠峰值:红色圆圈对应于已知的分析,而绿色圆圈则不为人知。在叠加的面板中,模板对象属性显示为 (Z)-3-六角形。(B) 显示 UT 模板的 UT 峰值(红色和绿色圆圈)和峰值区域(红色图形)的扩大区域,与以 70 eV 电传能量获得的样品油相匹配。(C) UT 模板与以 12 eV 电电化能量获得的样品油相匹配。 请单击此处查看此图的较大版本。
图6:PCA加载图。它们通过(A)定向峰分布或(B)UT 峰值分布显示样本(来自托斯卡纳和西西里岛的油)的自然构象。 请单击此处查看此图的较大版本。
补充文件。请单击此处下载这些文件。
GC×GC-TOF MS 数据的可视化是适当理解全面二维分离所取得成果的基本步骤。具有自定义着色的图像图使分析人员能够欣赏探测器响应差异,从而欣赏样本组件的差异分布。这种视觉方法完全改变了分析师对色谱图的解释和阐述的看法。第一步,一旦被色谱学家理解并自信地使用,为进一步加工开辟了新的视角。
数据处理的另一个基本方面是所有样本点的完整数据矩阵(即 MS 光谱数据和响应)的可访问性,每个样本点都与单个探测器事件相对应。在这方面,2D峰值集成,使探测器事件的集合对应于单一分析特代表关键步骤。在当前协议中,2D 峰值检测基于分水岭算法18,包括一些适应,以提高检测灵敏度,以防部分共发化合物。为了使这一进程更加具体,必须进行权力下放,并采用更复杂的程序。这可以通过对MS数据执行离子峰值检测:该算法处理数据阵列,并根据光谱配置文件19,31分离单一分析器的反应。
协议的一个重要但关键的步骤,以及任何GC×GC-MS数据解释过程,都与分析数据识别有关。这一程序在第8和第9阶段提出,如果没有具有真实标准的确认性分析,必须由分析员认真进行。任何商业软件中都有自动操作;它们包括针对收集的参考光谱(即光谱库)的MS光谱签名相似性评价,以及对限定/定量电量离子中特征比率的评价。然而,需要附加的确认标准来消除异位素的识别。该协议建议采用线性保留索引,以优先确定候选人名单的优先级:此处的限制与保留数据的可用性及其一致性有关。
使这种方法独特的主要特点是模板匹配12,13,15,29。模板匹配以非常有效、具体和直观的方式实现2D 模式识别。可以通过应用自定义阈值和/或约束功能来设置,而分析员可以通过与转换函数参数积极交互来监督程序。这一过程的特殊性取决于在统一批次的样品之间以及在具有相同名义条件下获得的样品之间交叉对齐目标和非目标峰值信息的可能性,尽管存在中到严重的不对齐。此操作的优点涉及保留所有有针对性的分析数据识别的可能性,这对分析员来说是一项耗时的任务,并且所有元数据都保存在以前阐述会话中的目标和非目标峰值。
模板匹配在计算时间方面也非常有效:低分辨率 MS 数据文件由大约 1=2 Gb 的外包装数据组成,而高分辨率 MS 分析可能达到每单次分析运行 10=15 Gb。模板匹配并不是每次都处理完整的数据矩阵,但首先,使用模板峰值执行色谱图之间的保留时间对齐,然后在搜索窗口内处理候选峰值,以获得与模板中引用的相似性匹配。在发生严重错位、最具挑战性的情况时,全球二阶多声变换比本地方法表现更好,同时缩短了计算时间13。
GC×GC技术要广泛传播到学术界和研究实验室之外,数据处理工具必须便于可视化和色谱检查的基本操作:分析人员的识别应提供采用标准化算法和程序(例如,NIST搜索算法和 IT 校准)的可能性:交叉比较分析应直观、有效且由交互式工具支持。建议的方法解决了这些需求,同时提供了处理复杂情况的高级选项和工具,如分析联发性、多分析校准、组型分析和并行检测对齐。
参考文献很好地涵盖了GC×GC以及更普遍的全面二维色谱学的许多可能情况,提供了独特的解决方案和可靠的结果,而1D色谱学在单次运行分析中无法实现这些解决方案和可靠结果。5、32、33 虽然 GC ×GC 是提高分离能力和灵敏度的最强大工具,但分离功率、灵敏度和其他系统容量始终存在局限性。随着这些系统性限制的接近,数据分析变得越来越困难。因此,研究和开发必须继续改进我们掌握的分析工具。
斯蒂芬·雷琴巴赫教授和陶庆平博士在GC图像有限责任公司有经济利益。丹妮拉·佩罗尼博士是SRA仪器公司的员工,SRA仪器是GC图像在意大利和法国的分销商。费德里科·斯蒂洛博士、基亚拉·科德罗教授和卡洛·比奇教授宣布没有利益冲突。
这项研究得到了普罗吉托·阿格尔−方达齐奥尼的支持。项目首字母缩略词小提琴 - 通过创新的分析工具(https://olivoeolio.progettoager.it/index.php/i-progetti-olio-e-olivo/violin-valorization-of-italian-olive-products-through-innovative-analytical-tools/violin-il-progetto)对意大利橄榄产品进行评估。GC 图像软件可免费试用,供希望演示和测试协议的读者使用。
Name | Company | Catalog Number | Comments |
1D SolGel-Wax column (100% polyethylene glycol; 30 m × 0.25 mm dc × 0.25 μm df). Carrier gas helium at a constant nominal flow of 1.3 mL/min. | Trajan SGE Analytical Science, Ringwood, Australia | PN 054796 | Carrier gas helium at a constant nominal flow of 1.3 mL/min. Oven temperature programming set as follows: 40°C (2 min) to 240°C (10 min) at 3.5°C/min. |
2D OV1701 column (86% polydimethylsiloxane, 7% phenyl, 7% cyanopropyl; 1 m × 0.1 mm dc × 0.10 μm df) from . | Mega, Legnano, Milan, Italy | PN MEGA-1701 | |
Automated system for sample preparation: SPR Autosampler for GC | SepSolve-Analytical, Llantrisant, UK | ||
Extra Virgin Olive oils: Sicily and Tuscany, Italy | Project VIOLIN (Ager - Fondazioni in rete per la ricerca agroalimentare) | Samples (n=10) were collected during the production year 2018 within the "Violin" project sampling campaign. Oils were submitted to HS-SPME to sample volatiles according to a reference protocol validated in a previous study of Stilo et al.14 | |
Gas chromatograph: Model 7890B GC | Agilent Technologies Wilmington DE, USA | ||
GC Image GC×GC edition V 2.9 | GC Image LLC, Lincoln, Nebraska | https://www.gcimage.com/gcxgc/trial.html | |
Image processing software | GC Image LLC, Lincoln, Nebraska | https://www.gcimage.com/gcxgc/trial.html | |
Mass spectrometer: BenchTOF-Select | Markes International Llantrisant, UK | ||
Methyl-2-octynoate (CAS 111-12-6) | Merck-Millipore/Supelco | PN: 68982 | |
Modulator controller: Optimode v2.0 | SRA Intruments, Cernusco sul Naviglio, Milan, Italy | ||
Modulator: KT 2004 loop type | Zoex Corporation Houston, TX, USA | ||
MS library and search software: NIST Library V 2017, Software V 2.3 | National Institute of Standards and Technology (NIST), Gaithersburg MD | https://www.nist.gov/srd/nist-standard-reference-database-1a-v17 | |
n-alkanes C8-C40 for retention indexing | Merck-Millipore/Supelco | PN: 40147-U | |
n-hexane (CAS 110-54-3) gas chromatography MS SupraSolv | Merck-Millipore/Supelco | PN: 100795 | |
Solid Phase Microextraction fiber | Merck-Millipore/Supelco | PN 57914-U | |
α- /β-thujone (CAS 546-80-5) | Merck-Millipore/Sigma Aldrich | PN: 04314 |
请求许可使用此 JoVE 文章的文本或图形
请求许可This article has been published
Video Coming Soon
版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。