Method Article
冷冻电子显微镜中的单颗粒分析是用于在高分辨率下确定生物集合体结构的主要技术之一。Scipion提供了创建整个管道的工具,以处理显微镜获取的信息并实现生物标本的3D重建。
冷冻电子显微镜已成为生物学研究中以近原子分辨率揭示大分子结构信息的最重要工具之一。在单颗粒分析中,玻化样品由电子束成像,显微镜柱末端的探测器产生该样品的电影。这些电影包含数千个随机方向的相同粒子的图像。数据需要经过具有多个步骤的图像处理工作流程才能获得最终的3D重建体积。图像处理工作流程的目标是确定采集参数,以便能够重建所研究的标本。Scipion提供了在集成框架中使用多个图像处理包创建此工作流程的所有工具,还允许结果的可追溯性。在本文中,Scipion中的整个图像处理工作流程通过来自真实测试用例的数据进行介绍和讨论,提供了从显微镜获得的电影到高分辨率最终3D重建所需的所有细节。此外,还讨论了使用共识工具的强大功能,这些工具允许组合方法,并在工作流程的每个步骤中确认结果,从而提高所获得结果的准确性。
在冷冻电子显微镜(cryo-EM)中,玻璃化冷冻水合物标本的单颗粒分析(SPA)是生物大分子成像中最广泛使用和最成功的变体之一,因为它可以理解分子相互作用和生物集合的功能1。这要归功于这种成像技术的最新进展,该技术引发了"分辨率革命"2,并允许以近原子分辨率成功测定生物3D结构。目前,SPA冷冻电镜中达到的最高分辨率是1.15 Å的apoferritin3(EMDB条目:11668)。这些技术进步包括样品制备4、图像采集5和图像处理方法6的改进。本文将重点介绍最后一点。
简而言之,图像处理方法的目标是识别所有采集参数,以反转显微镜的成像过程并恢复所研究生物标本的3D结构。这些参数是相机的增益,光束诱导的运动,显微镜的像差(主要是散焦),每个粒子的3D角度方向和平移,以及具有构象变化的标本时的构象状态。然而,参数的数量非常高,cryo-EM需要使用低剂量图像以避免辐射损伤,这显着降低了采集图像的信噪比(SNR)。因此,问题不能明确解决,所有要计算的参数只能是估计值。在图像处理工作流程中,应识别正确的参数,丢弃剩余的参数,最终获得高分辨率的3D重建。
显微镜产生的数据被收集在框架中。简化一下,每当使用电子计数探测器时,帧都包含到达图像中特定位置(像素)的电子数量。在特定的视野中,收集多个帧,这称为电影。由于使用低电子剂量来避免可能破坏样品的辐射损伤,因此SNR非常低,并且需要对对应于同一电影的帧进行平均,以获得揭示样品结构信息的图像。然而,不仅应用了简单的平均值,由于需要补偿的光束诱导运动,样品在成像时间内可能会遭受偏移和其他类型的运动。移位补偿和平均帧源自显微照片。
一旦获得显微照片,我们需要估计显微镜为每个微照片引入的像差,称为对比度传递函数(CTF),它表示显微照片对比度的变化作为频率的函数。然后,可以选择和提取颗粒,这称为颗粒拾取。每个粒子都应该是一个小图像,只包含所研究标本的一个副本。有三个用于粒子拾取的算法系列:1)仅使用粒子外观的一些基本参数化来在整个显微照片(例如,粒度)中找到它们的算法,2)从用户或预先训练的集合中学习粒子的外观的算法,以及3)使用图像模板的算法。每个系列都有不同的属性,稍后将显示。
在显微照片中发现的提取的粒子集将用于2D分类过程,该过程有两个目标:1)通过丢弃包含纯噪声图像,重叠粒子或其他伪影的子集来清洁粒子集,以及2)代表每个类的平均粒子可以用作初始信息来计算3D初始体积。
3D初始体积计算是下一个关键步骤。获得3D结构的问题可以看作是多维解景观中的优化问题,其中全局最小值是表示原始结构的最佳3D体积,但可以找到几个表示次优解的局部最小值,并且很容易被困住。初始体积代表搜索过程的起点,因此错误的初始体积估计可能会阻止我们找到全局最小值。从初始体积开始,3D分类步骤将有助于发现不同的构象状态并再次清洁颗粒集;目标是获得结构上均匀的颗粒群。之后,3D细化步骤将负责细化每个粒子的角度和平移参数,以获得最佳的3D体积。
最后,在最后的步骤中,可以获得的3D重建可以进行锐化和抛光。锐化是提高重建体积的高频的过程,抛光是在颗粒水平上进一步细化某些参数的步骤,如CTF或光束诱导的运动补偿。此外,还可以使用一些验证过程来更好地了解在工作流结束时实现的分辨率。
在所有这些步骤之后,跟踪和对接过程7 将通过从头开始构建原子模型或拟合现有模型,帮助为获得的3D重建赋予生物学意义。如果达到高分辨率,这些过程将告诉我们生物结构的位置,甚至是不同原子在我们的结构中的位置。
Scipion8 允许以集成方式创建整个工作流程,将最相关的图像处理包组合在一起。Xmipp9,Relion10,CryoSPARC11,Eman12,Spider13,Cryolo14,Ctffind15,CCP416,Phenix17以及更多软件包可以包含在Scipion中。此外,它还集成了所有必要的工具,有利于集成、互操作性、可追溯性和可重复性,从而全面跟踪整个图像处理工作流程8。
Scipion允许我们使用的最强大的工具之一是共识,这意味着在处理的一个步骤中将获得的结果与几种方法进行比较,使不同方法传达的信息组合在一起,以产生更准确的输出。这可以帮助提高性能并提高估计参数中实现的质量。请注意,可以在不使用共识方法的情况下构建更简单的工作流程;但是,我们已经看到了这个工具的强大功能22,25 ,并且本手稿中介绍的工作流程将分几个步骤使用它。
前面段落中总结的所有步骤将在下一节中详细解释,并使用 Scipion 合并到一个完整的工作流中。此外,还将展示如何使用共识工具在生成的输出中实现更高的一致。为此,选择了 恶性疟原虫 80S核糖体的示例数据集(EMPIAR条目:10028,EMDB条目:2660)。该数据集由600部电影组成,这些电影的16帧大小为4096x4096像素,像素尺寸为1.34Å,使用FEI FALCON II相机在FEI POLARA 300上拍摄,EMDB上报告的分辨率为3.2Å18 。
1. 在 Scipion 中创建项目并导入数据
2. 短片对准:从短片到显微照片
3. CTF估计:计算显微镜的像差
4. 颗粒拾取:在显微照片中查找颗粒
5. 二维分类:将相似的颗粒组合在一起
6. 初始体积估算:构建3D体积的第一个猜测
7.3D分类:发现构象状态
8.3D细化:精炼齐次总体的角度分配
9. 评估和后处理
我们使用 恶性疟原虫 80S核糖体(EMPIAR条目:10028,EMDB条目:2660)的数据集进行测试,并且使用上一节中介绍的Scipion协议,已经实现了该特定示例中大分子的高分辨率3D重建体积,从显微镜收集的信息开始,该信息由非常嘈杂的图像组成,其中包含标本任何方向的2D投影。
运行整个协议后获得的主要结果如图10、图11和 图12所示。图 10 显示了后处理前获得的 3D 体积。在图10a中,可以看到3 Å的FSC非常接近奈奎斯特极限(像素尺寸为1.34 Å的数据,奈奎斯特极限为2.6 Å)。图 10b 显示了重建的 3D 体积的一些切片,这些切片具有高水平的细节和明确定义的结构。在图11中,显示了本地分析后获得的3D体积的分辨率的结果。可以看出,结构中的大多数体素达到3 Å以下的分辨率,主要是那些位于结构中央部分的体素。然而,外部显示的分辨率较差,这与图10b切片中这些区域出现的模糊一致。图12显示了后处理后的相同3D地图,该地图能够突出显示体积的较高频率,揭示更多细节并改善表示,这在图12c中的3D演示中尤其可见。
在图14中,Chimera26用于查看所获得体积(图14a),后处理(图14b)和分辨率图(图14c)的3D表示,并用局部分辨率的颜色代码着色。这可以提供有关所获得结构的更多信息。该工具对于深入了解所获得体积的质量非常有用,因为可以看到结构的整个3D环境中非常小的细节。当所达到的分辨率足够时,甚至可以找到结构的一些生化部分(例如,图14d中的α-螺旋。在此图中,必须突出显示在3D结构的所有中心部分实现的高分辨率,这可以看作是图14c中的深蓝色区域。
由于整个协议的良好性能,所有先前的结果都是实现的,但事实可能并非如此。有几种方法可以识别不良行为。在最一般的情况下,当获得的结构具有低分辨率并且无法演变为更好的结构时,就会发生这种情况。 图 15 显示了这方面的一个示例。模糊的体积(图15c)导致FSC较低,这可以在FSC曲线(图15a)和局部估计的直方图(图15b)中看到。此示例是使用输入数据不正确的 3D 细化方法生成的,因为它期望粒子的输入集中存在一些它们未满足的特定属性。可以看出,了解不同方法如何接收数据并正确准备数据始终非常重要。通常,当获得 如图 15 所示的输出时,处理工作流或基础数据中可能存在问题。
工作流中有几个检查点,可以对其进行分析,以了解协议是否正确发展。例如,在采摘之后,前面讨论的几种方法可以对粒子进行排名,并为每个粒子给出分数。在具有不良颗粒的情况下,这些方法允许识别和去除它们。此外,2D分类可以很好地指示具有一组不良的粒子。 图 16 显示了此类错误集的示例。在 图16a中,显示了包含结构的一些细节的良好类,而 图16b 显示了噪声或未居中的坏类,在最后一种情况下,可以看出拾取不正确,并且两个粒子似乎一起出现。另一个检查点是初始体积估计, 图17 显示了良好(图17a)和坏(图17b)初始估计的示例。错误估计是使用不正确的方法设置创建的。必须考虑到所有设置都应仔细完成,根据所分析的数据适当地选择每个参数。如果没有包含一些最少结构信息的地图,则以下细化将无法获得良好的重建。
当问题是不良的采集时,其中电影不保留结构信息,因此不可能从中提取好的颗粒并获得成功的处理。在这种情况下,应该收集更多的电影以获得高分辨率的3D重建。但是,如果不是这种情况,则有几种方法可以管理处理工作流中的问题。如果拣选不够好,有几种方法可以尝试修复它,例如,重复拣选,使用不同的方法,或尝试手动拾取更多粒子以帮助方法从中学习。在 2D 分类期间,如果只有几个类是好的,请考虑重复拾取过程。在初始体积估计中,如果其中一些方法给出的结果不准确,请尝试使用几种方法。这同样适用于3D细化。根据这一推理,在本手稿中,提出了几种共识工具,这些工具对于避免问题并继续使用准确的数据进行处理非常有用。由于在几种方法之间使用了共识,我们可以丢弃难以挑选,分类,对齐等的数据,这可能是不良数据的指标。但是,如果几种方法能够在生成的输出中达成一致,则这些数据可能包含可用于继续处理的有价值信息。
我们鼓励读者下载更多数据集,并尝试按照本手稿中提出的建议进行处理,并使用 Scipion 创建一个类似的工作流程,将处理包结合起来。尝试处理数据集是了解Cryo-EM中最先进的处理工具的强大功能,了解克服处理过程中可能出现的缺点的最佳规则,并提高每个特定测试用例中可用方法的性能的最佳方法。
图 1.影片对齐结果。(a) 结果的主窗口,列出所生成的所有显微照片和补充资料:功率谱密度、极坐标中估计对齐的轨迹、笛卡尔坐标中的相同轨迹、生成的显微照片的文件名。 (b) 以笛卡尔坐标表示的对齐轨迹。 (c) 生成的显微照片。 请点击此处查看此图的放大版本。
图 2.CTF估计与Ctffind结果。 包含结果的主窗口包括一个数字,其中包含估计的PSD(在角落中)以及来自数据的PSD,以及几个散焦参数。 请点击此处查看此图的放大版本。
图 3.带有 Xmipp 的手动拣选窗口。(a) 主窗口,其中有要处理的显微照片清单和其他一些参数。 (b) 在显微照片的某个区域内手工挑选颗粒。 (c) 和 (d) 自动拾取要监督的粒子,以便为 Xmipp 自动拾取方法创建一组训练粒子。 请点击此处查看此图的放大版本。
图 4.与Xmipp结果的深度共识选择。 参数 zScoreDeepLearning 赋予了粒子的优劣权重,它是发现坏粒子的关键。 (a) 最低的 zScores 值与伪影相关联。 (b) 最高的zScores与含有大分子的颗粒有关。 请点击此处查看此图的放大版本。
图 5.使用冷冻散炼结果进行 2D 分类。 显示生成的类(来自同一方向的粒子子集的平均值)。几个好的类以红色选择(具有一定程度的细节),一些坏类未选择(嘈杂和无中心类)。 请点击此处查看此图的放大版本。
图 6.具有群体共识结果的3D初始体积。 运行共识工具 xmipp3 - 群共识后获得的 3D 初始体积视图,使用之前 Xmipp 和 Relion 的 3D 初始体积估计。 (a) 体积以切片表示。 (b) 体积的3D可视化。 请点击此处查看此图的放大版本。
图 7.通过 Relion 结果细化 3D 初始体积。(a) 获得的FSC曲线,大约在4.5Å处越过阈值。 (b) 角度覆盖范围显示为 3D 球体的上视图。在这种情况下,由于没有对称性,分配的粒子应该覆盖整个球体。 (c) 以切片表示的精炼体积。 请点击此处查看此图的放大版本。
图 8.基于深度学习的3D对齐与Xmipp结果。由xmipp3生成的结果 - 用于3D 对齐的深对齐方法。(a) 变换矩阵形式的每个粒子的角度分配。(b) 角度覆盖面。请点击此处查看此图的放大版本。
图 9.3D 对齐共识结果。(a) 在偏移和角度参数方面所获得的差值的粒子清单。 (b) 每个粒子的角度差图。 (c) 每个粒子的移位差图。 请点击此处查看此图的放大版本。
图 10.3D 优化结果的最终迭代。(a) FSC曲线。 (b) 通过切片以全分辨率获得体积。 请点击此处查看此图的放大版本。
图 11.使用 Xmipp 结果进行局部分辨率分析。 该方法的结果 xmipp3 - 局部 MonoRes。 (a) 一些具有代表性的切片用每个体素的分辨率值着色,如颜色代码所示。 (b) 局部分辨率直方图。 请点击此处查看此图的放大版本。
图 12.使用 Xmipp 结果锐化。xmipp3的结果 - 局部锐化方法。(a) 每次迭代获得的卷列表。(b) 在切片表示的最后一次迭代后获得的 3D 体积。(c) 最终体积的3D表示。请点击此处查看此图的放大版本。
图 13.在 Xmipp 结果中验证过拟合工具。xmipp3 的结果 - 验证过拟合。绿线对应于从数据重建,红线对应于噪声。 (a) 平方分辨率与粒子数对数的倒数。(b) 与粒子数的分辨率。请点击此处查看此图的放大版本。
图 14.所获得体积的几个 3D 表示。(a) 预处理量。 (b) 后处理量。 (c) 局部分辨率,深蓝色体素是分辨率较高(2.75Å)的体素,深红色体素是分辨率较低(10.05Å)的体素。 (d) 放大后处理的体积,可以看到一个α螺旋(红色椭圆形)。 请点击此处查看此图的放大版本。
图 15.糟糕的 3D 重建示例。(a) FSC曲线急剧下降,并以低分辨率越过阈值。 (b) 局部分辨率直方图。 (c) 切片的3D体积。 请点击此处查看此图的放大版本。
图 16.2D 类的示例。(a) 好的班级,显示一定程度的细节。 (b) 包含噪声和伪像的错误类别(上半部分使用 Xmipp 获得,下半部分使用 CryoSparc 获得)。 请点击此处查看此图的放大版本。
图 17.具有不同质量的 3D 初始体积的示例。(a) 良好的初始体积,可以观察到大分子的形状。 (b) 初始体积不良,即获得的形状与预期的形状完全不同。 请点击此处查看此图的放大版本。
补充图1。创建一个 Scipion 项目。 Scipion显示的窗口可以选择旧项目或创建新项目,并为该项目提供名称和位置。 请点击此处下载此文件。
补充图2。导入电影方法。 当 pwem - 导入影片 打开时,Scipion 显示的窗口。在这里,必须包括主要的采集参数,以便电影可以在Scipion中进行处理。 请点击此处下载此文件。
补充图3。影片对齐方法。 当使用 xmipp3 - 光学对准 时,Scipion 显示窗口。应填充输入影片、考虑对齐的帧范围以及用于处理影片的其他一些参数。 请点击此处下载此文件。
补充图4。CTF估计方法与Ctffind。 Scipion 中的窗体,其中包含运行程序 Ctffind 所需的所有字段。 请点击此处下载此文件。
补充图 5.巫师在西皮翁。 一个向导,用于帮助用户填写表单中的某些参数。在本例中,向导将完成 grigoriefflab - ctffind 方法中的分辨率字段。 请点击此处下载此文件。
补充图 6.使用Xmipp的CTF细化方法。xmipp3 - ctf 估计的形式,包含所有参数,以细化先前估计的 CTF。请单击此处下载此文件。
补充图 7.预处理显微照片方法。xmipp3的形式 - 预处理微照片,允许对它们执行一些操作。在此示例中,"删除坏像素"和"缩减像素图"是有用的一个。请点击此处下载此文件。
补充图 8.使用冷冻的拣选方法。 使用预训练网络运行 Cryolo 拣选方法的表单。 请点击此处下载此文件。
补充图 9.使用Xmipp的共识选择方法。xmipp3的形式-基于深度学习的深度共识采摘来计算坐标的共识,使用预先训练的网络在用不同的拣选方法获得的几组坐标上。请点击此处下载此文件。
补充图 10.提取颗粒法。 输入和 预处理 xmipp3 的选项卡 - 提取颗粒。 请点击此处下载此文件。
补充图11.3D Xmipp的初始体积方法。 该方法的形式 为xmipp3 - 重构, 获得初始3D地图。将显示" 输入 "和" 条件 "选项卡。 请点击此处下载此文件。
补充图 12.调整卷大小方法。 用于裁剪卷或调整体积块大小的形式。在此示例中,此方法用于在 xmipp3 - 重构显著性之后生成全尺寸卷。 请点击此处下载此文件。
补充图13.3D Relion结果的初始体积。通过切片获得的3D初始体积的视图 -3D初始模型方法。请点击此处下载此文件。
补充图 14.使用Relion改进了初始卷。方法依赖的形式 - 3D自动细化。在此示例中,它用于优化共识后估计的初始体积。将显示输入和参考 3D 地图选项卡。请点击此处下载此文件。
补充图15.3D分类方法。依赖形式 - 3D分类。将显示"输入"、"参考 3D 地图"和"优化"选项卡。请点击此处下载此文件。
补充图 16.3D基于深度学习方法的对齐方法。为方法 xmipp3 打开的窗体 - 深对齐。在这里,有必要使用训练集训练网络,然后该网络将预测每个粒子的角度分配。请点击此处下载此文件。
补充图17.3D细化方法。xmipp3 - 高分辨率方法的形式。将显示选项卡输入和角度分配。请点击此处下载此文件。
补充图 18.3D 优化结果的第一次迭代。(a) FSC曲线。 (b) 以切片表示的所得体积(小于全分辨率的尺寸)。 请点击此处下载此文件。
补充图 19.3D 细化相关性分析的第一次迭代。 通过单击窗口上部的条形图标(带有粒子列表)将出现一个新窗口。在 "绘图列 "窗口中,可以创建所需估计参数的直方图。 请点击此处下载此文件。
补充图 20.验证过拟合工具。xmipp3 的形式 - 验证过拟合方法。请点击此处下载此文件。
目前,冷冻电镜是揭示生物样品3D结构的关键工具。当用显微镜收集良好的数据时,可用的处理工具将使我们能够获得所研究大分子的3D重建。Cryo-EM数据处理能够实现近原子分辨率,这是理解大分子功能行为的关键,在药物发现中也至关重要。
Scipion是一款软件,允许以集成方式创建整个工作流程,将最相关的图像处理包组合在一起,这有助于整个图像处理工作流程的可追溯性和可重复性。Scipion提供了一套非常完整的工具来进行加工;然而,获得高分辨率重建完全取决于所获取数据的质量以及如何处理这些数据。
为了获得高分辨率的3D重建,首先需要从显微镜获得良好的电影,从而将结构信息保留到高分辨率。如果不是这种情况,工作流将无法从数据中提取高清信息。然后,成功的处理工作流程应该能够提取真正与结构相对应的粒子,并在3D空间中找到这些粒子的方向。如果工作流中的任何步骤失败,则重建卷的质量将降低。Scipion允许在任何处理步骤中使用不同的包,这有助于找到处理数据的最合适方法。此外,由于有许多可用的软件包,可以使用共识工具,通过在不同方法的估计输出中找到一致意见来提高准确性。此外,在"代表性成果"部分已经详细讨论了几种验证工具,以及如何在工作流程的每个步骤中识别准确和不准确的结果,以检测潜在问题以及如何尝试解决这些问题。协议中有几个检查点可以帮助确定协议是否正常运行。一些最相关的是:采摘,2D分类,初始体积估计和3D对齐。检查输入,使用其他方法重复步骤或使用共识,是Scipion中可用的选项,当问题出现时,用户可以使用这些选项来查找解决方案。
关于以前在冷冻电镜领域进行软件包集成的方法,Appion31 是唯一一种允许真正集成不同软件包的方法。然而,Appion与Leginon32紧密相连,Leginon32是一种从电子显微镜自动收集图像的系统。与 Scipion 的主要区别在于数据模型和存储的耦合程度较低。这样,要在Scipion中创建新协议,只需要开发一个Python脚本。但是,在 Appion 中,开发人员必须编写脚本并更改基础数据库。总之,Scipion的开发是为了简化维护和可扩展性。
我们在这份手稿中介绍了冷冻电镜处理的完整工作流程,使用了 恶性疟原虫 80S核糖体的真实案例数据集(EMPIAR条目:10028,EMDB条目:2660)。此处介绍和讨论的步骤可以概括为电影对齐、CTF 估计、粒子拾取、2D 分类、初始地图估计、3D 分类、3D 细化、评估和后处理。在其中几个步骤中使用了不同的软件包,并应用了共识工具。最终的3D重建体积达到了3 Å的分辨率,在后处理的体积中,可以区分一些二级结构,如α-螺旋,这有助于描述原子在空间中的排列方式。
本手稿中介绍的工作流程展示了如何使用 Scipion 以简单易用的方式组合不同的 Cryo-EM 软件包,以简化处理,同时获得更可靠的结果。
在未来,新方法和软件包的开发将继续增长,像Scipion这样的软件可以轻松集成所有这些方法和软件包对研究人员来说将更加重要。即使在那时,共识方法也将更加相关,届时将有大量具有不同基础的方法可用,有助于更准确地估计Cryo-EM重建过程中涉及的所有参数。跟踪和可重复性是研究过程中的关键,并且由于具有用于执行完整工作流程的通用框架,因此Scipion更容易实现。
作者没有什么可透露的。
作者希望通过赠款感谢西班牙科学与创新部的经济支持:PID2019-104757RB-I00/AEI/10.13039/501100011033,通过赠款获得的"马德里自治委员会":S2017 / BMD-3817,Instituto de Salud Carlos III,PT17/0009/0010(ISCIII-SGEFI / ERDF),欧盟(EU)和Horizon 2020通过赠款:INSTRUCT - ULTRA(INFRADEV-03-2016-2017,提案:731005),EOSC Life(INFRAEOSC-04-2018,提案: 824087),iNEXT - Discovery(提案:871037)和HighResCells(ERC - 2018 - SyG,提案:810057)。产生这些成果的项目得到了"la Caixa"基金会(ID 100010434)的奖学金支持。奖学金代码为LCF /BQ/DI18/11660021。该项目已获得欧盟地平线2020研究和创新计划的资助,该计划根据玛丽·斯克沃多夫斯卡 - 居里赠款协议第713673号。作者感谢Landmark ESFRI项目Instruction的资源支持和使用。
Name | Company | Catalog Number | Comments |
no material is used in this article | - | - | - |
请求许可使用此 JoVE 文章的文本或图形
请求许可This article has been published
Video Coming Soon
版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。