生物信息学是关于使用计算机来解决生物学中的问题。Glycoinformatics是关于使用计算机来解决糖生物学中的问题。通过glycoinformatics,我们开发了存储可以浏览或搜索的糖组学或糖蛋白质组学数据的数据库,我们还开发了可视化和比较这些数据的工具。
聚糖的作用越来越被认为是健康和疾病中的重要,glycoinformatics也试图将其推向前进。Catherine Hayes接受过糖生物学培训,是一名数据科学家。Julien Mariethoz接受过计算机科学培训,负责协调数据库和工具的发展。
转到glycoproteome.expasy网站。org/glycomics-expasy,在最左边的菜单中,选中糖蛋白框。右侧的气泡图将放大与该类别匹配的气泡,然后单击GlyConnect气泡以在新选项卡中打开GlyConnect主页。
选择蛋白质按钮,然后在蛋白质视图页面中,在搜索窗口中键入前列腺。单击对应于前列腺特异性抗原或PSA的常见同种型的790。接下来,在顶部的多色条上,单击绿色的源按钮以显示处理已发布数据的示例类型。
单击“疾病”按钮以检查数据库的健康相关内容。然后单击结构按钮,从糖组学数据中查看与PSA相关的135种结构的完整列表。单击由糖组学实验确定的相关78种组合物的组成按钮。
单击任何结构或组成以获取更多详细信息。要减少构图的歧义,请单击所选构图下方的建议结构。每次单糖计数与所列结构的计数一致时,都会提出建议。
要全面浏览蛋白质页面,请在页面右侧查看更多详细信息。前往Octopus主页,确认附着在PSA上的聚糖多样性中存在共同的结构特征,默认情况下保持N-Linked选项卡处于选中状态,移动到核心子选项卡并单击混合图标。然后移动到属性子选项卡,选择唾液酸化图标,然后单击绿色搜索按钮。
在显示的关系图中,将鼠标悬停在H6N4F1S1上以突出显示与三个结构中的七种蛋白质的链接。通过悬停在H6N4F2S1上来与此形成鲜明对比,H6N4F2S1挑出PSA的两种亚型。将鼠标悬停在结构 ID 上以显示其 SNFG 表示形式,然后单击它以打开相应的页面。
将中心节点更改为组织,然后将光标放在图中间的尿液或精液上以查看不同的关联。将中心节点更改为疾病以显示13个选项,其中一个是前列腺癌。唯一相关的蛋白质是PSA。
接下来,单击清除按钮以刷新搜索。移动到属性子选项卡,然后单击双天线图标。然后移动到行列式子选项卡,选择3-sialyl-LN类型2图标,然后单击绿色搜索按钮。
检查章鱼检索到的与含有末端3-唾液基-LN二型基序的双触端聚糖的关联。将中心节点更改为组织,以便于读取,并将鼠标悬停在 KLK3 _ human 上,直接将与 PSA 普通亚型和七种结构连接。返回蛋白质页面,在本例中为PSA,以扫描其列表中每个组合物之间的潜在关系。
在PSA条目页面的右侧,单击Compozitor链接。确保Compozitor搜索字段在蛋白质选项卡中预先填充了ID 790条目的详细信息。单击添加到选择按钮以从数据库中检索数据。
取消选择“包括虚拟节点”选项,然后单击计算图按钮以显示一个图形,该图形显示代表PSA N-糖组的78个组合的连接良好集合,以及显示聚糖主要特征的条形图。保留在主蛋白质标签中,并在蛋白质领域中选择前列腺特异性抗原高Pi同种型。单击“添加到选择”按钮,从数据库中检索总计 57 个合成的数据。
单击计算图按钮以生成两种亚型的叠加图,并评估两种PSA亚型的糖组差异。转到网站 www.unilectin。eu,然后单击UniLectin3D按钮。
单击聚糖搜索按钮,然后单击代表唾液酸的紫色菱形,提示显示所有以存储在数据库中的唾液酸结尾的聚糖结合基序。单击 3-唾液基-LN 二型基序以提示显示所有凝集素,其中 3D 结构确认了与 3-唾液基-LN 二型的相互作用是已知的。按字段搜索选项。
在物种领域中,输入智人。单击“探索 X 射线结构”按钮以过滤掉原始列表。只剩下一个条目,即人类半乳糖凝集素-8。
单击查看3D结构和信息按钮,以显示人半乳糖凝集素-8与3-唾液酰-LN第二型相互作用的详细信息。访问页面上显示的关于人半乳糖凝集素-8的结构信息,其中包含两个不同的查看器。握住鼠标将分子转过来,并使用LiteMol软件将配体带到前面。
将鼠标悬停在左侧列出的交互组件上,以更新右侧的视图,并使用 PLIP 软件找到该特定交互在结构中的作用。通过直接转到此页面上引用的文章,从GlyConnect主页浏览HGI数据集。单击参考条目页面右侧的 Compozitor 链接以评估数据集的一致性。
搜索字段将已填充与工具的高级选项卡中的 DOI 号相等的参考。在 DOI 号后键入 glycan_type=O 链接,将搜索范围缩小到 O-链接聚糖。然后单击“添加到选择”按钮以从数据库中检索数据。
保持选中“包括虚拟节点”选项,然后单击计算图形按钮以显示连接组合的图形。转到GlyConnect Compozitor的蛋白质选项卡,从蛋白质列表中选择α间胰蛋白酶抑制剂重链H4。确保物种选择默认为智人。取消选择聚糖型中的 N-Linked。
在站点列表中选择仅选择 THR 725,然后单击添加到选择按钮。然后单击计算图形按钮以显示连接的组合的图形。要理解虚拟节点,请单击图表下方的导出按钮。
仅选择虚拟并单击剪贴板图标以复制八个合成的选择。将所选内容粘贴到 Compozitor 的自定义选项卡的查询窗口中。在组合物字段中设置选择标签,在聚糖类型字段中选择O-Linked,然后单击添加到选择按钮。
最后,单击计算图形按钮。蛋白质和聚糖之间的组织依赖性关联显示在GlyConnect Octopus的输出中。所有携带杂交和唾液基化聚糖结构的人类蛋白质及其表达的组织都显示在此输出中。
与尿液的关联突出显示了两种蛋白质,脉络膜促性腺激素或GLHA人和PSA普通亚型或KLK3人,与分散的聚糖结构相连。同样,突出显示了与的关联,显示了与分组聚糖结构相连的 PSA 的两种蛋白质亚型。PSA的两种亚型的叠加N-糖组显示在GlyConnect Compozitor的输出中。
蓝色节点表示与共同同种型相关的聚糖,高Pi同种型的聚糖表示为红色节点。糖组之间的重叠显示为洋红色节点。节点内的数字表示根据GlyConnect数据库关于PSA的内容与标记组合物匹配的聚糖结构的数量。
GlyConnect中显示的PSA糖组通过3-唾液腺素-LN型二终端表位显示与UniLectin3D中显示的半乳糖凝集素-8相关。这为聚糖介导的蛋白质 - 蛋白质相互作用提供了可能但不能保证的情况。检查了一组与人血清相关的高质量O-聚糖组合物,并与GlyConnect数据库内容进行了比较,从而提供了定制聚糖组合物文件的选项,用于糖肽的精制鉴定。
它可以依赖于一个数据集中可用的20个合成的最小集合,也可以通过在GlyConnect中合理收集的23到26个项目来增强,以增强集合的一致性。从这个协议中,重要的是要记住,糖组不能局限于项目列表。恰恰使用glycoinformatics工具,您可以显示这些项目之间的依赖关系,这些依赖关系最终将解释它们的功能。