JoVE Logo

登录

需要订阅 JoVE 才能查看此. 登录或开始免费试用。

本文内容

  • 摘要
  • 摘要
  • 引言
  • 研究方案
  • 结果
  • 讨论
  • 披露声明
  • 致谢
  • 材料
  • 参考文献
  • 转载和许可

摘要

固有动力学可视化工具是一个交互式可视化包,可连接到基因调控网络推理工具,以增强、简化功能网络模型的生成。可视化工具可用于为推理工具的参数化做出更明智的决策,从而提高对结果模型的信心。

摘要

开发基因调控网络模型是系统生物学中的主要挑战。已经开发了几种计算工具和管道来应对这一挑战,包括新开发的固有动力学管道。固有动力学管道由几个以前发布的工具组成,这些工具协同工作并以线性方式连接,其中一个工具的输出随后用作下一个工具的输入。与大多数计算技术一样,固有动力学管道的每个步骤都要求用户对没有精确生物学定义的参数进行选择。这些选择可以极大地影响分析产生的基因调控网络模型。因此,在每一步可视化和探索各种参数选择的后果的能力有助于提高对选择和结果的信心。固有动态可视化工具是一个全面的可视化包,通过 Web 浏览器中的交互式界面简化了评估参数选择的过程。用户可以单独检查管道每个步骤的输出,根据视觉信息进行直观的更改,并从为固有动力学管道自动生成必要的输入文件中受益。固有动力学可视化工具为从时间序列转录组学数据中发现基因调控网络提供了无与伦比的访问水平, 以访问高度复杂的工具。

引言

许多重要的生物过程,如细胞分化和环境反应,由基因调节网络(GRN)中相互作用的基因集控制。这些GRN产生激活和维持它们控制的表型所需的转录动力学,因此识别GRN的组分和拓扑结构是理解许多生物过程和功能的关键。GRN可以被建模为一组相互作用的基因和/或基因产物,这些基因和/或基因产物由一个网络描述,其节点是基因,其边缘描述了相互作用的方向和形式(例如,转录的激活/抑制,翻译后修饰等)。1.然后,相互作用可以表示为参数化的数学模型,描述调节基因对其靶标产生的影响234。GRN 模型的推理既需要推断交互网络的结构,也需要估计底层交互参数。已经开发了多种计算推理方法,用于摄取时间序列基因表达数据并输出GRN模型5。最近,开发了一种新的GRN推理方法,称为固有动力学管道(IDP),该方法利用时间序列基因表达数据来生成具有标记调节因子 - 靶标相互作用的GRN模型,这些模型能够产生与基因表达数据中观察到的动力学相匹配的动力学6。IDP是一套线性连接到管道中的工具,可以分为三个步骤:节点查找步骤,根据已知或怀疑与GRN78的功能相关的基因表达特征对基因进行排名,边缘发现步骤对成对调节关系进行排名89,以及一个网络查找步骤,该步骤生成能够生成观察到的动态的 GRN 模型101112131415

与大多数计算方法一样,IDP 需要一组用户指定的参数,这些参数指示如何分析输入数据,并且不同的参数集可以对同一数据产生不同的结果。例如,包括 IDP 在内的几种方法包含对数据应用某个阈值的参数,在特定方法的连续运行之间增加/减少此阈值可能会导致运行之间的结果不同(请参见补充说明 10:网络推理方法 5)。了解每个参数如何影响分析和后续结果对于实现对结果的高置信度非常重要。与大多数 GRN 推理方法不同,IDP 由多个计算工具组成,每个工具都有自己的一组参数,用户必须指定这些参数,并且每个工具都有自己的结果。虽然 IDP 提供了有关如何参数化每个工具的大量文档,但每个工具与上一步输出的相互依赖性使得在没有中间分析的情况下对整个管道进行参数化具有挑战性。例如,边缘和网络查找步骤中的论点可能由先前的生物学知识提供信息,因此将取决于数据集和/或生物体。要询问中间结果,需要对编程有基本的了解,并且需要深入了解IDP的所有结果文件及其内容。

固有动态可视化工具 (IDV) 是一个交互式可视化包,它在用户的浏览器窗口中运行,为 IDP 的用户提供了一种方法来评估其参数选择对 IDP 中任何步骤的结果的影响。IDV 导航由 IDP 生成的复杂目录结构,并为每个步骤收集必要的数据,并以直观和交互式的图形和表格呈现数据,供用户浏览。在浏览了这些交互式显示之后,用户可以从 IDP 步骤生成新数据,这些数据可以基于更明智的决策。然后,这些新数据可以立即用于 IDP 的下一个相应步骤。此外,浏览数据有助于确定是否应使用调整的参数重新运行 IDP 步骤。IDV可以增强IDP的使用,并使IDP的使用更加直观和平易近人,正如研究酵母细胞周期的核心振荡器GRN所证明的那样。以下协议包括来自完全参数化的 IDP 运行的 IDP 结果,以及在每个 IDP 步骤(即节点、边缘和网络查找)运行后合并 IDV 的方法。

Access restricted. Please log in or start a trial to view this content.

研究方案

1. 安装 IDP 和 IDV

注意:本节假设 Docker、conda、pip 和 git 已经安装(材料表)。

  1. 在终端中,输入命令: git clone https://gitlab.com/biochron/inherent_dynamics_pipeline.git。
  2. 按照 IDP 的自述文件中的安装说明进行操作。
  3. 在终端中,输入命令: git clone https://gitlab.com/bertfordley/inherent_dynamics_visualizer.git。
    注意:IDV 的克隆应在 IDP 的顶级目录之外进行。
  4. 按照 IDV 自述文件中的安装说明进行操作。

2. 节点查找

  1. 创建一个新的 IDP 配置文件,用于参数化"节点查找"步骤。
    注意:不应键入以下步骤中的所有引号。引号在这里仅用作协议文本和要键入的内容之间的分隔符。
    1. 将主 IDP 参数添加到配置文件中。
    2. 在文本编辑器中打开一个新的文本文件,然后在单独的行上键入"data_file ="、"annotation_file ="、"output_dir ="、"num_proc ="和"IDVconnection = True"。
    3. 对于"data_file",在等号之后,键入相应时间序列文件的路径和名称,并在名称后键入逗号。如果正在使用多个时序数据集,则用逗号分隔每个数据。有关时间序列基因表达文件的示例,请参阅补充文件 1 和补充文件 2。
    4. 在"annotation_file"的等号后键入注释文件的路径和名称。有关注释文件的示例,请参见 补充文件 3
    5. 对于"output_file",在等号后,键入将保存结果的文件夹的路径和名称。
    6. 在等号之后,对于"num_proc",键入 IDP 应使用的进程数。
    7. 将"节点查找"参数添加到配置文件中。
    8. 在与步骤 2.1.1 相同的文本文件中,按在各行上显示的顺序键入"[dlxjtk_arguments]"、"句点 ="和"dlxjtk_cutoff ="。将它们放在主要参数之后。
    9. 对于"周期",在等号之后,如果使用一次性序列数据集,请键入每个周期长度,以逗号分隔。对于多个时间序列数据集,请像以前一样键入每组周期长度,但在每个集合周围放置方括号,并在集合之间放置逗号。
    10. 在等号之后,对于"dlxjtk_cutoff",键入一个整数,指定de Lichtenberg通过JTK_CYCLE输出gene_list_file中保留的最大基因数(DLxJTK)(表1)。
      注意:强烈建议查看 IDP 自述文件中的dlxjtk_arguments部分,以便更好地了解每个参数。有关指定了"节点查找"参数的配置文件的示例,请参阅 补充文件 4
  2. 在终端中,移动到名为 inherent_dynamics_pipeline 的 IDP 目录。
  3. 在终端中,输入命令: conda 激活 dat2net
  4. 通过在终端中运行此命令,使用在步骤 2.1 中创建的配置文件运行 IDP,其中<配置文件名>是文件的名称: python src/dat2net.py
  5. 在终端中,移动到名为 inherent_dynamics_visualizer 的目录,然后输入命令:。/viz_results.sh
    注意:将指向用作 IDP 输出目录的目录。
  6. 在 Web 浏览器中,输入 http://localhost:8050/ 作为 URL。
  7. 现在在浏览器中打开 IDV 后,单击" 节点查找 "选项卡,然后从下拉菜单中选择感兴趣的节点查找文件夹。
  8. 从 IDV 的基因列表表中手动整理新的基因列表,以用于后续的 IDP 步骤。
    1. 要扩展或缩短基因列表表,请单击向上或向下箭头,或在 DLxJTK排名基因的基因表达旁边的框中手动输入1到50之间的整数。顶部:.
    2. 在基因列表表中,单击基因旁边的框,以折线图形式查看其基因表达谱。可以添加多个基因。
    3. (可选)指定大小相等的条柱的数量,并按包含其峰值表达的时间间隔对基因进行排序,方法是在标记为"输入整数"的基因列表表上方的输入框中输入一个 整数,将第一个周期划分为 bins:
      注:此选项特定于振荡动态,可能不适用于其他类型的动态。
    4. 通过单击" 基因排序依据:第一周期最大表达量 "(表1)下的选项来选择热图查看首选项,该选项根据第一个周期中基因表达峰的时间对基因进行排序。
      注意: DLxJTK Rank 根据 IDP 的 DLxJTK 算法的周期性排名对基因进行排序。
    5. 单击" 下载基因列表 "按钮,将基因列表下载为"边缘查找"步骤所需的文件格式。有关基因列表文件的示例,请参见 补充文件 5
  9. "可编辑的基因注释表"中,将基因标记为靶标和/或调节因子,用于新"边缘查找"运行中"边缘查找"步骤。如果基因是调节因子,则将基因标记为激活剂、抑制因子或两者兼而有之。
    1. 要将基因标记为激活剂,请单击tf_act列中的细胞并将值更改为1。要将基因标记为抑制因子,请将tf_rep列中的值更改为 1。在边缘查找步骤中,通过将tf_act和tf_rep列中的值设置为1,将允许基因同时充当激活剂和抑制因子。
    2. 要将基因标记为靶标,请单击靶列中的细胞并将值更改为1。
  10. 单击" 下载注释文件" 按钮,将注释文件下载为"边缘查找"步骤所需的文件格式。

3. 边缘查找

  1. 创建一个新的 IDP 配置文件,用于参数化"边缘查找"步骤。
    1. 将主 IDP 参数添加到配置文件中。在文本编辑器中打开一个新的文本文件,然后重复步骤 2.1.1。
    2. 将边缘查找参数添加到配置文件中。
    3. 在与步骤 3.1.1 相同的文本文件中,按在各个行上显示的顺序键入"[lempy_arguments]"、"gene_list_file ="、"[netgen_arguments]"、"edge_score_column ="、"edge_score_thresho ="、"num_edges_for_list ="、"seed_threshold ="和"num_edges_for_seed ="。这些应该低于主要论点。
    4. 对于"gene_list_file",在等号之后,输入步骤2.8.5中生成的基因列表文件的路径和名称。
    5. 对于"edge_score_column",在等号之后输入"pld"或"norm_loss"以指定使用 lempy 输出中的哪个数据框列来过滤边缘。
    6. 选择"edge_score_threshold"或"num_edges_for_list",然后删除另一个。如果选择了"edge_score_threshold",请输入一个介于 0 和 1 之间的数字。此数字将用于根据步骤 3.1.5 中指定的列筛选边缘。
      1. 如果选择了"num_edges_for_list",请输入一个等于或小于可能边数的值。此数字将用于根据边在步骤 3.1.5 中指定的列中的排名来筛选边。剩余的边缘将用于在网络查找中构建网络。
    7. 选择"seed_threshold"或"num_edges_for_seed",然后删除另一个。如果选择了"seed_threshold",请输入一个介于 0 和 1 之间的数字。此数字将用于根据步骤 3.1.5 中指定的列筛选边缘。
      1. 如果选择了"num_edges_for_seed",请输入一个等于或小于可能边数的值。此数字将用于根据边在步骤 3.1.5 中指定的列中的排名来筛选边。剩余的边缘将用于构建网络查找中使用的种子网络(表 1)。
        注意:强烈建议您查看 IDP 自述文件中的lempy_arguments和netgen_arguments部分,以便更好地了解每个参数。有关指定了 Edge 查找参数的配置文件的示例,请参阅 补充文件 7
  2. 重复步骤 2.2 和 2.3。
  3. 通过在终端中运行此命令,使用在步骤 3.1 中创建的配置文件运行 IDP,其中<配置文件名>是文件的名称: python src/dat2net.py
  4. 如果 IDV 仍在运行,请按终端窗口中的 Control C 停止程序。重复步骤 2.5 和 2.6。
  5. 在浏览器中打开 IDV 后,单击" 边缘查找 "选项卡,然后从下拉菜单中选择感兴趣的边缘查找文件夹。
    注意:如果在边缘查找中使用了多个数据集,请确保选择在本地边缘计算机 (LEM) 分析中使用的最后一个数据集(表 1)。在根据 LEM 结果为种子网络或边缘列表选择边缘时,查看配置文件中列出的上一个时间序列数据非常重要,因为此输出在其对节点之间调节关系的推断中合并了所有前面的数据文件。
  6. 要扩展或缩短边表,请在输入框中 的"边数:"下手动输入一个整数。
  7. (可选)过滤 LEM ODE 参数上的边缘。单击并拖动以移动每个参数滑块的左侧或右侧,以从边缘表中删除参数超出其新允许参数边界的边缘。
  8. 如果需要与 IDP 提议的种子网络不同的种子网络,则可选择创建新的种子网络。有关种子网络文件的示例,请参阅 补充文件 8
    1. 选择"从种子"以选择种子网络,或从"网络:"下拉菜单中选择"从选择"
    2. 通过单击每个边相邻的相应复选框从种子网络中删除/添加边,从边表中取消选择/选择边。
  9. 单击" 下载 DSGRN NetSpec "按钮,以"由监管网络生成的动态特征码"(DSGRN)(表 1)网络规范格式下载种子网络。
  10. 选择要在网络查找步骤中使用的其他节点和边。
    1. 通过单击要包含在网络查找中使用的边缘列表文件中的相应复选框,从边缘表中选择边。
    2. 单击" 下载节点和边缘列表" ,以在网络查找中使用所需的格式下载节点列表和边缘列表文件。有关边缘和节点列表 文件 的示例,请参阅 补充文件 9 和补充文件 10
      注意:节点列表必须包含边缘列表文件中的所有节点,因此 IDV 会根据所选边缘自动创建节点列表文件。有两个选项可用于查看"边缘查找"中的边。 "LEM 汇总表" 选项将边显示为前 25 条边的排名列表。 顶线LEM表 显示了每个可能的稳压器的前三个排名边的串联列表中的边缘。用户可以通过更改"边数"输入框中的数字来调整每个选项查看 的边数

4. 网络查找

  1. 创建一个新的 IDP 配置文件,用于参数化"网络查找"步骤。
    1. 将主 IDP 参数添加到配置文件中。在文本编辑器中打开一个新的文本文件,然后重复步骤 2.1.1。
    2. 将网络查找参数添加到配置文件。
    3. 在与步骤 4.1.1 相同的文本文件中,在主参数下方的各个行上按显示的顺序键入"[netper_arguments]"、"edge_list_file ="、"node_list_file ="、"seed_net_file ="、"range_operations ="、"numneighbors ="、"maxparams ="、"[[probabilities]]"、"addNode ="、"addEdge ="、"removeNode ="和"removeEdge ="。
    4. 对于"seed_net_file"、"edge_list_file"和"node_list_file",在等号后,输入种子网络文件的路径和名称,以及步骤 3.9 和 3.10.2 中生成的边缘和节点列表文件。
    5. 在"等于"后,对于"range_operations",键入两个以逗号分隔的数字。第一个和第二个数字分别是每个网络添加或删除节点或边缘的最小和最大数量。
    6. 对于"numneighbors",在等号之后,输入一个数字,表示在"网络查找"中要查找的网络数。
    7. 对于"maxparams",在等号之后输入一个数字,表示允许网络的最大 DSGRN 参数数。
    8. 为每个参数输入 0 和 1 之间的值:"addNode"、"addEdge"、"removeNode"和"removeEdge",在等号后面。数字之和必须为 1。
      注意:强烈建议查看 IDP 自述文件中的netper_arguments和netquery_arguments部分,以便更好地了解每个参数。有关指定了 " 网络查找"参数的配置文件的示例,请参阅 补充文件 11 和补充文件 12
  2. 重复步骤 2.2 和 2.3。
  3. 通过在终端中运行此命令,使用在步骤 4.1 中创建的配置文件运行 IDP,其中<配置文件名>是文件的名称: python src/dat2net.py
  4. 如果 IDV 仍在运行,请按终端窗口中的 Control C 停止程序。重复步骤 2.5 和 2.6。
  5. 在浏览器中打开 IDV 后,单击" 网络查找 "选项卡,然后选择感兴趣的网络查找文件夹。
  6. 选择一个网络或一组网络以生成边缘流行率表(表 1),并查看网络及其各自的查询结果。
    1. 有两个选项可用于选择网络:选项 1 - 通过在与图的 x 轴和 y 轴对应的输入框中输入最小值和最大值来输入查询结果的下限和上限。选项 2 - 单击并拖动散点图,以在要包含的网络周围绘制一个框。输入选择或输入边界后,按 从所选网络获取边缘流行度 按钮。
      注意:如果指定了多个 DSGRN 查询,请使用标有查询类型的单选按钮在每个查询的结果之间切换。如果指定了多个 epsilon(噪声级别),则同样适用。
  7. 单击边缘流行度表下方的箭头可移动到表的下一页。按 下载表 下载边缘流行度表。
  8. 在"网络索引"输入框中输入一个整数,以显示步骤 4.6 中所做的选择中的单个网络。单击" 下载 DSGRN NetSpec" 以 DSGRN 网络规范格式下载显示的网络。
  9. 搜索网络以查找与指定主题或感兴趣网络的相似性。
    1. 使用与每个边对应的复选框来选择要包括在用于相似性分析的网络或基序中的边。 单击提交 ,为所选图案或网络创建相似性散点图。
      注意:使用边缘列表中的箭头按字母顺序排序,使用表格下方的箭头移动到表格的下一页。
    2. 单击并拖动散点图,在要包含的网络周围绘制一个框,以选择一个网络或一组网络以生成边缘流行度表并查看网络及其各自的查询结果。
      注意:如果指定了多个 DSGRN 查询,请使用标有查询类型的单选按钮在每个查询的结果之间切换。如果指定了多个 epsilon(噪声级别),则同样适用。
    3. 重复步骤 4.7 和 4.8,分别下载边缘流行率表和显示的网络以进行相似性分析。

Access restricted. Please log in or start a trial to view this content.

结果

将上述文本描述的步骤和 图1 中以图形方式描述的步骤应用于酵母细胞周期的核心振荡GRN,以查看是否有可能发现能够产生在酵母细胞周期研究中收集的时间序列基因表达数据中观察到的动力学的功能性GRN模型16。为了说明IDV如何澄清和改善IDP输出,在以两种方式执行此分析后,对结果进行了比较:1)在没有IDV的情况下一次性运行IDP的所有步骤,以及2)借?...

Access restricted. Please log in or start a trial to view this content.

讨论

GRN的推断是系统生物学中的一个重要挑战。IDP使用一系列工具从基因表达数据中生成模型GRN,这些工具以越来越复杂的方式利用数据。每个步骤都需要决定如何处理数据以及哪些元素(基因,功能相互作用)将传递给IDP的下一层。这些决定对国内流离失所者结果的影响并不那么明显。为了在这方面提供帮助,IDV 提供了 IDP 中 GRN 推理工具各个步骤的输出的有用交互式可视化。IDV简化并促进了评估?...

Access restricted. Please log in or start a trial to view this content.

披露声明

作者没有什么可透露的。

致谢

这项工作由NIH拨款R01 GM126555-01和NSF拨款DMS-1839299资助。

Access restricted. Please log in or start a trial to view this content.

材料

NameCompanyCatalog NumberComments
Dockerhttps://docs.docker.com/get-docker/
Githttps://git-scm.com/
Inherent Dynamics Pipelinehttps://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizerhttps://gitlab.com/bertfordley/inherent_dynamics_visualizer
Minicondahttps://docs.conda.io/en/latest/miniconda.html
Piphttps://pip.pypa.io/en/stable/

参考文献

  1. Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
  2. Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
  3. Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
  4. Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
  5. Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
  6. Inherent Dynamics Pipeline. , Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021).
  7. Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
  8. LEMpy. , Available from: https://gitlab.com/biochron/lempy (2021).
  9. McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214(2016).
  10. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
  11. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
  12. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549(2018).
  13. DSGRN. , Available from: https://github.com/marciogameiro/DSGRN (2021).
  14. Dsgm_Net_Gen. , Available from: https://github.com/breecummins/dsgrn_net_gen (2021).
  15. Dsgrn_Net_Query. , Available from: https://github.com/breecummins/dsgrn_net_query (2021).
  16. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  17. Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
  18. de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
  19. Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
  20. Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
  21. Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
  22. Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
  23. Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
  24. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Access restricted. Please log in or start a trial to view this content.

转载和许可

请求许可使用此 JoVE 文章的文本或图形

请求许可

探索更多文章

178

This article has been published

Video Coming Soon

JoVE Logo

政策

使用条款

隐私

科研

教育

关于 JoVE

版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。