该协议通过实现病毒的工程化、多样化和分层,缩小了病毒的自然进化与其用作人类基因治疗重组载体之间的显着差距。该技术允许对新型、分离或工程化的腺相关病毒(简称AAV)变体进行高通量并行筛选,从而节省动物数量、工作、成本和时间。已鉴定的AVV衣壳变体可以提高基于AAV的治疗性转基因递送的功效和特异性,从而减少所需的病毒剂量。
这可以提高基因治疗的安全性和适用性。同样的方法也可以用于其他基因递送载体的衣壳或启动子工程,从而提高我们对它们的生物学及其在基因治疗中的应用的理解。帮助演示该程序的将是博士生Jonas Becker和Jixin Liu,博士后Joanna Szumska和Margarita Zayas,以及我实验室的研究助理Emma Gerstmann和Ellen Widtke。
首先使用 Python 3 和 Biopython 分析 NGS 测序数据。NGS分析由两个步骤组成。第一步,使用脚本 1 在序列文件中搜索满足特定条件(如侧翼序列、长度和位置)的序列,以及提供所需信息的配置文件。
对于第二步,使用第二个脚本以及配置和 zuordnung 从 AGWGGC 序列开始翻译提取的序列。提供所需信息的 TXT 文件。准备两个文件夹:脚本和数据。
将排序产生的 Gzip 压缩文件复制到数据文件夹。然后将 Python 和配置文件复制到脚本文件夹中,如文本手稿中所述。在运行脚本之前,请打开 zuordnung。
txt 文件并添加两个制表符分隔的列。在第一列中输入 Gzip 文件的名称,在第二列中输入所需的最终名称。按照文本手稿中的说明更改配置文件中的变量。
使用特定命令,启动变异序列检测和提取。输出将是TXT文件,其中包含提取的DNA序列及其读取次数。此文件的标头包含统计数据,这些数据将传输到以下文件。
这些 TXT 数据将成为第二个脚本的输入文件,其中 DNA 序列被翻译、排名和分析。使用特定命令,按照文本手稿中所述,启动脚本一的文本输出文件的PV翻译和分析。第二个脚本的输出文件将使用 zuordnung 中查找表的第二列命名。
TXT 带有基于分析类型的扩展名。确保三个输出文件在第一行和第一列中包含统计数据,其中包含输入文本文件中每个 DNA 序列的索引。其余列应由DNA序列,读取次数,正向或反向读取以及翻译的肽序列组成。
无效序列应具有 NA,并且在最后两列中无效。根据用户的需求,使用可用的软件可视化输出文件。为了使用 Python 3 中的自定义代码对 NGS 测序数据进行分析,工作流程包括检测由侧翼序列、其长度和位置引导的条形码序列,以及分析一组组织的条形码富集和分布。
准备两个文件夹:脚本和数据。将排序产生的 Gzip 压缩文件复制到数据文件夹。然后将 python 和配置文件复制到脚本文件夹中,如文本手稿中所述。
在执行脚本之前,请创建两个制表符分隔的文本文件:衣壳方差。txt 文件,其中包含分配给 AAV 衣壳变体名称的条形码序列以及污染。TXT 文件,其中包含可能来自污染的条形码序列。
最后,编辑配置文件以包括包含排序数据的文件夹路径信息、条形码侧翼区域的序列、它们的位置以及条形码检测的窗口大小。使用相应的命令使用提供的路径和配置文件执行条形码检测脚本。此命令执行的输出将是 TXT 文件,其中包含每个衣壳变体的重新计数以及从原始数据中恢复的读取总数。
评估条形码AAV衣壳在组织或器官中的分布,在左旋律中。TXT文件中,将从条形码检测运行中获得的每个文本文件的名称分配给组织或器官名称。在第一列中添加文本文件的名称,并在制表符分隔的分配中添加相应的组织或器官名称。
创建一个器官。TXT文件,其中包含目标上和目标外器官的名称列表,这些名称对应于分配中给出的名称。txt 文件。
然后创建normalization_organ。TXT 和normalization_variant。TXT 选项卡分隔的文本文件,其中包含所有衣壳变体以及所有器官和组织的规范化值。
在带有normalization_organ的第一列中。txt 文件,写下为每个器官给出的名称,第二列带有相应组织的归一化值。填充normalization_variant的第一列。
TXT 文件包含衣壳名称列表,第二列包含池库中每个衣壳的读取计数的规范化值。通过指定所有其他文件的完整路径来编辑配置文件,并使用此特定命令执行条形码分析脚本。条形码分析脚本输出多个文件,例如基于前面描述的多个归一化步骤在不同组织内衣壳分布的相对浓度或RC值的文本文件,以及将文本文件数据合并为合并矩阵数据的电子表格文件。
可视化数据并对矩阵数据进行聚类分析,如文本手稿中所述。脚本将输入相对浓度。XLS 文件并生成分层聚类热图和主成分分析的两个图。
若要修改图或 PNG 参数,请打开 R 脚本并按照注释部分中的说明进行操作。AAV2 rep基因的定量区域显示99.2%的ITR呈阳性,表明AAV衣壳含有整个病毒基因组。在所有三组中,基于特定于库的特征序列提取的读段约占总读段的94%,表明质量良好。
其中,超过99%是有效的PV读取,超过99%的有效PV读取是唯一的,这表明该库具有高内部多样性的平衡。热图层次结构的两个主要分支反映了衣壳变体转导效率的差异。具有大多数衣壳变体的左分支包括所有衣壳,这些衣壳在大多数组织中显示出较高的相对浓度值。
除了惊人的高肝脏特异性外,其他三种衣壳在横膈膜、骨骼肌、二头肌和大脑中表现出特异性。分层聚类的右分支包括衣壳变体,其整体转导效率较低,在十二指肠和胰腺中最为明显。原始亚群的主成分分析形成了具有高肝脏特异性的衣壳变异簇,并概述了VAR60衣壳出色的肌肉嗜性。
尝试此协议时,您需要注意键入错误。与 Linux 相比,如果您使用的是 Windows 命令提示符,语法也会有所不同。在鉴定出新的AAV变体后,需要在已故或更大的动物模型中验证治疗和转化潜力。
该技术能够在相同条件下直接并排比较AAV变体,并且用途广泛,为其在大型动物甚至人类中的翻译铺平了道路。