Method Article
该协议提供了用硫酸二甲酯修饰RNA以进行突变分析实验的说明。它包括使用两种替代文库制备方法进行的 体外 和 体内 探测。
RNA结构在几乎任何生物过程中的作用都变得越来越明显,特别是在过去十年中。然而,解决RNA结构的经典方法,如RNA晶体学或冷冻电镜,未能跟上快速发展的领域和对高通量解决方案的需求。使用硫酸二甲酯 (DMS) 进行测序的突变分析 MaPseq 是一种基于测序的方法,用于从碱基与 DMS 的反应性推断 RNA 结构。当碱基未配对时,DMS在其Watson-Crick面上甲基化腺苷中的N1氮和胞嘧啶中的N3。用热稳定的II组内含子逆转录酶(TGIRT-III)逆转录修饰的RNA导致甲基化碱基作为突变掺入cDNA。当对所得cDNA进行测序并将其映射回参考转录本时,每个碱基的相对突变率表明碱基的"状态"为配对或未配对。尽管DMS反应性在 体外 和细胞中都具有很高的信噪比,但这种方法对处理程序中的偏差很敏感。为了减少这种偏差,本文提供了一种在细胞中使用DMS和 体外 转录RNA进行RNA处理的方案。
自从发现RNA同时具有结构1,2和催化3性质以来,RNA的重要性及其在众多生物过程中的调节功能逐渐被揭示。事实上,RNA结构对基因调控的影响越来越受到关注4。与蛋白质一样,RNA具有一级,二级和三级结构,分别指核苷酸的序列,碱基配对相互作用的2D映射以及这些碱基配对结构的3D折叠。虽然确定三级结构是理解RNA依赖性过程背后的确切机制的关键,但二级结构在RNA功能方面也提供了大量信息,并且是进一步3D折叠的基础5。
然而,使用传统方法确定RNA结构具有固有的挑战性。虽然对于蛋白质,晶体学,核磁共振(NMR)和低温电子显微镜(cryo-EM)已经可以确定结构基序的多样性,允许仅从序列6进行结构预测,但这些方法并不广泛适用于RNA。事实上,RNA是具有构建块(核苷酸)的柔性分子,与氨基酸对应物相比,具有更大的构象和旋转自由度。此外,通过碱基配对的相互作用比氨基酸残基的相互作用更具动态性和多功能性。因此,经典方法仅对具有明确定义、高度紧凑结构的相对较小的RNA成功7。
确定RNA结构的另一种方法是通过化学探测结合二代测序(NGS)。该策略生成有关RNA序列中每个碱基的结合状态(即其二级结构)的信息。简而言之,RNA分子中不参与碱基配对的碱基被小化合物差异修饰。用专门的逆转录酶(RT)逆转录这些RNA将修饰作为突变整合到互补的脱氧核糖核酸(cDNA)中。然后通过聚合酶链反应(PCR)扩增这些cDNA分子并进行测序。为了获得有关其结合或未结合的"状态"的信息,计算感兴趣的RNA中每个碱基的突变频率,并将其作为约束输入结构预测软件8。基于最近邻规则9 和最小自由能计算10,该软件生成最适合所获得的实验数据11,12 的结构模型。
DMS-MaPseq使用DMS,其以高度特异性的方式甲基化沃森-克里克面腺苷中的N1氮和胞嘧啶中的N3氮13。在逆转录中使用热稳定的II组内含子逆转录酶(TGIRT-III)可创建具有前所未有的信噪比的突变谱,甚至允许对由两个或多个替代构象产生的重叠谱进行反卷积14,15。此外,DMS可以穿透细胞膜和整个组织,使得在生理环境中进行探测成为可能。然而,高质量数据的生成具有挑战性,因为处理程序的变化会影响结果。因此,我们为 体外 和细胞内DMS-MaPseq提供了详细的方案,以减少偏差并指导新人通过他们可能遇到的困难。特别是鉴于最近的SARS-CoV2大流行,RNA病毒的高质量数据是研究基因表达和寻找可能治疗方法的重要工具。
注意:有关本协议中使用的所有材料、软件、试剂、仪器和细胞的详细信息,请参阅 材料表 。
1. 基因特异性 体外 DMS-MaP
图 1:大型 DMS 处理片段的 RT-PCR 实验装置。 当对修饰的RNA进行逆转录时,不会记录引物退火序列上的修饰。因此,当片段长度超过400-500 bp时,需要设计在引物区域中重叠的片段,如此处的示例所示。片段的长度取决于测序需求。当使用配对末端150循环测序时,片段不应超过300 bp。缩写:RT-PCR = 逆转录聚合酶链反应;DMS = 硫酸二甲酯。 请点击此处查看此图的大图。
2. 使用病毒感染细胞的全基因组DMS-MaP
注意:在细胞中,DMS处理也可以与上述基因特异性扩增方法结合使用。全基因组文库需要巨大的测序深度才能实现对单个基因的完全覆盖。然而,如果病毒RNA在提取后占核糖耗尽RNA的很大一部分,则全基因组测序将是合适的。此外,其他富集方法可以与全基因组文库生成方法结合使用。
3. 测序数据分析
注意:要从DMS-MaP测序数据创建RNA二级结构模型,必须通过几个不同的步骤处理生成的.fastq文件。这些步骤可以使用
基因特异性 体外 DMS-MaP
为了研究SARS2的5'UTR,病毒的前300 bp作为gBlock序列与三个引物一起订购。其中包括两个通过PCR 繁殖 片段的引物("FW"和"RV"),以及一个用于连接T7启动子("FW-T7")的引物。这些序列如 表1所示。
名字 | 序列 (5'->3') |
固件 | ATTAAAGGTTTATACCTTCCCAGGTAAC |
房车 | GCAAACTGAGTTGGACGTGT |
固件-T7 | TAATACGACTCACTATAGG ATTAAAGGTTTATACCTTCCCAGGTAAC |
表1:SARS-CoV2 5'UTR的DMS-MaP RT-PCR引物序列。 在这里,需要FW-T7和RV来生成用于 体外 转录的DNA模板,RV用于逆转录,FW-RV引物对用于随后的cDNAPCR扩增。引物退火到SARS-CoV2基因组(FW)的起点和感兴趣区域下游的序列。缩写:DMS-MaP = 使用硫酸二甲酯测序的突变分析;RT-PCR = 逆转录聚合酶链反应;SARS-CoV2 = 严重急性呼吸综合征-冠状病毒 2;UTR = 未翻译区域;RV = 反向底漆;FW = 正向引物。
为了从gBlock片段生成RNA,根据 图2A所示的方案,使用PCR预混料使用重叠PCR连接T7聚合酶启动子的序列。从细长的片段中,使用T7转录试剂盒生成RNA。随后使用DNase和RNA Clean&Concentrator柱分离的RNA消化DNA模板。
体外转录的质量控制是通过在1%琼脂糖凝胶和ssRNA分子量标准上运行RNA产物来完成的。由于只有一个可见的条带,因此进行了体外DMS探测和RT-PCR(见图2B)。
为了验证PCR反应的成功,使用dsDNA分子量标准在2%琼脂糖凝胶上运行样品。索引后,条带在同一凝胶上的运行速度应高出~150 bp,考虑到索引引物的大小。
图 2:DNA 模板的 体外 转录。 (一)为了在 体外 转录尚未具有内在RNA聚合酶启动因子的DNA模板,必须首先通过重叠PCR连接模板。这是通过使用正向引物来完成的,该引物包括与所需片段重叠的第一碱基上游的序列TAATACGACTCACTATAGG(在T7 RNA聚合酶的情况下)。此处带下划线的碱基象征聚合酶的转录起始位点。一旦启动子附着在dsDNA片段上,它就可以被T7聚合酶转录。重要的是,聚合酶使用与上述启动子序列相对的链作为模板(蓝色),有效地产生与指示启动子序列下游的序列相同的RNA(红色)。(B)具有ssRNA分子量标准(泳道1)和300 nt(泳道2)的 体外 转录RNA产物的1%琼脂糖凝胶。(C) 含有 GeneRuler 1 kb 加分子量标准(泳道 1)的 2% 琼脂糖凝胶,RT-PCR 后的 PCR 产物以 300 bp 运行(泳道 2),文库制备后的索引片段以 470 bp 运行(泳道 3)。缩写:RT-PCR = 逆转录聚合酶链反应;DMS = 硫酸二甲酯;nt = 核苷酸;dsDNA = 双链 DNA;ssRNA = 单链RNA。 请点击此处查看此图的大图。
使用病毒感染细胞的全基因组 体内 DMS-MaP
在DMS治疗之前,HCT-8细胞感染了OC43。当在感染后4天观察到细胞病变效应(CPE)(如图 3A所示)时,处理这些细胞,提取RNA并使其核糖耗尽。当在琼脂糖凝胶上运行总RNA时,可以看到两条明亮的条带,占核糖体的40S和60S亚基,约占总RNA质量的95%(见 图3B)。当RNA提取不成功或被降解(例如,通过多次冻融循环)时,RNA降解产物在凝胶底部可见(参见 图3C,第二泳道)。此外,在rRNA耗竭后,两条亮条带消失,在泳道中留下涂片(参见 图3C,第三泳道)。最后,在文库制备后,样品具有不同的大小分布,并在最终的PAGE凝胶上显示为涂片。切除200个核苷酸(nt)和500 nt之间的条带,与计划用于分析这些文库的150 x 150配对末端测序运行一致。最重要的是,分离出以~150 nt运行的适配器二聚体(见 图3D)。
图3:病毒感染细胞体内DMS-MaP的检查点。 (A)病毒感染的HCT-8细胞的光学显微镜图像,4天dpi。为了从总RNA中获得尽可能高的病毒RNA产量,同时最大限度地减少细胞死亡引起的不利影响,应在CPE开始时甚至在此之前添加DMS,如图所示。(B) 含有 1 μg 总 RNA 的六个样品的 1% 琼脂糖凝胶。在每个泳道中,可以看到两条明亮的条带,分别代表40S和60S亚基,因为核糖体RNA占总RNA的~95%。注意:细胞内DMS处理会导致一些RNA片段化和拖尾,但两个rRNA条带仍然可见。轻度片段化后是可以容忍的,因为在细胞仍然活着时,在DMS孵育期间生成包含甲基化标记的信息并报告RNA结构。(C) GeneRuler 1 kb 的 1% 琼脂糖凝胶加上分子量标准 DNA 标记物(泳道 1)总 RNA,先前在 -80 °C 下储存 6 个月(泳道 2)和核糖耗尽 RNA(泳道 3)。当长时间储存RNA并经过几次冻融循环时,RNA开始降解,可能不应用于探测实验。此外,在核糖耗尽总RNA后,占核糖体40S和60S亚基的两个明亮条带褪色,残留RNA的涂片开始显示。(D) GeneRuler 1 kb 的 PAGE 凝胶加分子量标准 DNA 标记物(泳道 1)和全基因组制备的 RNA 文库样品。应根据测序需要切除凝胶。对于从两侧跨越150个循环的配对末端测序运行,应在300 bp至500 bp之间切除凝胶。应分离出适配器二聚体(以 170 bp 的速度运行)。缩写:DMS-MaP = 使用硫酸二甲酯测序的突变分析;DPI = 感染后天数;CPE = 细胞病变效应。请点击此处查看此图的大图。
排序后,通过向DREEM网络服务器(http://rnadreem.org/)提交作业以及.fasta参考文件来分析.fastq文件。服务器生成的输出包括由fastqc(https://www.bioinformatics.babraham.ac.uk/projects/fastqc/)和TrimGalore(https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/)生成的质量控制文件,以及包含群体平均突变频率的其他输出文件。除了显示具有交互式.html(见图4A)格式的突变频率的图表和一个包含每个碱基的原始反应物的.csv文件和一个可由多个RNA结构预测软件读取的struct_constraint.txt文件外,还包括一个位向量.txt文件报告通过读取突变。据此,通过将.fasta和struct_constraint.txt文件提交给RNAfold网络服务器(http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi)来计算总体平均结构。它使用ViennaRNA软件根据最小自由能生成结构预测,可以在线查看或以ct或Vienna格式下载。为了生成RNA结构模型,将这些可下载文件提交给VARNA(https://varna.lri.fr/,见图4B)。最后,稳定版本的DREEM(https://codeocean.com/capsule/6175523/tree/v1)可以使用bitvector.txt文件来搜索替代的RNA构象。为了使用DREEM获得良好的结构模型,应实现每个碱基10,000个读数的覆盖率;对于群集,每个碱基最多可能需要 100,000 次读取。整个工作流程的概述如图4C所示。
图 4:从 SARS-CoV2 5'UTR 的化学探测实验中获得的示例性数据。 (A) 按碱基着色的 SARS-CoV2 基因组前 300 个碱基的反应性图谱(A:红色、C:蓝色、U:绿色、G:黄色)。原始反应性计算为绝对突变频率除以覆盖率。具有开放构象的碱具有高反应性值;参与碱基配对的碱基反应性值较低。U和G未被DMS修饰,反应性值低,源于聚合酶不忠。预测是用DREEM网络服务器进行的。(B) 根据瓦尔纳的反应性值预测的 SARS-CoV2 5'UTR 的结构模型。具有高反应性值的碱以红色着色;反应性值低的碱基以白色着色。(C)DMS-MaP分析的工作流程,从测序获得的.fastq文件开始。这些可以使用fastqc进行质量控制;适配器序列使用 TrimGalore 进行修剪,然后使用 Bowtie2 映射回参考序列。从获得的 .bam 文件中,DREEM 对每次读取中的突变进行计数,从而创建突变图或 .bitvector.txt 文件。这些以位置依赖的方式报告每个读取的突变,在此基础上可以创建群体平均反应性曲线。或者,可以使用DREEM对位载体进行聚类,以搜索替代的RNA构象。最后,使用软件(例如VARNA)对获得的结构模型进行可视化。缩写:DMS-MaP = 使用硫酸二甲酯测序的突变分析;SARS-CoV2 = 严重急性呼吸系统综合症-冠状病毒 2。请点击此处查看此图的大图。
此处的协议描述了如何使用DMS突变分析实验在 体外 和细胞中探测RNA。此外,它还提供了有关如何为Illumina测序准备文库以生成基因特异性数据并分析获得的.fastq文件的说明。此外,可以使用全基因组文库方法。然而,基因特异性RT-PCR可产生最高质量和最可靠的数据。因此,如果比较样品,重要的是要确保使用相同的测序策略制备它们,因为文库生成会导致一些偏差。重现性应始终使用重复进行测量。
几点注意事项
RNA是一种不稳定的分子,对高温和RNA酶的降解都很敏感。因此,建议采取特殊措施,即使用个人防护装备(PPE)、无RNA酶材料和RNA酶抑制剂。最重要的是,RNA应尽可能保存在冰上。这尤其适用于甲基化RNA,它对高温更加敏感。
重要的是要确认目标RNA结构对DMS浓度和缓冲条件不敏感。pH 7-7.5 时的 100 mM Tris、100 mM MOPS 和 100 mM HEPES 等缓冲液可提供高信号,但可能不足以在反应过程中维持 pH值 21。由于DMS在水中水解会降低pH值,因此强缓冲液对于在改性反应过程中保持中性pH值至关重要。添加bicine已被证明有助于将pH维持为略微碱性21 ,但导致Gs和Us上的DMS修饰较低,这可能是有益的,但由于产生的信号比As和Cs低得多,因此应单独分析,并且本协议中不再进一步讨论。
在基因特异性RT-PCR中,修饰的RNA被逆转录到DNA中,并通过PCR扩增成片段。虽然RNA的大小理论上是无限的,但这些PCR片段的长度不应超过400-500个碱基对(bp),以防止逆转录反应过程中的偏差。理想情况下,片段应在测序运行范围内(即,如果使用150 x 150循环配对末端测序程序进行测序,则单个片段不应超过300 bp)。当使用循环次数较少的测序程序时,可以使用dsDNA酶对PCR产物进行片段化。此外,由于引物序列中的序列不包含任何结构信息,因此当探针的RNA包含>1片段时,片段必须重叠。RT反应可以包含用于不同片段的多个RT引物(最多10种不同的RT引物)。根据序列的不同,合并RT引物会使逆转录效率降低,但通常效果很好。每个PCR反应应单独进行。
当用DMS探测RNA时,实验条件起着额外的作用,因为许多RNA在热力学上不稳定,并且根据温度等环境因素改变其构象。为避免不规则,实验条件应尽可能保持恒定,在反应时间方面也是如此。当保持碱性条件(缓冲能力和一价(Na)和二价离子(Mg)的存在)以确保RNA24的适当折叠时,缓冲条件似乎可以在一定程度上交换17,20,22,23。
关于修饰RNA的文库制备,必须考虑几个方面。首先,如前所述,修饰的RNA不如未修饰的RNA稳定,这意味着它们可能需要优化片段时间以获得最佳片段大小分布。此外,某些RNA文库制备试剂盒以及许多其他RNAseq方法在逆转录试剂盒中使用随机引物。这可能会导致参考文献的覆盖率降低,特别是在基因的3'中,并最终导致覆盖深度不足。如果某个区域的覆盖率太低,则可能需要从结构预测中删除这些碱基。除了RT-PCR和全基因组RNAseq试剂盒外,还可以使用其他文库制备方法。当使用RNA的小片段或必须避免引物区域中探测信息的丢失时,包括将3'和/或5'接头连接到RNA的方案是有利的。
最后,必须始终仔细解释化学探测实验的分析。目前,还没有软件可以仅从序列中高精度地预测任何RNA的RNA结构。尽管化学探测约束大大提高了准确性,但为长RNA(>500 nt)生成良好的模型仍然具有挑战性。这些模型应通过其他方法和/或诱变进一步测试。RNA预测软件针对最大碱基对数进行优化,从而显着惩罚开放构象,这些构象可能无法准确代表RNA折叠5。因此,应通过量化与基础化学探测数据(例如,通过AUROC)和重复之间的预测一致性(例如,通过mFMI)来测试获得的结构模型,如Lan等人20所示。
理想情况下,应该使用不同系统中的几个实验来挑战获得的结构模型来加强一个人的假设。这些可能包括体 外 和细胞内方法的使用、代偿突变以及不同的细胞系和物种。此外,原始反应性通常与结构预测一样,甚至更具信息性,因为它们记录了RNA折叠系综的"基本事实"快照。因此,原始反应性非常适合比较不同条件之间的结构变化,并且非常有用。重要的是,使用化学探测约束和计算预测计算的最低自由能结构只能用作完整结构模型的起始假设。
作者没有利益冲突需要声明。
没有
Name | Company | Catalog Number | Comments |
1 Kb Plus DNA Ladder | 10787018 | Thermo | |
2-mercaptoethanol | M6250-250ML | Sigma | |
Acid-Phenol:Chloroform, pH 4.5 | AM9720 | Thermo | |
Advantage PCR | 639206 | Takara | |
CloneAmp HiFi PCR Premix | 639298 | Takara | |
DMS | D186309 | Sigma | |
dNTPs 10 mM each | U151B | Promega | |
E-Gel EX Agarose Gels, 2% | G402022 | Thermo | precast agarose gels |
Ethanol (200 proof) | E7023-4X4L | Sigma | |
Falcon tubes, 15 mL, 50 mL | |||
GlycoBlue | co-precipitant | ||
HCT-8 cells | ATCC #CCL-244 | ||
Invitrogen MgCl2 (1 M) | AM9530G | fisherscientific | |
Isopropanol | 278475 | Sigma | |
Megascript T7 transcription | AM1334 | Thermo | |
NanoDrop spectrophotometer | |||
Novex TBE Gels, 8%, 10 well | EC6215BOX | Thermo | |
OC43 | ATCC #VR-1558 | ||
RiboRuler Low Range RNA Ladder | SM1831 | Thermo | |
RNAse H | M0297L | NEB | |
Sodium Cacodylate, 0.4 M, pH 7.2 | 102090-964 | VWR | |
Sodium hydroxide solution | S8263-150ML | Sigma | |
SuperScript II Reverse Transcriptase for FSB and DTT | 18064014 | Thermo | |
TGIRT-III Enzyme | TGIRT50 | Ingex | |
The Oligo Clean & Concentrator | D4060 | Genesee | |
The RNA Clean & Concentrator kits are RNA clean up kits | R1016 | Genesee | |
TRIzol Reagents | 15596018 | Thermo | RNA isolation reagent |
Water, (For RNA Work) (DEPC-Treated, DNASE, RNASE free/Mol. Biol.) | BP561-1 | fisherscientific | |
xGen Broad-range RNA Library Prep 16rxn | 10009865 | IDT | |
Zymo RNA clean and concentrator columns |
请求许可使用此 JoVE 文章的文本或图形
请求许可This article has been published
Video Coming Soon
版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。