Method Article
The genetic reporter assay is a well-established and powerful tool for dissecting the relationship between DNA sequences and their gene regulatory activities. Coupling candidate regulatory elements to reporter genes that carry identifying sequence tags enables massive parallelization of these assays.
The genetic reporter assay is a well-established and powerful tool for dissecting the relationship between DNA sequences and their gene regulatory activities. The potential throughput of this assay has, however, been limited by the need to individually clone and assay the activity of each sequence on interest using protein fluorescence or enzymatic activity as a proxy for regulatory activity. Advances in high-throughput DNA synthesis and sequencing technologies have recently made it possible to overcome these limitations by multiplexing the construction and interrogation of large libraries of reporter constructs. This protocol describes implementation of a Massively Parallel Reporter Assay (MPRA) that allows direct comparison of hundreds of thousands of putative regulatory sequences in a single cell culture dish.
فحوصات مراسل المتوازية (MPRA) تتيح قياس المضاعفة من الأنشطة التنظيمية النسخي الآلاف إلى مئات الآلاف من تسلسل الحمض النووي 1- 7. تنفيذا الأكثر شيوعا، ويتم تحقيق مضاعفة من قبل اقتران كل تسلسل تهم جين مراسل الاصطناعية التي تحتوي على علامة تحديد تسلسل المصب من إطار القراءة المفتوح (ORF، الشكل 1). ترنسفكأيشن التالية، والعزلة RNA وتسلسل عميق الغايات 3 'من النصوص الجين المراسل، أنشطة النسبية للتسلسل جانب يمكن أن يستدل من الوفرة النسبية للعلامات تحديد بهم.
نظرة عامة على الشكل 1. MPRA. مكتبة مراسل MPRA يبني هي التي شيدت من قبل اقتران متواليات التنظيمية المفترضة لالاصطناعيةمراسل الجينات التي تتكون من "خامل" ORF (مثل GFP أو وسيفيراز)، يليه علامة تحديد التسلسل. وtransfected المكتبة بشكل جماعي إلى السكان من الخلايا المستزرعة ويتم استرداد كتب مراسل مرنا في وقت لاحق. يستخدم التسلسل العميق لحساب عدد تكرارات كل علامة بين من mRNAs مراسل وtransfected البلازميدات. نسبة مرنا تعول على التهم البلازميد يمكن استخدامها للاستدلال على نشاط التسلسل التنظيمي المقابلة. مقتبس بإذن من ميلينكوف، وآخرون 2.
MPRA يمكن تكييفها لمجموعة واسعة من التصاميم التجريبية، بما في ذلك 1) الطفرات شاملة من العناصر التنظيمية الجينات الفردية، 2) المسح الضوئي لعناصر تنظيمية جديدة عبر موضع الاهتمام، 3) اختبار تأثير التباين الوراثي الطبيعي في مجموعة من المفترضة المروجين، والقدرة أو كواتم الصوت، و4) الهندسة شبه عقلانية من العناصر التنظيمية الاصطناعية. لىيمكن أن تتولد braries من المتغيرات تسلسل باستخدام مجموعة متنوعة من الأساليب، بما في ذلك تركيب مكتبة قليل النوكليوتيد (OLS) على ميكروأرس برمجة 2،3،6،7، والتجمع من أليغنوكليوتيد] المنحطة 1،4، ربط اندماجي 8 و تفتيت الحمض النووي الجيني 5.
يصف هذا البروتوكول بناء مكتبة من المروج المتغيرات باستخدام OLS وpMPRA1 وpMPRAdonor1 ناقلات (Addgene معرفات و49349 49352 على التوالي؛ http://www.addgene.org)، ترنسفكأيشن عابرة من هذه المكتبة في خلايا الثدييات مثقف والكميات اللاحقة الأنشطة التي كتبها مروج تسلسل عميق من الأكواد المرتبطة بها (TAG-يليها). تم استخدام الإصدارات السابقة من هذا البروتوكول في البحث عنها في ميلينكوف آخرون طبيعة التكنولوجيا الحيوية 30، 271-277 (2012) وفي Kheradpour آخرون بحوث الجينوم 23، 800-811 (2013).
1. تسلسل تصميم وتجميع
MPRA_SfiI_F | GCTAAGGGCCTAACTGGCCGCTTCACTG |
MPRA_SfiI_R | GTTTAAGGCCTCCGTGGCCGACGCTCTTC |
TAGseq_P1 | AATGATACGGCGACCACCGAGATCTACACT CTTTCCCTACACGACGCTCTTCCGATCT |
TAGseq_P2 | CAAGCAGAAGACGGCATACGAGAT [مؤشر] GT GACTGGAGTTCAGACGTGTGCTCTTCCGATCTCGAGG |
الجدول 1. متواليات التمهيدي. [مؤشر] مؤشر يدل على تسلسل 6 إلى 8 الإقليم الشمالي المستخدمة في التسلسل المضاعفة. الحصول على الأقل 8 الاشعال TagSeq-P2 مع مؤشرات مختلفة. جميعمن الاشعال يجب تنقيته بواسطة HPLC أو PAGE.
كاشف | 1X وحدة التخزين (ميكرولتر) |
Herculase الثاني فيوجن البلمرة DNA | 0.5 |
5X Herculase II الاحتياطي الرد | 10 |
dNTP (10 ملم لكل منهما) | 1.25 |
BSA (20 ملغ / مل) | 1.25 |
MPRA_SfiI_F التمهيدي (25 ميكرومتر) | 0.25 |
MPRA_SfiI_R التمهيدي (25 ميكرومتر) | 0.25 |
قالب عملية شريان الحياة (1-10 attomol) | يختلف |
nuclease خالية من المياه | 50 |
الرقم 2. إعداد مكتبات التوليف قليل النوكليوتيد. A) ثلاثة مكتبات التوليف قليل النوكليوتيد الخام المختلفة (شريان الحياة) تعمل على تغيير طبيعة 10٪ TBE-اليوريا المواد الهلامية بولي أكريلاميد. العصابات الموافق أليغنوكليوتيد] طول كامل (*) يمكن تصور ورفعه من المكتبات 1 و 3 2. مكتبة تحتوي على ملوثات التي تتداخل مع تنقية PAGE. إذا كان هذا هو الحال، انتقل مباشرة إلى التضخيم PCR. B) منتجات مفتوحة ومستحلب التضخيم PCR من نفس المدى مكتبة قليل النوكليوتيد على agarose هلام. PCR التضخيم من المكتبات قليل النوكليوتيد معقدة في كثير من الأحيان يخلق منتجات خيالية وغيرها من الأعمال الفنية التي قد تظهر كما العصابات العليا والسفلى. مستحلب PCR يمكن تقليل هذه التحف.
2. البناء المكتبة
3. Transfection، التشويش، وعزل الحمض النووي الريبي
4. تاج تسلسل
كاشف | 1X وحدة التخزين (ميكرولتر) |
عينة مرنا (400-700 نانوغرام الكل) | 8 |
بنسبة ضئيلة من 0DT (50 ميكرومتر) | 1 |
dNTP (10 ملم لكل منهما) | 1 |
كاشف | 1X وحدة التخزين (ميكرولتر) |
10X مرتفع الثالث RT العازلة | 2 |
MgCl 2 (25 ملم) | 4 |
DTT (0.1 M) | 2 |
RNaseOut (40 U / ميكرولتر) | 1 |
مرتفع الثالث (200 U / ميكرولتر) | 1 |
الجدول 4. [كدنا] مزيج رد فعل التوليف.
كاشف | 1X وحدة التخزين (ميكرولتر) |
2X PfuUltra الثاني HotStart PCR ميكس ماجستير | 25 |
TagSeq_P1 التمهيدي (25 ميكرومتر) | 0.5 |
TagSeq_P2 التمهيدي (25 ميكرومتر) | 0.5 |
قالب (مرنا، أو مزيج [كدنا DNA البلازميد) | يختلف |
nuclease خالية من المياه | 50 |
الجدول 5. تاج تسلسل PCR مزيج التفاعل.
MPRA يسهل عالية الدقة، تشريح الكمي للعلاقات تسلسل النشاط من العناصر التنظيمية النسخي. وهناك تجربة ناجحة MPRA تسفر عادة قياسات متكررة للغاية بالنسبة لغالبية متواليات في المكتبة transfected (الشكل 3A). إذا لوحظ ضعف استنساخ (الشكل 3B)، وهذا يدل على تركيز منخفض جدا من mRNAs من مراسل في عينات الحمض النووي الريبي استردادها، إما بسبب 1) النشاط المطلق المنخفض بين متواليات يعاير، أو 2) انخفاض كفاءة ترنسفكأيشن.
ويبين الشكل 4 ممثل "البصمة المعلومات" 1،2 الناتجة عن يعاير ~ 37،000 متغيرات عشوائية من تسلسل 145 BP المنبع من الجين البشري IFNB في الخلايا HEK293 مع أو بدون التعرض لفيروس سينداي. المروج تاتا مربع والداني يعرف محسن 10 يمكن التعرف بوضوح على ريجي غنية بالمعلوماتإضافات بطريقة تعتمد على الفيروس.
الرقم 3. الوسم يليها التكاثر. المؤامرات مبعثر تظهر أمثلة من البيانات الوسم وما يليها من اثنين transfections تكرار مستقل مع ارتفاع (A) ومنخفضة (B) التكاثر. المؤامرة الأخيرة تظهر العديد من العلامات النموذجية مع التهم مرنا عالية في واحدة فقط من مكررات اثنين. تشير هذه التحف عادة أن تركيزات من mRNAs مراسل كانت منخفضة للغاية بالنسبة الكمي PCR التضخيم، إما بسبب الأنشطة المطلقة منخفضة بين بنيات المراسل، أو الكفاءة ترنسفكأيشن منخفضة.
الرقم 4. footprinting معلومات من IFNB النسخ موقع بداية البشري ومحسن القريبة. ويعاير ما يقرب من 37،000 متغيرات عشوائية من 145 النوكليوتيدات (الإقليم الشمالي) منطقة المنبع من الجين البشري باستخدام IFNB MPRA في الخلايا HEK293 مع (A) وبدون (B) التعرض لفيروس سينداي. تظهر أشرطة زرقاء المعلومات المتبادلة بين مخرجات مراسل والنوكليوتيدات في كل موقف. محسن الداني وTATA مربع تبرز بوصفها مناطق محتوى المعلومات عالية على العدوى الفيروسية.
MPRA is a flexible and powerful tool for dissection of sequence-activity relationships in gene regulatory elements. The success of MPRA experiments depend on at least three factors: 1) careful design of the sequence library, 2) minimization of artifacts during amplification and cloning, and 3) high transfection efficiency.
The possible lengths of the variable regions in the reporter constructs are largely determined by the synthesis or cloning technology used. Standard OLS is generally limited to about 200 nt, but this protocol is compatible with inserts up to at least 1,000 nt. Note that variable regions that are highly repetitive or contain strong secondary structures may end up underrepresented due to PCR and cloning biases. The length of the tags that identify each of the variable regions should be 10-20 nt and the collection of tags should ideally be designed such there are at least two nucleotide differences between any pair. Tags that contain the seed sequences of known microRNA or other factors that might influence mRNA stability should also be avoided when possible.
A key parameter in the design of MPRA experiments is the total number of distinct reporter constructs to be included in the library (the design complexity, denoted CD). In practice, CD is limited by the number of cultured cells that can be transfected. As a rule of thumb, the total number of transfected cells should be at least 50-100 times greater than CD. For example, if 20 million cells can be transfected with a transfection efficiency of 50%, then CD should be no more than ~200,000. Note that CD is equal to the number of distinct regulatory sequence variants multiplied by the number of distinct tags per sequence. The more distinct tags are linked to each regulatory sequence, the more accurate the estimate of the activity of that sequence can be made (because measurements from distinct tags can be averaged), but the fewer distinct variants can be assayed in one experiment. The optimal choice depends on the experimental design. In a simple “promoter bashing” experiment, where a mathematical model will be fitted to the aggregated measurements, a single tag per variant is usually sufficient. In a screen for single-nucleotide polymorphisms that cause changes in regulatory activities, it may be necessary to use 20 or more tags per allele to obtain statistically robust results, because comparing each pair of alleles requires a separate hypothesis test.
If the sequences to be assayed are not expected to contain transcription start sites, a constant promoter can also be added in the same fragment. For example, pMPRAdonor2 (Addgene ID 49353) includes a minimal TATA-box promoter that is useful when the upstream variable region is expected to have significant enhancer activity, while pMPRAdonor3 (Addgene ID 49354) includes a modified, strong SV40 viral promoter that is useful when the variable region is expected to contain silencer activity or other negative regulatory elements.
Raw OLS products often contain a significant fraction of truncated oligonucleotides. These may interfere with accurate PCR amplification of the designed sequences, particularly when there is significant homology between them. Using PAGE purification to remove truncated synthesis products and emulsion PCR to minimize amplification artifacts are effective techniques for ensuring high library quality. If either step is impractical, it is imperative to minimize the number of PCR cycles used at each amplification step. Selection and expansion of the cloned library in liquid culture is generally sufficient to maintain the design complexity, but if recombination-prone vectors are to be used or significant representation bias is observed, the recovered cells can instead be plated directly onto large LB agar plates, expanded as individual colonies and then scraped off for DNA isolation. It is also important to consider the potential impact of synthesis errors, which are typically found at a rate of 1:100-500 in OLS. Full-length sequencing of the reporter constructs prior to transfection is recommended to identify and correct for such errors.
It is not necessary to introduce reporter constructs into every cell in the transfected culture, but transfection efficiencies below ~50% may lead to poor signal to noise ratios. It is advisable to optimize transfection conditions prior to performing MPRA experiments in a new cell type. When working with hard-to-transfect cell types, MPRA signals can be boosted by pre-selecting transfected cells. The pMPRA vector series includes variants that constitutively express a truncated cell surface marker that can be used to physically enrich for transfected cells prior to RNA isolation (for example, Addgene IDs 49350 and 49351).
تعلن الكتاب أنه ليس لديهم المصالح المالية المتنافسة.
وأيد هذا العمل من قبل معهد أبحاث الجينوم البشري الوطني من المعاهد الوطنية للصحة في إطار جائزة عدد R01HG006785.
Name | Company | Catalog Number | Comments |
Oligonucleotide library synthesis | Agilent, CustomArray, or other OLS vendors | custom | If using OLS construction method |
pMPRA1 | Addgene | 49349 | MPRA plasmid backbone |
pMPRAdonor1 | Addgene | 49352 | luc2 ORF donor plasmid |
TE 0.1 Buffer (10 mM Tris-HCl, 0.1 mM EDTA, pH 8.0) | Generic | n/a | OLS buffer |
Novex TBE-Urea Gels, 10% | Life Technologies | EC6875BOX | PAGE purification of OLS products |
Novex TBA-Urea Sample Buffer | Life Technologies | LC6876 | PAGE purification of OLS products |
SYBR Gold Nucleic Acid Gel Stain | Life Technologies | S-11494 | PAGE purification of OLS products |
Micellula DNA Emulsion & Purification Kit | EURx/CHIMERx | 3600-01 | Library amplification by emulsion PCR |
Herculase II Fusion DNA Polymerase | Agilent | 600675 | Polymerase for emulsion PCR |
SfiI | New England Biolabs | R0123S | Library cloning with pMPRA vectors |
KpnI-HF | New England Biolabs | R3142S | Library cloning with pMPRA vectors |
XbaI | New England Biolabs | R0145S | Library cloning with pMPRA vectors |
T4 DNA Ligase (2,000,000 units/ml) | New England Biolabs | M0202T | Library cloning with pMPRA vectors |
One Shot TOP10 Electrocomp E. coli | Life Technologies | C4040-50 | Library cloning with pMPRA vectors |
LB agar and liquid media with carbenicllin | Generic | n/a | Growth media for cloning |
E-Gel EX Gels 1% | Life Technologies | G4010-01 | Library verification and purification |
E-Gel EX Gels, 2% | Life Technologies | G4010-02 | Library verification and purification |
MinElute Gel Extraction Kit | Qiagen | 28604 | Library and backbone purification |
EndoFree Plasmid Maxi Kit | Qiagen | 12362 | Library DNA isolation |
Cell culture media | n/a | n/a | Experiment-specific |
Transfection reagents | n/a | n/a | Experiment-specific |
MicroPoly(A)Purist Kit | Life Technologies | AM1919 | mRNA isolation |
TURBO DNA-free Kit | Life Technologies | AM1907 | Plasmid DNA removal |
SuperScript III First-Strand Synthesis System | Life Technologies | 18080-051 | cDNA synthesis |
PfuUltra II Hotstart PCR Master Mix | Agilent | 600850 | Polymerase for Tag-Seq PCR |
Primers (see text) | IDT | custom | PAGE purify Tag-Seq primers |
Request permission to reuse the text or figures of this JoVE article
Request PermissionThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. All rights reserved