The genetic reporter assay is a well-established and powerful tool for dissecting the relationship between DNA sequences and their gene regulatory activities. Coupling candidate regulatory elements to reporter genes that carry identifying sequence tags enables massive parallelization of these assays.
The genetic reporter assay is a well-established and powerful tool for dissecting the relationship between DNA sequences and their gene regulatory activities. The potential throughput of this assay has, however, been limited by the need to individually clone and assay the activity of each sequence on interest using protein fluorescence or enzymatic activity as a proxy for regulatory activity. Advances in high-throughput DNA synthesis and sequencing technologies have recently made it possible to overcome these limitations by multiplexing the construction and interrogation of large libraries of reporter constructs. This protocol describes implementation of a Massively Parallel Reporter Assay (MPRA) that allows direct comparison of hundreds of thousands of putative regulatory sequences in a single cell culture dish.
Ensaios Repórter Massively Parallel (MPRA) permitem a medição multiplexado das atividades de regulação transcricional de milhares a centenas de milhares de seqüências de DNA 1 a 7. Na sua aplicação mais comum, a multiplexação é obtida por acoplamento de cada sequência de interesse de um gene repórter sintético que contém uma marca de identificação de sequência a jusante de uma grelha de leitura aberta (ORF, Figura 1). Após a transfecção, o isolamento do RNA e profunda seqüenciamento de extremidades 3 'dos transcritos do gene repórter, as atividades relativas das sequências acopladas pode ser inferida a partir da abundância relativa de suas etiquetas de identificação.
Figura 1 Visão de MPRA. Uma biblioteca de MPRA repórter constrói é construído acoplando sequências regulatórias putativos para sintéticogenes repórter que são constituídas por uma "inerte" (ORF tais como GFP ou luciferase), seguido por uma sequência de marcação de identificação. A biblioteca é transfectado em massa para uma população de células cultivadas e o ARNm transcrito repórter é subsequentemente recuperado. Sequenciação profunda é utilizado para contar o número de ocorrências de cada etiqueta de entre os ARNm e os plasmídeos repórter transfectadas. A proporção de ARNm conta sobre contagens de plasmídeo pode ser usada para inferir a actividade da sequência reguladora correspondente. Adaptado com permissão de Melnikov, et al 2.
MPRA podem ser adaptadas a uma ampla variedade de modelos experimentais, incluindo 1) mutagénese global de elementos reguladores de genes individuais, 2) para digitalização através de novos elementos reguladores um locus de interesse, 3) para testar o efeito da variação genética natural em um conjunto de putativas promotores, intensificadores ou silenciadores, e 4) engenharia semi-racional de elementos reguladores sintéticos. LiAs variantes da sequência de braries pode ser gerado utilizando uma variedade de métodos, incluindo síntese de biblioteca de oligonucleótidos (OLS) em microarrays programáveis 2,3,6,7, montagem de oligonucleótidos degenerados, 1,4 ligadura combinatória 8 e fragmentação do ADN genómico 5.
Este protocolo descreve a construção de uma biblioteca de variantes do promotor utilizando MQO e os vectores e pMPRA1 pMPRAdonor1 (Addgene IDs de 49349 e 49352, respectivamente; http://www.addgene.org), a transfecção transiente desta biblioteca em células de mamífero de cultura e quantificação subsequente das atividades promotoras de profunda seqüenciamento de suas marcas associadas (Tag-Seq). Versões anteriores deste protocolo foram utilizados na pesquisa, publicada na Melnikov et al. Nature Biotechnology 30, 271-277 (2012) e em Kheradpour et al. Genome Research 23, 800-811 (2013).
1 Seqüência de Projeto e Síntese
MPRA_SfiI_F | GCTAAGGGCCTAACTGGCCGCTTCACTG |
MPRA_SfiI_R | GTTTAAGGCCTCCGTGGCCGACGCTCTTC |
TAGseq_P1 | AATGATACGGCGACCACCGAGATCTACACT CTTTCCCTACACGACGCTCTTCCGATCT |
TAGseq_P2 | CAAGCAGAAGACGGCATACGAGAT [índice] GT GACTGGAGTTCAGACGTGTGCTCTTCCGATCTCGAGG |
Tabela 1 sequências de primer. [Índice] denota uma seqüência de índice 6-8 nt utilizado para seqüenciamento multiplexado. Obter pelo menos 8 primers TagSeq-P2 com diferentes índices. Todosdos iniciadores deve ser purificado por HPLC ou PAGE.
Reagente | 1x Volume (uL) |
Herculase II Fusão ADN Polimerase | 0,5 |
Tampão de reacção 5x Herculase II | 10 |
de dNTP (10 mM cada) | 1,25 |
BSA (20 mg / ml) | 1,25 |
MPRA_SfiI_F Primer (25 uM) | 0,25 |
MPRA_SfiI_R Primer (25 uM) | 0,25 |
Modelo OLS (1-10 attomol) | varia |
Água livre de nuclease | 50 |
Figura 2: Preparação de bibliotecas de síntese de oligonucleótidos. UM) Três bibliotecas síntese oligonucleotídeo matérias diferentes (MQO) executado em desnaturante 10% TBE-uréia géis de poliacrilamida. As bandas correspondentes a oligonucleótidos de comprimento total (*) pode ser visualizada e excisada a partir de bibliotecas de 1 e 2 Biblioteca 3 contém os contaminantes que interferem com a purificação PAGE. Se este for o caso, seguir diretamente para a amplificação de PCR. B) produtos de aberto e de emulsão de amplificação por PCR da mesma biblioteca de oligonucleótidos corrida num gel de agarose. Amplificação por PCR de bibliotecas de oligonucleotídeos complexas freqüentemente cria produtos quiméricos e outros artefatos que podem aparecer como bandas superiores e inferiores. Emulsão PCR pode minimizar esses artefatos.
2 Construção da Biblioteca
3 Transfection, perturbação, e Isolamento de RNA
4. Tag-Seq
Reagente | 1x Volume (uL) |
amostra de ARNm (400-700 ng total) | 8 |
Oligo-0DT (50 uM) | 1 |
de dNTP (10 mM cada) | 1 |
Reagente | 1x Volume (uL) |
10x SuperScript III RT buffer | 2 |
MgCl2 (25 mM) | 4 |
DTT (0,1 M) | 2 |
RNaseOut (40 U / ul) | 1 |
SuperScript III (200 U / ul) | 1 |
Tabela 4 Mistura de reacção de síntese de cDNA.
Reagente | 1x Volume (uL) |
2x PfuUltra II HotStart PCR Master Mix | 25 |
TagSeq_P1 Primer (25 uM) | 0,5 |
TagSeq_P2 Primer (25 uM) | 0,5 |
Molde (mRNA, cDNA ou a mistura de ADN de plasmídeo) | varia |
Água livre de nuclease | 50 |
Tabela 5 mix reação Tag-Seq PCR.
MPRA facilita alta resolução, dissecção quantitativa das relações de elementos reguladores da transcrição seqüência de atividades. Um experimento MPRA bem sucedido irá tipicamente produzir medições altamente reprodutíveis para a maioria das sequências na biblioteca transfectadas (Figura 3A). Se for observada uma fraca reprodutibilidade (Figura 3B), isto é indicativo de uma muito baixa concentração de mRNAs repórter nas amostras de RNA recuperado, devido ou a 1) reduzida actividade absoluta entre as sequências ensaiadas, ou 2) a baixa eficiência de transfecção.
A Figura 4 mostra uma representação "pegada informações" 1,2 gerado por ensaio ~ 37.000 variantes aleatórias de uma sequência de 145 pb a montante do gene ifnb humano em células HEK293 com ou sem exposição ao virus Sendai. O promotor TATA-box e conhecido potenciador proximal 10 pode ser claramente identificada como regi rica em informaçõesons de um modo dependente de vírus.
Figura 3 Tag-Seq reprodutibilidade. Gráficos de dispersão que mostram exemplos de dados de tag-Seq de dois transfections réplicas independentes com alta (A) e baixa (B) reprodutibilidade. A última trama mostra muitas marcas de outlier com contagens elevadas de ARNm em apenas uma das duas repetições. Tais artefactos tipicamente indicam que as concentrações de ARNm repórter foram demasiado baixos para a amplificação de PCR quantitativa, quer devido a baixas actividades absolutas entre as construções repórter, ou baixos níveis de eficiência de transfecção.
Figura 4. Informação pegada do local de início da transcrição ifnb humano e potenciador proximal. Cerca de 37.000 variantes aleatórios de uma região de 145 nucleótidos (nt) a montante do gene humano ifnb foram ensaiadas usando MPRA em células HEK293 com (A) e sem (B) exposição a vírus de Sendai. As barras azuis mostrar a informação mútua entre a saída do repórter e as sequências de nucleótidos em cada posição. O potenciador proximal e caixa TATÁ destacam como regiões com elevado teor de informação, por infecção viral.
MPRA is a flexible and powerful tool for dissection of sequence-activity relationships in gene regulatory elements. The success of MPRA experiments depend on at least three factors: 1) careful design of the sequence library, 2) minimization of artifacts during amplification and cloning, and 3) high transfection efficiency.
The possible lengths of the variable regions in the reporter constructs are largely determined by the synthesis or cloning technology used. Standard OLS is generally limited to about 200 nt, but this protocol is compatible with inserts up to at least 1,000 nt. Note that variable regions that are highly repetitive or contain strong secondary structures may end up underrepresented due to PCR and cloning biases. The length of the tags that identify each of the variable regions should be 10-20 nt and the collection of tags should ideally be designed such there are at least two nucleotide differences between any pair. Tags that contain the seed sequences of known microRNA or other factors that might influence mRNA stability should also be avoided when possible.
A key parameter in the design of MPRA experiments is the total number of distinct reporter constructs to be included in the library (the design complexity, denoted CD). In practice, CD is limited by the number of cultured cells that can be transfected. As a rule of thumb, the total number of transfected cells should be at least 50-100 times greater than CD. For example, if 20 million cells can be transfected with a transfection efficiency of 50%, then CD should be no more than ~200,000. Note that CD is equal to the number of distinct regulatory sequence variants multiplied by the number of distinct tags per sequence. The more distinct tags are linked to each regulatory sequence, the more accurate the estimate of the activity of that sequence can be made (because measurements from distinct tags can be averaged), but the fewer distinct variants can be assayed in one experiment. The optimal choice depends on the experimental design. In a simple “promoter bashing” experiment, where a mathematical model will be fitted to the aggregated measurements, a single tag per variant is usually sufficient. In a screen for single-nucleotide polymorphisms that cause changes in regulatory activities, it may be necessary to use 20 or more tags per allele to obtain statistically robust results, because comparing each pair of alleles requires a separate hypothesis test.
If the sequences to be assayed are not expected to contain transcription start sites, a constant promoter can also be added in the same fragment. For example, pMPRAdonor2 (Addgene ID 49353) includes a minimal TATA-box promoter that is useful when the upstream variable region is expected to have significant enhancer activity, while pMPRAdonor3 (Addgene ID 49354) includes a modified, strong SV40 viral promoter that is useful when the variable region is expected to contain silencer activity or other negative regulatory elements.
Raw OLS products often contain a significant fraction of truncated oligonucleotides. These may interfere with accurate PCR amplification of the designed sequences, particularly when there is significant homology between them. Using PAGE purification to remove truncated synthesis products and emulsion PCR to minimize amplification artifacts are effective techniques for ensuring high library quality. If either step is impractical, it is imperative to minimize the number of PCR cycles used at each amplification step. Selection and expansion of the cloned library in liquid culture is generally sufficient to maintain the design complexity, but if recombination-prone vectors are to be used or significant representation bias is observed, the recovered cells can instead be plated directly onto large LB agar plates, expanded as individual colonies and then scraped off for DNA isolation. It is also important to consider the potential impact of synthesis errors, which are typically found at a rate of 1:100-500 in OLS. Full-length sequencing of the reporter constructs prior to transfection is recommended to identify and correct for such errors.
It is not necessary to introduce reporter constructs into every cell in the transfected culture, but transfection efficiencies below ~50% may lead to poor signal to noise ratios. It is advisable to optimize transfection conditions prior to performing MPRA experiments in a new cell type. When working with hard-to-transfect cell types, MPRA signals can be boosted by pre-selecting transfected cells. The pMPRA vector series includes variants that constitutively express a truncated cell surface marker that can be used to physically enrich for transfected cells prior to RNA isolation (for example, Addgene IDs 49350 and 49351).
Os autores declaram que não têm interesses financeiros concorrentes.
Este trabalho foi financiado pelo Instituto Nacional de Pesquisa do Genoma Humano dos Institutos Nacionais de Saúde sob Award Número R01HG006785.
Name | Company | Catalog Number | Comments |
Oligonucleotide library synthesis | Agilent, CustomArray or other OLS vendors | custom | If using OLS construction method |
pMPRA1 | Addgene | 49349 | MPRA plasmid backbone |
pMPRAdonor1 | Addgene | 49352 | luc2 ORF donor plasmid |
TE 0.1 Buffer (10 mM Tris-HCl, 0.1 mM EDTA, pH 8.0) | Generic | n/a | OLS buffer |
Novex TBE-Urea Gels, 10% | Life Technologies | EC6875BOX | PAGE purification of OLS products |
Novex TBA-Urea Sample Buffer | Life Technologies | LC6876 | PAGE purification of OLS products |
SYBR Gold Nucleic Acid Gel Stain | Life Technologies | S-11494 | PAGE purification of OLS products |
Micellula DNA Emulsion & Purification Kit | EURx/CHIMERx | 3600-01 | Library amplification by emulsion PCR |
Herculase II Fusion DNA Polymerase | Agilent | 600675 | Polymerase for emulsion PCR |
SfiI | New England Biolabs | R0123S | Library cloning with pMPRA vectors |
KpnI-HF | New England Biolabs | R3142S | Library cloning with pMPRA vectors |
XbaI | New England Biolabs | R0145S | Library cloning with pMPRA vectors |
T4 DNA Ligase (2,000,000 units/ml) | New England Biolabs | M0202T | Library cloning with pMPRA vectors |
One Shot TOP10 Electrocomp E. coli | Life Technologies | C4040-50 | Library cloning with pMPRA vectors |
LB agar and liquid media with carbenicllin | Generic | n/a | Growth media for cloning |
E-Gel EX Gels 1% | Life Technologies | G4010-01 | Library verification and purification |
E-Gel EX Gels, 2% | Life Technologies | G4010-02 | Library verification and purification |
MinElute Gel Extraction Kit | Qiagen | 28604 | Library and backbone purification |
EndoFree Plasmid Maxi Kit | Qiagen | 12362 | Library DNA isolation |
Cell culture media | n/a | n/a | Experiment-specific |
Transfection reagents | n/a | n/a | Experiment-specific |
MicroPoly(A)Purist Kit | Life Technologies | AM1919 | mRNA isolation |
TURBO DNA-free Kit | Life Technologies | AM1907 | Plasmid DNA removal |
SuperScript III First-Strand Synthesis System | Life Technologies | 18080-051 | cDNA synthesis |
PfuUltra II Hotstart PCR Master Mix | Agilent | 600850 | Polymerase for Tag-Seq PCR |
Primers (see text) | IDT | custom | PAGE purify Tag-Seq primers |
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados