Per superare i limiti della mutagenesi classica sito-diretta, gli analoghi della prolina con modifiche specifiche sono stati incorporati in diverse proteine fluorescenti. Mostriamo come la sostituzione dell'idrogeno con il fluoro o dei singoli con doppi legami nei residui di prolina ("chirurgia molecolare") influenzi le proprietà fondamentali delle proteine, tra cui il loro ripiegamento e l'interazione con la luce.
La sostituzione dei residui di prolina (Pro) nelle proteine con la tradizionale mutagenesi sito-diretta con uno qualsiasi dei restanti 19 amminoacidi canonici è spesso dannosa per il ripiegamento delle proteine e, in particolare, la maturazione del cromoforo nelle proteine fluorescenti verdi e nelle varianti correlate. Un'alternativa ragionevole è quella di manipolare la traduzione della proteina in modo che tutti i residui di Pro siano sostituiti dai residui, in particolare dagli analoghi, un metodo noto come incorporazione selettiva della pressione (SPI). Le modifiche chimiche incorporate possono essere utilizzate come una sorta di "chirurgia molecolare" per sezionare finemente cambiamenti misurabili o addirittura manipolare razionalmente diverse proprietà proteiche. Qui, lo studio dimostra l'utilità del metodo SPI per studiare il ruolo delle proline nell'organizzazione della tipica struttura a β barile delle varianti spettrali della proteina fluorescente verde (GFP) con 10-15 proline nella loro sequenza: proteina fluorescente verde potenziata (EGFP), NowGFP e KillerOrange. I residui pro sono presenti nelle sezioni di collegamento tra i singoli β-strands e costituiscono i coperchi di chiusura dell'impalcatura della canna, essendo quindi responsabili dell'isolamento del cromoforo dall'acqua, cioè delle proprietà di fluorescenza. Esperimenti di incorporazione selettiva della pressione con (4R)-fluoroprolina (R-Flp), (4S)-fluoroprolina (S-Flp), 4,4-difluoroprolina (Dfp) e 3,4-deidroprolina (Dhp) sono stati eseguiti utilizzando un ceppo di E. coli proline-auxotrofico come ospite di espressione. Abbiamo scoperto che le proteine fluorescenti con S-Flp e Dhp sono attive (cioè fluorescenti), mentre gli altri due analoghi (Dfp e R-Flp) producono proteine disfunzionali e mal ripiegate. L'ispezione dei profili di assorbimento UV-Vis e di emissione di fluorescenza ha mostrato poche alterazioni caratteristiche nelle proteine contenenti analoghi Pro. L'esame dei profili cinetici di piegatura nelle varianti EGFP ha mostrato un processo di ripiegamento accelerato in presenza di S-Flp, mentre il processo era simile al wild-type nella proteina contenente Dhp. Questo studio mostra la capacità del metodo SPI di produrre sottili modifiche dei residui proteici a livello atomico ("chirurgia molecolare"), che possono essere adottate per lo studio di altre proteine di interesse. Illustra i risultati delle sostituzioni della prolina con analoghi chimici ravvicinati sulle proprietà di ripiegamento e spettroscopiche nella classe delle proteine fluorescenti a β barile.
La mutagenesi classica diretta al sito consente la permutazione di qualsiasi sequenza proteica codificata da un gene esistente mediante manipolazione del codone a livello di DNA. Per studiare il ripiegamento e la stabilità delle proteine, è spesso auspicabile sostituire aminoacidi simili con controparti simili. Tuttavia, la mutagenesi proteica tradizionale è sicuramente limitata a sostituzioni strutturalmente simili tra amminoacidi canonici come Ser/Ala/Cys, Thr/Val, Glu/Gln, Asp/Asn, Tyr/Phe, che sono presenti nel repertorio del codice genetico standard. D'altra parte, non ci sono tali possibilità per altri amminoacidi canonici come Trp, Met, His o Pro, che spesso svolgono ruoli strutturali e funzionali essenziali nelle proteine1. Un approccio ideale per studiare queste interazioni nel contesto dell'architettura interna altamente specifica delle proteine e del loro processo di ripiegamento è quello di generare modifiche isosteriche non dirompenti. Infatti, quando gli analoghi degli amminoacidi isosterici di questi amminoacidi canonici, noti anche come amminoacidi non canonici (ncAA), vengono inseriti nelle proteine, consentono sottili cambiamenti anche a livello di singoli atomi o gruppi di atomi come H / F, CH2 / S / Se / Te noti come "mutazioni atomiche"2. Tale "chirurgia molecolare" produce proteine alterate le cui proprietà derivano esclusivamente dallo scambio di singoli atomi o gruppi di atomi, che in casi favorevoli possono essere analizzati, e i cambiamenti rilevati possono essere razionalizzati. In questo modo, l'ambito della sintesi proteica per studiare il ripiegamento e la struttura delle proteine è esteso ben oltre la classica mutagenesi del DNA. Si noti che le proteine generate dalla mutagenesi sito-diretta sono solitamente indicate come "mutanti", mentre le proteine con amminoacidi canonici sostituiti sono indicate come "varianti" 3, "alloproteine"4 o "congeneri proteici"5.
La proteina fluorescente verde (GFP), identificata per la prima volta nell'organismo marino Aequorea victoria, mostra una fluorescenza verde brillante se esposta alla luce ultravioletta-blu 6,7. Oggi, GFP è comunemente usato come strumento di etichettatura altamente sensibile per la visualizzazione di routine dell'espressione genica e la localizzazione delle proteine nelle cellule tramite microscopia fluorescente. GFP si è anche dimostrato utile in vari studi biofisici 8,9,10 e biomedici11,12, nonché nell'ingegneria proteica 13,14,15. L'analisi rigorosa della struttura GFP ha permesso la creazione di numerose varianti caratterizzate da vari massimi di stabilità e fluorescenza16,17. La maggior parte delle varianti GFP utilizzate nella biologia cellulare e molecolare sono proteine monomeriche sia in soluzione che nel cristallo18. La loro principale organizzazione strutturale è tipica di tutti i membri della famiglia GFP, indipendentemente dalla loro origine filogenetica, ed è costituita da 11 β-filamenti che formano una cosiddetta canna β, mentre una α-elica attorcigliata attraversa il centro della canna e porta il cromoforo (Figura 1A). La maturazione autocatalitica del cromoforo (Figura 1B) richiede il posizionamento preciso delle catene laterali che lo circondano nel punto centrale della proteina; molte di queste catene laterali sono altamente conservate in altre varianti GFP19. Nella maggior parte delle proteine fluorescenti di meduse come Aequorea victoria, il cromoforo a emissione verde è costituito da due anelli aromatici, tra cui un anello fenolico di Tyr66 e la struttura eterociclica a cinque membri dell'imidazolinone (Figura 1B). Il cromoforo, se correttamente incorporato nella matrice proteica, è responsabile della fluorescenza caratteristica dell'intera proteina. Si trova al centro della struttura, mentre la struttura a botte lo isola dal mezzo acquoso20. L'esposizione del cromoforo all'acqua sfusa comporterebbe una tempra di fluorescenza, cioè la perdita di fluorescenza21.
La corretta piegatura della struttura a botte è essenziale per proteggere il cromoforo dalla tempra a fluorescenza22. I residui di prolina (Pro) svolgono un ruolo speciale nell'organizzazione strutturale della GFP23. Non essendo in grado di supportare un β-filamento, costituiscono anelli di collegamento responsabili del mantenimento della struttura proteica nel suo complesso. Non sorprende che 10-15 residui di prolina si trovino sia nelle GFP derivate da Aequorea che in quelle derivate da Anthoathecata; alcuni di essi sono altamente conservati in altri tipi di proteine fluorescenti β-barrel. Ci si aspetta che le proline influenzino criticamente le proprietà di piegatura a causa delle loro peculiari caratteristiche geometriche. Ad esempio, nelle GFP derivate da Aequorea, dei dieci residui di prolina (Figura 2A), nove formano trans- e solo uno forma un legame cis-peptide (Pro89). Pro58 è essenziale, cioè non intercambiabile con il resto dei 19 amminoacidi canonici. Questo residuo può essere responsabile del corretto posizionamento del residuo Trp57, che è stato segnalato come cruciale per la maturazione del cromoforo e il ripiegamento complessivo della GFP24. Il frammento PVPWP con tre residui di prolina (Pro54, Pro56, Pro58) e Trp57 è la parte essenziale del "coperchio inferiore" nella struttura GFP dalla Figura 1A. Il motivo strutturale PVPWP si trova in diverse proteine come i citocromi e i canali del potassio attivati dalla tensione eucariotica25. Le sostituzioni prolina-alanina nelle posizioni 75 e 89 sono anche dannose per l'espressione e il ripiegamento delle proteine e aboliscono la maturazione del cromoforo. Pro75 e Pro89 fanno parte del "coperchio superiore" che seppellisce il cromoforo (Figura 1A) e sono conservati attraverso proteine fluorescenti a 11 filamenti β barili23. Questi due "coperchi" mantengono il cromoforo escluso dal solvente acquoso, anche quando la struttura terziaria stabile è stata parzialmente rotta26. Tale architettura molecolare specifica protegge il fluoroforo dalla tempra a fluorescenza collisionale (dinamica), ad esempio da parte di acqua, ossigeno o altri ligandi diffusibili.
Al fine di eseguire l'ingegneria molecolare della struttura GFP, si dovrebbero introdurre sostituzioni di aminoacidi nella struttura primaria della proteina. Numerose mutazioni sono state eseguite su GFP, fornendo varianti con elevata stabilità, ripiegamento rapido e affidabile e proprietà di fluorescenza variabili17. Tuttavia, nella maggior parte dei casi, la mutazione dei residui di prolina è considerata un approccio rischioso a causa del fatto che nessuno dei restanti 19 amminoacidi canonici può ripristinare correttamente il profilo conformazionale del residuo di prolina27. Pertanto, è stato sviluppato un approccio alternativo, in cui i residui di prolina vengono sostituiti con altre strutture a base di prolina, soprannominate analoghi della prolina28. Grazie alla sua struttura chimica ciclica unica, la prolina presenta due transizioni conformazionali caratteristiche (Figura 1C): 1) il puckering dell'anello proline, un processo veloce che comporta l'organizzazione della spina dorsale, che influenza principalmente l'angolo di torsione φ, e 2) l'isomerizzazione cis/trans del legame peptidico, un processo lento che influisce sulla piegatura della spina dorsale attraverso gli angoli di torsione ω. A causa della sua natura lenta, quest'ultima transizione è comunemente responsabile delle fasi limitanti della velocità nel processo di ripiegamento dell'intera proteina. È stato dimostrato in precedenza che l'isomerizzazione cis/trans del legame peptidico attorno ad alcuni residui di prolina presenta passaggi lenti nel ripiegamento delle varianti GFP. Ad esempio, la formazione del legame cis-peptide a Pro89 presenta il passo lento nel processo di ripiegamento perché si basa sulla transizione del legame da trans a cis29. Un ripiegamento più rapido può essere ottenuto dopo aver sostituito Pro89 con un loop peptidico all-trans, cioè abolendo un evento di isomerizzazione cis-to-trans 30. Oltre all'isomerizzazione cis/trans, le transizioni pucker possono anche generare profondi cambiamenti nel ripiegamento delle proteine a causa dell'organizzazione della spina dorsale e dell'impacchettamento all'interno della proteina27,31.
Le modificazioni chimiche comportano l'alterazione delle transizioni conformazionali intrinseche dei residui di prolina, influenzando così la capacità della proteina di piegarsi. Alcuni analoghi della prolina sono candidati particolarmente interessanti per la sostituzione della prolina nelle proteine in quanto consentono la manipolazione e lo studio delle proprietà di ripiegamento. Ad esempio, (4R)-fluoroprolina (R-Flp), (4S)-fluoroprolina (S-Flp), 4,4-difluoroprolina (Dfp) e 3,4-deidroprolina (Dhp) sono quattro analoghi (Figura 1D) che differiscono minimamente dalla prolina in termini di volume molecolare e polarità32. Allo stesso tempo, ogni analogo presenta un puckering ad anello distinto: S-Flp stabilizza il pucker C 4-endo, R-Flp stabilizza il pucker C4-exo, Dfp non mostra alcuna preferenza apparente pucker, mentre Dhp abolisce il puckering (Figura 1D)33. Usando questi analoghi nella struttura proteica, si può manipolare con la transizione conformazionale dei residui di prolina e, con questo, influenzare le proprietà delle varianti GFP risultanti.
In questo lavoro, abbiamo deciso di incorporare l'insieme designato di analoghi di prolina (Figura 1D) nella struttura delle varianti GFP utilizzando il metodo di incorporazione selettiva della pressione (SPI, Figura 3)34. La sostituzione dei residui di amminoacidi con i loro analoghi isostrutturali più vicini è un concetto biotecnologico applicato nellaprogettazione proteica 35,36. Pertanto, gli effetti degli analoghi della prolina in una proteina modello illustrano il loro potenziale per servire come strumenti nell'ingegneria proteica37. La produzione di proteine contenenti analoghi desiderati è stata eseguita in ceppi di E. coli modificati che non sono in grado di produrre prolina (prolina-auxotrofia). Pertanto, potrebbero essere costretti ad accettare la sostituzione dei substrati nel processo di biosintesi proteica38. Questa sostituzione globale della prolina è resa possibile dalla flessibilità naturale del substrato delle aminoacil-tRNA sintetasi39 endogene, gli enzimi chiave che catalizzano l'esterificazione dei tRNA con aminoacidi appropriati40. In generale, come descritto nella Figura 3, la crescita cellulare viene eseguita in un mezzo definito fino al raggiungimento della fase di crescita logaritmica media. Nella fase successiva, l'amminoacido da sostituire viene impoverito intracellulare dal sistema di espressione durante la fermentazione e successivamente scambiato dall'analogo desiderato o ncAA. L'espressione proteica bersaglio viene quindi indotta per l'incorporazione di aminoacidi non canonici specifici per residuo. La sostituzione dell'amminoacido affine con il suo analogo avviene in modo proteoma-wide. Sebbene questo effetto collaterale possa avere un impatto negativo sulla crescita del ceppo ospite, la qualità della produzione di proteine bersaglio non è per lo più influenzata, poiché, nell'espressione ricombinante, le risorse cellulari sono principalmente dirette alla produzione della proteina bersaglio41,42. Pertanto, un sistema di espressione strettamente regolamentato e inducibile e forti promotori sono cruciali per un'elevata efficienza di incorporazione43. Il nostro approccio si basa sull'incorporazione multipla di ncAA specifici per residuo in risposta ai codoni sensoriali (riassegnazione del codone sensoriale), per cui all'interno del gene bersaglio, il numero di posizioni per l'inserimento analogico Pro può essere manipolato tramite mutagenesi sito-diretta44. Un approccio simile è stato applicato nella nostra precedente relazione sulla preparazione di peptidi ricombinanti con proprietà antimicrobiche45. In questo lavoro, abbiamo applicato il metodo SPI, che consente a tutti i residui di prolina di essere sostituiti da analoghi correlati, per generare proteine che dovrebbero possedere proprietà fisico-chimiche distinte non presenti nelle proteine sintetizzate con il repertorio di aminoacidi canonici. Caratterizzando il profilo di piegatura e fluorescenza delle varianti risultanti, miriamo a mostrare gli effetti delle sostituzioni atomiche nelle varianti di GFP.
1. Introduzione di plasmidi di espressione nelle cellule competenti di E. coli pro-auxotrofiche
2. Produzione di proteine fluorescenti wild-type ricombinanti (che ospitano prolina canonica) e procedura per l'incorporazione selettiva della pressione (SPI) per produrre proteine fluorescenti con analoghi della prolina (S-Flp, R-Flp, Dfp, Dhp)
3. Procedura di purificazione di campioni proteici mediante cromatografia ad affinità di ioni metallici immobilizzati (IMAC)
4. Preparazione del campione SDS-PAGE
5. Emissione di fluorescenza delle varianti proteiche
6. Denaturazione e ripiegamento delle varianti EGFP
All'inizio dello studio, abbiamo selezionato tre diverse varianti di proteine fluorescenti che condividono l'architettura GFP madre. La prima proteina selezionata è stata EGFP, che è una variante ingegnerizzata derivata dalla GFP originale della medusa Aequorea victoria contenente mutazioni Phe64Leu/Ser65Thr. La seconda proteina selezionata è stata NowGFP51,60. È anche una variante di A. victoria GFP derivata dalla mutagenesi in diversi passaggi attraverso le precedenti proteine fluorescenti. NowGFP contiene 18 mutazioni rispetto al suo immediato predecessore della proteina fluorescente "Cerulean"61. A sua volta, la proteina "Cerulea" è un derivato della proteina fluorescente ciano potenziata (ECFP)62,63, una proteina precedentemente selezionata dall'evoluzione diretta di laboratorio e contenente un cromoforo a base di triptofano. Entrambi, EGFP e NowGFP sono ampiamente utilizzati in biologia cellulare e studi biofisici e contengono dieci residui di prolina conservati nelle loro strutture. Inoltre, NowGFP ha un undicesimo residuo di prolina in posizione 230, che è apparso a causa della vasta storia di mutazioni di questa variante proteica. La terza proteina selezionata è stata la proteina fluorescente KillerOrange64,65. È un derivato della cromoproteina anm2CP del genere idrozoico Anthoathecata. La sequenza proteica contiene 15 residui di prolina e il cromoforo si basa su un triptofano piuttosto che su un residuo di tirosina. Strutture a raggi X ad alta risoluzione sono state riportate per tutte e tre le proteine selezionate (Figura 2)51,65,66.
Nella prima fase, gli analoghi della prolina (Figura 1D) sono stati incorporati in tutte le posizioni della prolina di tre proteine modello (EGFP, NowGFP e KillerOrange) mediante incorporazione selettiva della pressione (SPI, uno schema della procedura è riportato in Figura 3). Strumentalmente, il ceppo E. coli K12 JM8367 proline-auxotrofico è stato utilizzato per l'espressione delle proteine in presenza di prolina e analoghi (Figura 1D), producendo rispettivamente proteine wild-type e modificate. I pellet di cellule che esprimono la proteina nativa e le varianti contenenti S-Flp e Dhp avevano il tipico colore brillante a causa del cromoforo intatto, mentre le varianti contenenti R-Flp e Dfp rimanevano incolori, indicando un misfolding e la deposizione di proteine dispiegate nei corpi di inclusione (Figura 4A). L'analisi SDS-PAGE dei campioni espressi ha verificato la presenza di proteine insolubili contenenti R-Flp (Figura 4B-D), che hanno precluso ulteriori indagini. Sebbene ciò esuli dallo scopo del presente studio, va notato che la solubilità delle proteine e i problemi di misfolding possono essere alleviati in una certa misura dalle procedure di ripiegamento in vitro 68. Al contrario, le proteine native e le varianti portatrici di S-Flp e Dhp sono state trovate principalmente nelle frazioni solubili (Figura 4B-D). Le varianti wild-type, così come quelle contenenti S-Flp e Dhp, potrebbero essere ulteriormente isolate e caratterizzate in studi di fluorescenza. Le proteine solubili sono state purificate mediante cromatografia di affinità ionica metallica immobilizzata (IMAC), producendo 20-30 mg/L di volume di coltura per EGFP, 60-80 mg per NowGFP e KillerOrange, le cui rese per proteine wild-type e modificate erano molto simili. L'analisi accoppiata a cromatografia liquida-spettrometria di massa (LC-MS) ha confermato l'identità e la purezza attese degli isolati ottenuti in questo modo (Figura 5). Negli spettri di massa, ogni sostituzione di prolina con S-Flp ha prodotto uno spostamento di +18 Da per ogni residuo di prolina nella sequenza, mentre per la sostituzione da prolina a Dhp, lo spostamento è stato di -2 Da per residuo.
Nella fase successiva, sono stati registrati spettri di assorbimento ed emissione di luce per analizzare i potenziali effetti dell'incorporazione di analoghi proline non canonici sulle proprietà spettroscopiche delle proteine fluorescenti madri (Figura 6). Gli spettri di assorbimento UV-Vis hanno mostrato una banda tipica di circa 280 nm caratteristica per residui aromatici, tirosina e triptofano, mentre l'assorbanza del cromoforo è stata trovata a 488 nm per EGFP e 493 nm per NowGFP (Figura 6A,B). In KillerOrange, la regione di assorbanza del cromoforo comprendeva due bande (Figura 6C), che corrispondono a due possibili stati configurazionali e di carica del cromoforo complesso. La banda intorno a 510 nm è nota come lo stato da cui avviene la fluorescenza con alta resa quantistica49,65. Nelle varianti di sostituzione della prolina, è stato osservato quanto segue: l'incorporazione di Dhp non ha modificato gli spettri di assorbanza di EGFP e NowGFP, mentre S-Flp ha prodotto un maggiore assorbimento UV. Quest'ultimo può essere spiegato dalle differenze indotte nei microambienti residui di triptofano, in particolare Trp57 inserito tra tre S-Flp nel motivo PVPWP (Figura 6A,B)69. Una spiegazione più banale per un maggiore assorbimento UV, tuttavia, può derivare da una maggiore frazione di proteine piegate in modo improprio. Poiché la concentrazione della proteina è stata valutata mediante quantificazione delle caratteristiche di assorbanza, la presenza di una proteina con un cromoforo impropriamente maturo può aumentare l'assorbanza, mentre questa frazione non viene conteggiata nella concentrazione complessiva (Figura 6A,B). A sostegno di questa ipotesi, abbiamo osservato che l'EGFP contenente S-Flp ha mostrato un rapporto marcatamente ridotto di cromoforo rispetto all'assorbanza combinata di triptofano e tirosina (ε (CRO) / ε (Tyr + Trp) = 0,96) rispetto a un valore più alto (1,57) nella proteina madre (Tabella 2) 70. La presenza di una frazione non fluorescente nell'EGFP contenente S-Flp sarà un importante fattore che contribuirà ad un'ulteriore analisi delle proprietà proteiche. Nella variante KillerOrange contenente S-Flp, è stata osservata una maggiore assorbanza insieme a uno spostamento verso il rosso nella banda cromofora. Questo fatto indicava che la formazione del cromoforo favoriva una configurazione con una grande resa quantistica di fluorescenza (Figura 6C).
Successivamente, abbiamo analizzato gli spettri di fluorescenza delle proteine registrate al momento dell'eccitazione alle corrispondenti lunghezze d'onda di assorbanza massima. I risultati mostrano che gli spettri sono rimasti essenzialmente identici per le varianti proteiche fluorescenti esaminate contenenti prolina e sostituzioni, S-Flp e Dhp. Questo risultato implica che gli analoghi non hanno alterato l'ambiente chimico del cromoforo in ogni caso (Figura 6G-I). Nonostante questo fatto, sono state osservate marcate differenze negli spettri di fluorescenza di KillerOrange registrati all'eccitazione a 295 nm, quindi all'eccitazione del triptofano. Questo esperimento traccia il trasferimento di energia di risonanza di fluorescenza (FRET) o l'accoppiamento eccitonico diretto che si verifica tra le catene laterali del triptofano e il cromoforo maturo poiché entrambi si trovano a una breve distanza non superiore a 25 Å. Per le varianti EGFP e NowGFP, quando gli spettri di emissione sono stati misurati utilizzando l'eccitazione a 295 nm, è stata osservata una forte emissione di cromoforo insieme a quasi nessuna emissione di triptofano (Figura 6D, E). Tuttavia, le varianti contenenti S-Flp hanno mostrato un'emissione specifica di triptofano leggermente più grande. Questa osservazione può essere collegata a un contributo incalcolabile dell'apoproteina dispiegata che contiene triptofani ma non il cromoforo maturo. In KillerOrange è stato osservato un aumento sostanziale dell'emissione specifica di triptofano, indicando una mancanza di tempra della fluorescenza attraverso il meccanismo atteso di trasferimento di energia di eccitazione o accoppiamento eccitonico. Le varianti proteiche contenenti prolina e S-Flp hanno mostrato un'emissione di triptofano comparabile insieme alla caratteristica di fluorescenza spostata verso il rosso preferita di un'alta resa quantistica. Al contrario, la variante che conteneva Dhp ha mostrato una drastica diminuzione dell'intensità di fluorescenza del cromoforo, presumibilmente a causa di effetti strutturali minori (Figura 6F).
Successivamente, abbiamo confrontato le proprietà di ripiegamento delle proteine eseguendo un esperimento di dispiegamento / rinaturazione. Gli spettri di emissione di fluorescenza sono stati registrati nello stato piegato (sezione 5 del protocollo), dopo denaturazione chimica e, successivamente, nel processo di ripiegamento monitorato per un periodo di 24 ore (sezione 6 del protocollo). Gli spettri sono stati registrati dopo eccitazione a entrambe le lunghezze d'onda rilevanti, 295 nm, e ai massimi degli spettri di assorbanza dei cromofori, mentre la fluorescenza risultante è presentata come normalizzata al valore massimo per ciascuna proteina (Figura 7). Alla fine del protocollo, abbiamo osservato che le varianti EGFP potevano ripiegarsi, mentre le varianti NowGFP e KillerOrange - una volta denaturate - rimanevano dispiegate (dati non mostrati). Pertanto, le capacità di ripiegamento delle proteine di fluorescenza originali variavano in modo sostanziale. Da notare, KillerOrange è stato sviluppato come fotosensibilizzatore a partire dalla variante della cromoproteina idrozoica KillerRed65,71, e il suo ripiegamento in genere è in ritardo nonostante la robusta struttura a canna β. Nei nostri esperimenti, abbiamo scoperto che la fluorescenza del cromoforo EGFP wild-type si è recuperata solo parzialmente, sebbene la fluorescenza specifica del triptofano fosse più grande dopo la rinaturazione (Figura 7A, D). Un comportamento essenzialmente simile è stato osservato nella variante contenente Dhp (Figura 7C,F). Nell'EGFP contenente S-Flp, un risultato simile è stato osservato quando l'eccitazione è stata eseguita alla lunghezza d'onda specifica del triptofano di 295 nm (Figura 7B). Sorprendentemente, la fluorescenza si è ripresa a un livello molto più elevato quando il cromoforo è stato eccitato a 488 nm (Figura 7E). Sembra che S-Flp induca una resa di ripiegamento molto migliore rispetto alle altre due varianti. Tuttavia, questo effetto benefico non è stato osservato quando si utilizza l'eccitazione a 295 nm a causa di interazioni molecolari sconosciute.
Successivamente, la velocità di ripiegamento è stata monitorata registrando separatamente la fluorescenza sia del triptofano che del cromoforo, mentre l'endpoint del processo è stato determinato a 24 ore dopo l'inizio della rinaturazione. Solo le varianti EGFP hanno mostrato una cinetica di ripiegamento relativamente veloce che poteva essere valutata in modo affidabile, mentre nessuna delle varianti Denaturate NowGFP e KillerOrange poteva recuperare a un valore che consentisse ulteriori misurazioni quantitative. In EGFP, il recupero delle emissioni di triptofano è stato due volte più veloce (completato in 750 s) rispetto al recupero dell'emissione di cromoforo (completato in 1.500 s), indicando la complessità dei processi sottostanti (Figura 8). Ad entrambe le lunghezze d'onda di eccitazione, la velocità di ripiegamento è stata elevata dalla presenza di S-Flp, in accordo con i dati di letteratura25. Allo stesso tempo, la variante contenente Dhp ha mostrato un profilo di ripiegamento simile al wild-type.
Figura 1: Scaffold strutturale della proteina fluorescente verde (GFP), costruzione di cromofori, transizioni conformazionali proline e analoghi sintetici utilizzati in questo studio. (A) La struttura della GFP è costituita dai β-fili che formano una canna quasi perfetta (cioè una "lattina" con dimensioni 4,2 nm x 2,4 nm) che è tappata ad entrambe le estremità da coperchi α elicoidali. La proteina GFP da 27 kDa mostra una struttura terziaria costituita da undici β-filamenti, due brevi α-eliche e il cromoforo nel mezzo. Gli stati conformazionali delle proline adiacenti sono legati alla formazione di cromofori. (B) La maturazione autocatalitica (condensazione) del cromoforo avviene presso i residui Ser65, Tyr66 e Gly67 e procede in diverse fasi: in primo luogo, regolazioni torsionali nella spina dorsale polipeptidica per portare il carbonio carbossilico di Thr65 in prossimità dell'azoto ammidico di Gly67. Quindi, la formazione di un sistema di anelli eterociclici imidazolina-5-uno si verifica dopo l'attacco nucleofilo a questo atomo di carbonio da parte dell'azoto ammidico della glicina e la successiva disidratazione. Infine, il sistema acquista fluorescenza visibile quando l'ossidazione del legame tirosina alfa-beta carbonio da parte dell'ossigeno molecolare porta all'estensione del sistema coniugato del sistema ad anello imidazolina, alla fine includendo l'anello fenilico tirosina e il suo sostituente para-ossigeno. Il cromoforo para-idrossibenzilidene imidazolinone risultante al centro del β-barile è completamente separato dal solvente sfuso. (C) Le formule e le geometrie della struttura scheletrica di 1) l'anello prolineo (puckers) e 2) il legame ammidico precedente rappresentano le principali transizioni conformazionali del residuo proline. (D) Gli analoghi di prolina utilizzati in questo lavoro con i pucker ad anello di prolina designati. La figura è stata generata utilizzando ChemDraw e Discovery Studio Visualizer. La struttura GFP proviene dalla voce della struttura PDB 2Q6P. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 2: Proteine fluorescenti utilizzate in questo studio. I pannelli mostrano la rappresentazione a nastro delle tipiche strutture β-barrel di tre diverse varianti di proteine fluorescenti: EGFP, NowGFP e KillerOrange, con il colore del nastro che rappresenta il colore dell'emissione di fluorescenza di ciascuna variante. I residui di prolina (codice di una lettera) sono evidenziati come bastoncini e le posizioni appropriate sono annotate. I cromofori sono mostrati con la composizione iniziale degli aminoacidi in grassetto. Tutte le rappresentazioni della struttura sono state prodotte con PyMol sulla base delle seguenti voci della struttura PDB: 2Q6P per EGFP, 4RYS per NowGFP, 4ZFS per KillerOrange. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 3: Presentazione del diagramma di flusso del metodo SPI per l'incorporazione specifica del residuo di analoghi prolineici non canonici. Un ceppo ospite di Escherichia coli (E. coli) proline-auxotrofico che trasporta il gene di interesse su un plasmide di espressione viene coltivato in un mezzo minimo definito con tutti i 20 amminoacidi canonici fino a raggiungere un OD600 di ~ 0,7 in cui la coltura cellulare è nella fase di crescita logaritmica media. Le cellule vengono raccolte e trasferite in un mezzo minimo fresco contenente 19 amminoacidi canonici e un analogo della prolina. Dopo l'aggiunta di un induttore, l'espressione proteica viene eseguita durante la notte. Infine, la proteina bersaglio viene isolata mediante lisi cellulare e purificata prima di ulteriori analisi. In una variante del protocollo, le cellule vengono coltivate in un mezzo minimo definito con 19 aminoacidi canonici e la prolina viene aggiunta in quantità limitata (ad esempio, un quinto della concentrazione degli altri amminoacidi). Con questa misura, le cellule esauriscono la prolina nel mezzo prima che possano uscire dalla fase di crescita logaritmica, e quindi, successivamente, viene aggiunto l'analogo e viene indotta la produzione di proteine di interesse. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 4: Analisi dell'espressione delle varianti EGFP, NowGFP e KillerOrange. (A) Pellet cellulari da 1 mL di coltura di espressione, normalizzati a OD600 = 2. Analisi SDS-PAGE delle varianti (B) EGFP, (C) NowGFP e (D) KillerOrange. Le frazioni solubili (S) e insolubili (I) di ciascun derivato proteico fluorescente sono state caricate su gel di acrilammide al 15% e frazioni eluite (E) da IMAC di proteine solubili. PageRuler Unstained Protein Ladder è stato utilizzato come marcatore (M) nelle corsie indicate con (M). Le regioni attese della particolare proteina sono incorniciate. Gli amminoacidi incorporati nelle posizioni della prolina sono Pro, R-Flp, S-Flp e Dhp (in (A) pellet di cellule da varianti proteiche fluorescenti che incorporano Dfp invece di Dhp sono mostrati). I gel sono stati colorati dell'1% (p/v) di Coomassie Brillant Blue. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 5: Analisi spettrometrica di massa di varianti proteiche fluorescenti. (A) Spettri ESI-MS deconvoluti rappresentativi di H6-tagged EGFP (nero), S-Flp-EGFP (arancione) e Dhp-EGFP (ciano) con la posizione dei principali picchi di massa forniti come numeri (in Da). Le masse molecolari calcolate [M+H]+ delle proteine H6-marcate sono: Per EGFP 27.745,33 Da (osservati 27.746,15 Da); per S-Flp-EGFP 27.925,33 Da (osservato 27.925,73 Da); per Dhp-EGFP 27,725.33 Da (osservato 27,726,01 Da). (B) Spettri ESI-MS deconvoluti rappresentatividi NowGFP (nero), S-Flp-NowGFP (arancione) e Dhp-NowGFP (ciano) con la posizione dei principali picchi di massa forniti come numeri (in Da). Le masse calcolate delle proteine H6-tagged sono: Per NowGFP 27.931,50 Da (osservata 27.946,46 Da; la differenza di ~16 Da è probabilmente dovuta all'ossidazione di una metionina nella proteina); per S-Flp-NowGFP 28,129.50 Da (osservato 28,130.08 Da); per Dhp-NowGFP 27,909.50 Da (osservato 27,910.22 Da). (C) Spettri ESI-MS deconvoluti rappresentatividi KillerOrange (nero), S-Flp-KillerOrange (arancione) e Dhp-KillerOrange (ciano) con la posizione dei principali picchi di massa forniti come numeri (in Da). Le masse calcolate delle proteine H6-tagged sono: Per KillerOrange 27.606,09 Da (osservate 27.605,91 Da); per S-Flp-KillerOrange 27,876.09 Da (osservato 27,876.08 Da); per Dhp-KillerOrange 27,576.09 Da (osservato 27,575.93 Da). Le deviazioni tra le masse molecolari osservate e calcolate di circa 1 Da rientrano nell'intervallo di errore dell'apparecchiatura ESI-MS. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 6: Spettri di assorbimento della luce e di emissione di fluorescenza di varianti proteiche fluorescenti. Gli spettri di assorbimento UV-Vis normalizzati sono mostrati per le varianti ( A) di EGFP, (B) di NowGFP e (C) di KillerOrange. Gli spettri sono stati normalizzati al massimo dell'assorbanza cromoforica (circa 500 nm). Gli spettri di emissione di fluorescenza normalizzati sono mostrati delle varianti (D, G) di EGFP, (E, H) di NowGFP e (F, I) di KillerOrange. Gli spettri in (D,E,F) sono stati misurati dopo l'eccitazione con luce ultravioletta (295 nm), per gli spettri in (G,H,I) 488 nm, 493 nm e 510 nm di luce sono stati utilizzati per l'eccitazione, rispettivamente, e gli spettri sono stati normalizzati ai rispettivi massimi di emissione di cromoforo (circa 500 nm). In ogni pannello, le curve nere corrispondono agli spettri della variante proteica fluorescente con prolina nativa, le curve arancioni indicano gli spettri delle proteine sostituite da S-Flp e le curve blu corrispondono alle proteine sostituite da Dhp. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 7: Spettri di emissione di fluorescenza delle varianti EGFP negli esperimenti di ripiegamento. Spettri di emissione di fluorescenza normalizzati di soluzioni da 0,3 μM di varianti proteiche fluorescenti allo stato nativo e dopo denaturazione e ripiegamento: gli spettri in (A, B, C) sono stati misurati dopo l'eccitazione con luce ultravioletta (295 nm ) (A) per EGFP, (B) per S-Flp-EGFP e (C) per Dhp-EGFP. Gli spettri in (D,E,F) sono stati misurati all'eccitazione con luce verde (488 nm) (D) per EFGP, (E) per S-Flp-EGFP e (F) per Dhp-EGFP. Gli spettri di emissione dei campioni nativi (curve nere) e ripiegati (verde corrisponde a EGFP, arancione a S-Flp-EGFP e blu a Dhp-EGFP, rispettivamente) di ciascuna variante proteica sono normalizzati alla massima fluorescenza dello stato nativo appropriato. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 8: Monitoraggio del ripiegamento proteico e della maturazione cromoforica delle varianti EGFP con fluorescenza. (A) Emissione di fluorescenza nella regione di fluorescenza Trp (l'emissione è stata impostata a 330 nm) registrata dopo l'eccitazione con luce ultravioletta (295 nm). (B) Sviluppo dell'ampiezza di fluorescenza nella regione di emissione del cromoforo dopo eccitazione con luce verde (488 nm). Le tracce di fluorescenza time-dipendenti sono state normalizzate all'unità (100%) in base all'ampiezza di fluorescenza raggiunta alla fine dell'intervallo di monitoraggio. In ogni pannello, le curve nere corrispondono agli spettri della variante proteica fluorescente con prolina nativa, le curve arancioni indicano gli spettri delle proteine sostituite da S-Flp e le curve blu corrispondono alle proteine sostituite da Dhp. Fare clic qui per visualizzare una versione più grande di questa figura.
Costruire | Sequenze di amminoacidi (6xHis tag sottolineato): | |||
EGFP-H6 | MVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVP WPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTR AEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVN FKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDH MVLLEFVTAAGITLGMDELYKHHHHHHHHH | |||
H6-NowGFP | MRGSHHQHHHGSVSKGEKLFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGK MSLKFICTTGKLPVPWPTLKTTLTWGMQCFARYPDHMKQHDFFKSAMPEGY VQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGVDFKEDGNILGHKLEYN AISGNANITADKQKNGIKAYFTIRHDVEDGSVLLADHYQQNTPIGDGPVLLPD NHYLSTQSKQSKDPNEKRDHMVLLEFVTAAGIPLGADELYK | |||
H6-KillerOrange | MRGSHHHHHHGSECGPALFQSDMTFKIFIDGEVNGQKFTIVADGSSKFPH GDFNVHAVCETGKLPMSWKPICHLIQWGEPFFARYPDGISHFAQECFPEG LSIDRTVRFENDGTMTSHHTYELSDTCVVSRITVNCDGFQPDGPIMRDQ LVDILPSETHMFPHGPNAVRQLAFIGFTTADGGLMMGHLDSKMTFNGSR AIEIPGPHFVTIITKQMRDTSDKRDHVCQREVAHAHSVPRITSAIGSDQD |
Tabella 1: Strutture primarie delle proteine bersaglio. I suoi tag sono sottolineati in ogni sequenza.
λ [nm] | ε [M-1·cm-1] (EGFP) | ε [M-1·cm-1] (S-Flp-EGFP) | ε [M-1·cm-1] (Dhp-EGFP) |
488 (≡ CRO) | 31.657 (± 1.341) | 22.950 (± 290) | 27.800 (± 542) |
280 (≡ Tyr+Trp) | 20.116 (± 172) | 23.800 (± 715) | 17.300 (± 554) |
I valori per il coefficiente di estinzione ε (in M-1·cm-1) sono calcolati dagli spettri di assorbimento UV-Vis registrati di varianti EGFP appropriate utilizzando concentrazioni proteiche note. La lunghezza d'onda selezionata a 280 nm corrisponde alla massima assorbanza dei residui aromatici, tirosina e triptofano, e 488 nm rappresenta la lunghezza d'onda di assorbimento del cromoforo. |
Tabella 2: Coefficienti di estinzione (ε) delle varianti EGFP a lunghezze d'onda selezionate. I valori per il coefficiente di estinzione ε (in M-1·cm-1) sono calcolati dagli spettri di assorbimento UV-Vis registrati di varianti EGFP appropriate utilizzando concentrazioni proteiche note. La lunghezza d'onda selezionata di 280 nm corrisponde alla massima assorbanza dei residui aromatici, tirosina e triptofano, mentre 488 nm rappresenta la massima lunghezza d'onda di assorbimento del cromoforo.
Materiale supplementare: Preparazione di soluzioni stock e buffer Fare clic qui per scaricare questo file.
In natura, le manipolazioni con strutture e funzioni proteiche si verificano tipicamente a causa di mutazioni, il fenomeno che porta a uno scambio di identità di un amminoacido in determinate posizioni nella sequenza proteica. Questo meccanismo naturale è ampiamente applicato come metodo biotecnologico per l'ingegneria proteica sotto forma di mutagenesi e si basa sul repertorio dei 20 amminoacidi canonici coinvolti nel processo. Lo scambio di residui di prolina è tuttavia problematico. A causa della sua speciale architettura a gruppo backbone, è difficilmente intercambiabile con i restanti 19 residui per la sostituzione72. Ad esempio, la prolina è tipicamente nota come rompistruttura secondaria nelle sequenze polipeptidiche a causa della sua scarsa compatibilità con le strutture secondarie più comuni, cioè α-elica e β-filamento. Questa caratteristica della prolina si perde facilmente quando il residuo viene mutato in un altro amminoacido del repertorio comune. La sostituzione della prolina con i suoi analoghi chimici offre un approccio alternativo, che consente di mantenere le caratteristiche di base della spina dorsale del residuo di prolina madre, imponendo distorsioni sulle sue specifiche transizioni conformazionali o producendo modulazioni del volume molecolare e della polarità. Ad esempio, è possibile fornire colture batteriche con strutture analogiche come idrossi-, fluoro-, alchil-, deidroproline, strutture con dimensioni di anello variabili e altro ancora, facilitando così la produzione di una proteina contenente specifiche alterazioni dei residui di prolina.
Il metodo di incorporazione selettiva della pressione (SPI) descritto in questo studio consente una sostituzione globale, cioè specifica del residuo, di tutte le proline nella proteina bersaglio con analoghi chimici correlati. L'importanza del metodo è riflessa dal fatto che SPI consente di creare cambiamenti di sequenza inaccessibili alle comuni tecniche di mutagenesi. Ad esempio, consente la produzione di una proteina bersaglio contenente cambiamenti strutturali piuttosto piccoli che in genere non possono superare una o due sostituzioni / delezioni / aggiunte di atomi, come dimostrato in questo studio. Tali modificazioni proteiche sono soprannominate "mutazioni atomiche"73,74. In una proteina fluorescente come la GFP, il risultato di questa intrusione molecolare può essere visto nella velocità di ripiegamento, nelle polarità locali, nell'impacchettamento delle proteine, nella stabilità delle caratteristiche strutturali coinvolte. I cambiamenti nelle proprietà di assorbanza e fluorescenza sono prodotti indirettamente a causa dell'impatto sul ripiegamento delle proteine e sui microambienti residui. La precisione dei cambiamenti molecolari eseguiti da SPI è in genere molto più elevata, rispetto alle mutazioni di proline ad altri residui canonici, questi ultimi tipicamente dannosi per il ripiegamento, la produzione e l'isolamento delle proteine.
Come metodo di produzione, l'approccio SPI utilizza la tolleranza del substrato della tasca aminoacil-tRNA sintetasi verso analoghi chimici dell'amminoacido nativo. La sintetasi è responsabile della corretta identificazione della struttura dell'amminoacido, mentre l'incorporazione nelle proteine avviene a valle nel processo di traduzione. Strumentalmente, la produzione, l'isolamento e la purificazione delle proteine in SPI vengono eseguiti in un modo tipico di qualsiasi altra tecnica di espressione proteica ricombinante; tuttavia, con alcune aggiunte al protocollo come segue: La prolina, che è destinata alla sostituzione, viene fornita all'inizio del processo di fermentazione, in modo tale che le cellule possano crescere e sviluppare il loro meccanismo cellulare intatto. Tuttavia, la coltura cellulare non è autorizzata a raggiungere la massima densità ottica, per mantenere le cellule nella fase logaritmica ottimale per l'espressione proteica. Ci sono due principali varianti del metodo SPI a questo punto. Nel primo, la concentrazione di prolina viene regolata nel mezzo di crescita iniziale (un mezzo chimicamente definito) in modo tale che l'esaurimento della prolina avvenga senza alcuna intrusione esterna. Le cellule esauriscono la prolina nel mezzo prima che possano uscire dalla fase di crescita logaritmica, e quindi, successivamente, viene aggiunto l'analogo e viene indotta la produzione di proteine di interesse. Nella seconda versione del metodo, le cellule vengono coltivate nel mezzo contenente prolina fino alla metà della loro fase logaritmica. A questo punto, le cellule dovrebbero essere estratte e trasferite fisicamente in un altro mezzo, che non contiene più prolina, solo l'analogico, con successiva induzione della proteina di interesse. In entrambe le versioni, l'analogo e il reagente di induzione proteica vengono forniti alle cellule pre-cresciute. L'isolamento e la purificazione della proteina wild-type vengono eseguiti allo stesso modo delle varianti. In linea di principio, ogni ceppo pro-auxotrofico disponibile può essere utilizzato come ospite di espressione. Tuttavia, sono consigliabili test di espressione per identificare l'ospite più adatto. Inoltre, i test di diversi mezzi chimicamente definiti possono essere utilizzati per ottimizzare la resa proteica.
Ci sono alcuni requisiti riguardanti gli analoghi chimici che devono essere considerati per SPI, come la solubilità e la concentrazione. La disponibilità metabolica e l'assorbimento degli amminoacidi dipendono dal numero di molecole disciolte nel mezzo. Per aumentare la solubilità di un particolare composto, è possibile scegliere condizioni leggermente acide o alcaline. Poiché le molecole artificiali possono causare effetti inibitori della crescita a causa della loro tossicità cellulare, la concentrazione deve essere abbassata al minimo per evitare lo stress cellulare75.
Un piccolo punto debole di SPI è la diminuzione dell'efficienza di incorporazione con un numero maggiore di posizioni che devono essere scambiate. In linea di principio, una riduzione della frequenza degli amminoacidi all'interno della biomolecola bersaglio mediante mutagenesi diretta al sito può risolvere questo problema. Tuttavia, le proprietà strutturali e funzionali di una proteina desiderata potrebbero essere influenzate dalla modifica della struttura primaria.
Come accennato in precedenza, SPI consente la sostituzione specifica del residuo dell'amminoacido canonico. Ciò implica che gli amminoacidi non canonici sono inseriti in ogni posizione dell'amminoacido canonico all'interno della proteina bersaglio, compresi i residui conservati che sono indispensabili per la funzione proteica o il ripiegamento. Metodi alternativi per l'incorporazione specifica del sito sono l'unica possibilità per superare questo problema3. Negli ultimi decenni è stato sviluppato il metodo della coppia ortogonale in grado di produrre proteine contenenti residui modificati in siti predefiniti. La modifica più comune di questo metodo è nota come soppressione del codone di arresto. Questo metodo si basa su un sistema di traduzione ortogonale ingegnerizzato dedicato all'incorporazione site-specific di amminoacidi sintetici76. Più di 200 amminoacidi con diverse modifiche della catena laterale sono stati incorporati nelle proteine fino ad oggi utilizzando questo approccio77. Tuttavia, questi sistemi di traduzione non sono ancora adatti per l'inserimento di analoghi della prolina nelle proteine bersaglio. Inoltre, le prestazioni del metodo sono considerate basse nel caso di modifiche minori degli amminoacidi perché una certa promiscuità di fondo dell'aminoacil-tRNA sintetasi rimane tipicamente nei sistemi di traduzione ingegnerizzati.
Utilizzando SPI, abbiamo prodotto una serie di varianti proteiche fluorescenti a β barile e studiato i risultati dello scambio di prolina con i suoi analoghi innaturali. Nel caso della sostituzione della prolina con R-Flp e Dfp, una proteina disfunzionale è stata prodotta dall'ospite di espressione. L'effetto è probabilmente prodotto dal misfolding delle proteine. Quest'ultimo può avere origine dalla conformazione C 4-eso promossa da R-Flp, che non è favorita dalle strutture proteiche genitrici27. Con Dfp, è probabile che il misfolding sia prodotto dalla diminuita velocità dell'isomerizzazione del legame peptidico trans-cis al residuo di prolina27. Quest'ultimo è noto per essere tra i passaggi limitanti nel profilo cinetico del ripiegamento proteico che influenza la formazione β-barile e la successiva maturazione del cromoforo. Infatti, per entrambi gli amminoacidi, R-Flp e Dfp, la produzione di proteine ha portato a una proteina aggregata e insolubile. Di conseguenza, la formazione di cromofori non poteva verificarsi e la fluorescenza è stata completamente persa. Con S-Flp e Dhp, tuttavia, è stata osservata una corretta maturazione proteica, con conseguente campionamento proteico fluorescente per ogni combinazione analogica/proteica. Nonostante alcune modulazioni nelle caratteristiche di assorbanza e fluorescenza della proteina, queste sono rimaste in gran parte simili a quelle delle proteine wild-type. L'effetto della sostituzione degli aminoacidi è stato rivelato negli studi di cinetica di ripiegamento. Quest'ultimo ha mostrato un ripiegamento più rapido in caso di sostituzione con S-Flp. Studi di modello hanno dimostrato che questo residuo può generare qualche miglioramento nella velocità di rotazione dell'ammide trans-cis e portare alla formazione della conformazione C 4-endo. Entrambi questi fattori possono contribuire agli effetti cinetici benefici di questo residuo in EGFP. Al contrario, Dhp ha prodotto profili di ripiegamento cinetico massimamente simili alla proteina madre. La diversità dei risultati prodotti da semplici mutazioni atomiche nelle proteine fluorescenti esaminate illustra il potenziale del metodo di produzione SPI nell'alterare le proprietà della proteina bersaglio. Le alterazioni proteiche indotte dalla sostituzione della prolina con gli analoghi hanno ulteriori implicazioni nell'ingegnerizzazione degli enzimi 78,79,80 e dei canali ionici 81,82, nonché nell'ingegneria generale della stabilità proteica.
La limitazione di base del metodo SPI è la sua modalità "all-or-none" nello scambio di proline risiede con analoghi correlati. Sarebbe di grande vantaggio poter selezionare con precisione, quali residui di prolina dovrebbero essere sostituiti con gli analoghi e quali dovrebbero rimanere invariati. Tuttavia, al momento, non esiste una tecnica che possa eseguire una produzione così sofisticata utilizzando un ospite di produzione microbica. La sintesi chimica delle proteine83,84, così come la produzione senza cellule85,86, sono i due metodi alternativi che possono produrre modifiche della prolina specifiche della posizione. Tuttavia, la loro complessità operativa e le basse rese di produzione li rendono inferiori rispetto alla produzione nelle cellule viventi. A partire da ora, SPI rimane l'approccio più semplice e robusto dal punto di vista operativo per la produzione di proteine complesse portatrici di mutazioni atomiche. Introducendo sostituti inalteranti degli aminoacidi, il metodo consente di modificare le caratteristiche proteiche in modo mirato, come esemplificato qui dalle alterazioni nel ripiegamento e dall'assorbimento / emissione di luce delle proteine fluorescenti generate dai sostituti della prolina.
Gli autori rivelano tutti e tutti i conflitti di interesse.
Questo lavoro è stato supportato dalla German Research Foundation (Cluster of Excellence "Unifying Systems in Catalysis) a T.F. e N.B. e dal Ministero Federale dell'Istruzione e della Scienza (Programma BMBF "HSP 2020", Progetto TU-WIMIplus SynTUBio) a F.-J.S. e T.M.T.T.
Name | Company | Catalog Number | Comments |
Acetonitrile | VWR | HiPerSolv CHROMANORM ULTRA for LC-MS, 83642 | LC-MS grade required |
Acrylamide and bisacrylamide aqueous stock solution at a ratio of 37.5:1 (ROTIPHORESE Gel 30) | Carl Roth | 3029.1 | |
Agar-agar | Carl Roth | 5210 | |
Ammonium molybdate ((NH4)2MoO4) | Sigma-Aldrich | 277908 | |
Ammonium peroxydisulphate (APS) | Carl Roth | 9592.2 | ≥98 %, p.a., ACS grade required |
Ammonium sulfate ((NH4)2SO4) | Sigma-Aldrich | A4418 | |
Ampicillin sodium salt | Carl Roth | K029 | |
Biotin | Sigma-Aldrich | B4501 | |
Bromophenol blue | Sigma-Aldrich | B0126 | |
Calcium chloride (CaCl2) | Sigma-Aldrich | C5670 | |
Coomassie Brillant Blue R 250 | Carl Roth | 3862 | |
Copper sulfate (CuSO4) | Carl Roth | CP86.1 | |
D-glucose | Carl Roth | 6780 | |
1,2-Bis-(dimethylamino)-ethane, N,N,N',N'-Tetramethylethylenediamine (TEMED) | Carl Roth | 2367.3 | ≥99 %, p.a., for electrophoresis |
1,4-dithiothreitol (DTT) | Carl Roth | 6908 | |
Dichloromethane (DCM) | Sigma-Aldrich | 270997 | |
di-potassium hydrogen phosphate (K2HPO4) | Carl Roth | P749.1 | |
di-sodium hydrogen phosphate (Na2HPO4) | Carl Roth | X987 | |
DNase I | Sigma-Aldrich | D5025 | |
Dowex 50WX8-100 (hydrogen form) | Acros Organics / Thermo Fisher Scientific (Waltham, U.S.A.) | 10731181 | cation exchange resin |
Ethanol | Carl Roth | 9065.1 | |
Formic acid | VWR | HiPerSolv CHROMANORM for LC-MS, 84865 | LC-MS grade required |
Glacial acetic acid | Carl Roth | 3738.5 | 100 %, p. a. |
Glycerol | Carl Roth | 3783 | |
Imidazole | Carl Roth | X998 | |
Hydrogen chlroide (HCl) | Merck | 295426 | |
Iron(II) chloride (FeCl2) | Sigma-Aldrich | 380024 | |
Isopropanol | Carl Roth | AE73.1 | |
Isopropyl β-D-1-thiogalactopyranoside (IPTG) | Sigma-Aldrich | I6758 | |
Lysozyme | Sigma-Aldrich | L6876 | |
Magnesium chloride (MgCl2) | Carl Roth | KK36.1 | |
Magnesium sulfate (MgSO4) | Carl Roth | 8283.2 | |
Manganese chloride (MnCl2) | Sigma-Aldrich | 63535 | |
β-mercaptoethanol | Carl Roth | 4227.3 | |
PageRuler Unstained Protein Ladder | Thermo Fisher Scientific | 26614 | |
Potassium chloride (KCl) | Carl Roth | 6781.3 | |
Potassium dihydrogen phosphate (KH2PO4) | Sigma-Aldrich | P5655 | |
RNase A | Carl Roth | 7156 | |
Sodium chloride (NaCl) | Carl Roth | P029 | |
Sodium dihydrogen phosphate (NaH2PO4) | Carl Roth | T879 | |
Sodium dodecyl sulphate (NaC12H25SO4) | Carl Roth | 0183 | |
Thiamine | Sigma-Aldrich | T4625 | |
Trifluoroacetic acid (TFA) | Sigma-Aldrich | T6508 | |
Tris hydrochloride (Tris-HCl) | Sigma-Aldrich | 857645 | |
Tris(hydroxymethyl)-aminomethane (Tris) | Carl Roth | 5429 | |
Tryptone | Carl Roth | 8952 | |
Yeast extract | Carl Roth | 2363 | |
Zinc chloride (ZnCl2) | Sigma-Aldrich | 229997 | |
L-alanine | Sigma-Aldrich | A7627 | |
L-arginine | Sigma-Aldrich | A5006 | |
L-asparagine | Sigma-Aldrich | A8381 | |
L-aspartic acid | Sigma-Aldrich | A0884 | |
L-cysteine | Sigma-Aldrich | C7352 | |
L-glutamic acid | Sigma-Aldrich | G2128 | |
L-glutamine | Sigma-Aldrich | G3126 | |
L-glycine | Sigma-Aldrich | G7126 | |
L-histidine | Sigma-Aldrich | H8000 | |
L-isoleucine | Sigma-Aldrich | I2752 | |
L-leucine | Sigma-Aldrich | L8000 | |
L-lysine | Sigma-Aldrich | L5501 | |
L-methionine | Sigma-Aldrich | M9625 | |
L-phenylalanine | Sigma-Aldrich | P2126 | |
L-proline | Sigma-Aldrich | P0380 | |
L-serine | Sigma-Aldrich | S4500 | |
L-threonine | Sigma-Aldrich | T8625 | |
L-tryptophan | Sigma-Aldrich | T0254 | |
L-tyrosine | Sigma-Aldrich | T3754 | |
L-valine | Sigma-Aldrich | V0500 | |
(4S)-fluoroproline | Bachem | 4033274 | Make sure that all proline analogs are proline free, check content. Otherwise include a step to consume proline contaminations during expression. |
(4R)-fluoroproline | Bachem | 4033275 | Make sure that all proline analogs are proline free, check content. Otherwise include a step to consume proline contaminations during expression |
3,4-dehydroproline | Bachem | 4003545 | Make sure that all proline analogs are proline free, check content. Otherwise include a step to consume proline contaminations during expression |
4,4-difluoroproline | Enamine | EN400-17448 | Make sure that all proline analogs are proline free, check content. Otherwise include a step to consume proline contaminations during expression |
Conical polystyrene (Falcon) tubes, 15 mL | Fisher Scientific | 14-959-49B | |
Conical polystyrene (Falcon) tubes, 50 mL | Fisher Scientific | 14-432-22 | |
Dialysis membrane, Molecular Weight Cut-Off (MWCO) 5,000 | Spectrum Medical Industries | Spectra/Por MWCO 5000 dialysis membrane, 133198 | |
Immobilized Metal ion Affinity Chromatography (IMAC) column 1 mL, Ni-NTA | GE Healthcare | HisTrap HP, 1 mL, 17-5247-01 | |
Luer-Lock syringe, 5 mL | Carl Roth | EP96.1 | |
Luer-Lock syringe, 20 mL | Carl Roth | T550.1 | |
Luer-Lock syringe, 50 mL | Carl Roth | T552.1 | |
Microcentrifuge tubes, 1.5 mL | Eppendorf | 30120086 | |
Petri dishes (polystyrene, sterile) | Carl Roth | TA19 | |
pQE-80L plasmid vector | Qiagen | no longer available | replaced by N-terminus pQE Vector set Cat No./ID: 32915 |
Pro-auxotrophic E. coli strain JM83 | Addgene | 50348 | https://www.addgene.org/50348/ |
Pro-auxotrophic E. coli strain JM83 | ATCC | 35607 | |
Round-bottom polystyrene tubes, 14 mL | Fisher Scientific | Corning Falcon, 14-959-1B | |
Syringe filter 0.45 µm with polyvinylidene difluoride (PVDF) membrane | Carl Roth | CCY1.1 | |
High-Performance Liquid Chromatography (HPLC) column for LC-ESI-TOF-MS | Sigma-Aldrich | Supelco Discovery BIO Wide Pore C5 HPLC column, 3 µm particle size, 10 cm x 2.1 mm | with conical 0.1 mL glass inserts, screw caps and septa |
HPLC autosampler vials 1.5 mL | Sigma-Aldrich | Supelco 854165 | |
Mass spectrometer for LC-ESI-TOF-MS | Agilent | Agilent 6530 Accurate-Mass QTOF | |
Mass spectrometry data analysis software | Agilent | MassHunter Qualitative Analysis software v. B.06.00 | |
Benchtop centrifuge for 1.5 mL Eppendorf tubes | Eppendorf | 5427 R | |
Cooling centrifuge for 50 mL Falcon tubes | Eppendorf | 5810 R | |
Fast Protein Liquid Chromatography (FPLC) system | GE Healthcare | ÄKTA pure 25 L | |
Fluorescence spectrometer | Perkin Elmer | LS 55 | |
High pressure microfluidizer for bacterial cell disruption | Microfluidics | LM series with “Z” type chamber | |
Orbital shaker for bacterial cultivation | Infors HT | Minitron | |
Peristaltic pump for liquid chromatography (LC) | GE Healthcare | P-1 | |
Ultrasonic homogenizer for bacterial cell disruption | Omnilab | Bandelin SONOPULS HD 3200, 5650182 | with MS72 sonifier tip |
UV-Vis spectrophotometer | Biochrom | ULTROSPEC 2100 | |
UV-Vis/NIR spectrophotometer | Perkin Elmer | LAMBDA 950 UV/Vis/NIR |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon