Questo protocollo colma un divario significativo tra l'evoluzione naturale dei virus e il loro uso come vettori ricombinanti per la terapia genica umana, consentendo la loro ingegnerizzazione, diversificazione e stratificazione. Questa tecnica consente lo screening parallelo ad alto rendimento per virus adeno-associati nuovi, isolati o ingegnerizzati, in breve varianti AAV, risparmiando così sul numero di animali, sul lavoro, sui costi e sul tempo. Le varianti di capside AVV identificate possono aumentare l'efficacia e la specificità della somministrazione basata su AAV di transgeni terapeutici, riducendo così la dose virale richiesta.
Ciò potrebbe migliorare la sicurezza e l'applicabilità della terapia genica. Lo stesso approccio potrebbe essere utilizzato anche per l'ingegneria del capside o del promotore di altri veicoli di consegna genica che migliora la nostra comprensione della loro biologia e del loro uso nella terapia genica. Ad aiutare a dimostrare la procedura saranno gli studenti di dottorato Jonas Becker e Jixin Liu, il post-doc Joanna Szumska e Margarita Zayas, così come gli assistenti di ricerca Emma Gerstmann ed Ellen Widtke del mio laboratorio.
Inizia analizzando i dati di sequenziamento NGS con Python 3 e Biopython. L'analisi NGS è composta da due fasi. Per il primo passaggio, cercare nei file di sequenza le sequenze che soddisfano criteri specifici quali sequenze laterali, lunghezza e posizione utilizzando lo script uno e un file di configurazione che fornisce le informazioni necessarie.
Per la seconda fase, tradurre le sequenze estratte a partire dalla sequenza AGWGGC utilizzando lo script numero due e la configurazione e zuordnung. txt che fornisce le informazioni necessarie. Preparare due cartelle:script e dati.
Copiare i file compressi Gzip risultanti dalla sequenza nella cartella dati. Quindi copiare Python e i file di configurazione nella cartella dello script come descritto nel manoscritto di testo. Prima di eseguire gli script, aprire la zuordnung.
txt e aggiungere due colonne separate da tabulazioni. Immettere i nomi dei file Gzip nella prima colonna e il nome finale desiderato nella seconda colonna. Modificare le variabili nel file di configurazione come descritto nel testo manuscritto.
Utilizzando il comando specifico, avviare il rilevamento e l'estrazione della sequenza di varianti. L'output saranno file TXT con le sequenze di DNA estratte e il loro numero di letture. L'intestazione di questo file contiene dati statistici e questi dati verranno trasferiti ai seguenti file.
Questi dati TXT saranno il file di input per lo script numero due in cui le sequenze di DNA vengono tradotte, classificate e analizzate. Utilizzando il comando specifico, avviare la traduzione PV e l'analisi dei file di output del testo dello script uno come descritto nel manoscritto di testo. I file di output dello script numero due verranno denominati utilizzando la seconda colonna della tabella di ricerca in zuordnung.
txt con estensioni in base al tipo di analisi. Assicurarsi che i tre file di output contengano dati statistici nelle prime righe e una prima colonna con l'indice di ciascuna sequenza di DNA dai file di testo di input. Le colonne rimanenti dovrebbero essere costituite dalla sequenza del DNA, dal numero di letture, dalla lettura diretta o inversa e dalla sequenza peptidica tradotta.
Le sequenze non valide devono avere NA e non sono valide nelle ultime due colonne. Visualizza i file di output utilizzando il software disponibile in base alle esigenze dell'utente. Per eseguire l'analisi dei dati di sequenziamento NGS utilizzando codice personalizzato in Python 3, il flusso di lavoro comprende il rilevamento di sequenze di codici a barre guidate da sequenze di fiancheggiamento, la loro lunghezza e posizione, nonché l'analisi dell'arricchimento e della distribuzione del codice a barre sul set di tessuti.
Preparare due cartelle:script e dati. Copiare i file compressi Gzip risultanti dalla sequenza nella cartella dati. Quindi copiare python e i file di configurazione nella cartella dello script come descritto nel manoscritto di testo.
Prima di eseguire lo script, creare due file di testo delimitati da tabulazioni:la variazione capsid. txt con le sequenze di codici a barre assegnate ai nomi delle varianti del capside AAV e la contaminazione. TXT con sequenze di codici a barre che provengono da possibili contaminazioni.
Infine, modificare il file di configurazione per includere le informazioni del percorso della cartella con i dati di sequenziamento, la sequenza delle regioni laterali dei codici a barre, la loro posizione e le dimensioni della finestra per il rilevamento dei codici a barre. Eseguire lo script di rilevamento dei codici a barre con i percorsi e i file di configurazione forniti utilizzando il rispettivo comando. L'output dell'esecuzione di questo comando sarà costituito da file TXT con riconteggi per variante di capside e il numero totale di letture recuperate dai dati grezzi.
Valutare la distribuzione del capside AAV con codice a barre tra tessuti o organi, nella zuordnung. txt, assegna il nome di ciascun file di testo ottenuto dall'esecuzione di rilevamento del codice a barre al nome di un tessuto o di un organo. Aggiungi i nomi dei file di testo nella prima colonna e i nomi dei tessuti o degli organi corrispondenti nell'assegnazione delimitata da tabulazioni.
Creare un organo. txt con l'elenco dei nomi per gli organi on e off-target, che corrispondono ai nomi indicati nell'assegnazione Zuordnung. Txt.
Quindi creare normalization_organ. txt e normalization_variant. File di testo delimitati da tabulazioni TXT con valori normalizzati per tutte le varianti di capside e tutti gli organi e tessuti.
Nella prima colonna con il normalization_organ. txt, scrivere i nomi dati per ciascun organo e la seconda colonna con i valori di normalizzazione per il tessuto corrispondente. Riempire la prima colonna del normalization_variant.
TXT con l'elenco dei nomi delle capside e la seconda colonna con i valori normalizzati dei conteggi di lettura per ogni capside nella libreria in pool. Modificare il file di configurazione specificando i percorsi completi di tutti i file aggiuntivi ed eseguire lo script di analisi del codice a barre utilizzando questo comando specifico. Lo script di analisi dei codici a barre produce diversi file come i file di testo con valori di concentrazione relativa o RC della distribuzione del capside all'interno di diversi tessuti in base a più passaggi di normalizzazione descritti in precedenza e il file di foglio di calcolo che combina i dati del file di testo in dati di matrice uniti.
Visualizzare i dati ed eseguire l'analisi cluster dei dati della matrice come descritto nel manoscritto di testo. Lo script inserirà la concentrazione relativa. XLS e generare due grafici di mappa di calore cluster gerarchica e analisi dei componenti principali.
Per modificare i grafici o i parametri PNG, aprite lo script R e seguite le istruzioni nella sezione commenti. Le regioni quantificate del gene AAV2 rep hanno mostrato che il 99,2% era positivo per ITR, suggerendo che i capsidi AAV contenevano l'intero genoma virale. In tutti e tre i set, le letture estratte basate su sequenze di firma specifiche per la libreria rappresentavano circa il 94% delle letture totali, indicando una buona qualità.
Di questi, oltre il 99% erano letture PV valide e oltre il 99% delle letture PV valide erano uniche, suggerendo che la libreria era bilanciata con un'elevata diversità interna. I due rami principali della gerarchia delle mappe di calore riflettevano la differenza nell'efficienza di trasduzione delle varianti del capside. Il ramo sinistro con la maggior parte delle varianti del capside includeva tutti i capsidi che mostravano un alto valore di concentrazione relativa nella maggior parte dei tessuti.
Oltre alla specificità epatica sorprendentemente elevata, altri tre capsidi hanno mostrato specificità nel diaframma, nel muscolo scheletrico, nel bicipite e nel cervello. Il ramo destro del raggruppamento gerarchico comprendeva le varianti del capside con un'efficienza di trasduzione complessivamente inferiore più evidente nel duodeno e nel pancreas. L'analisi delle componenti principali per il sottogruppo originale forma il cluster di varianti del capside con elevata specificità epatica e delinea l'eccezionale trofismo muscolare del capside VAR60.
Quando si tenta questo protocollo, è necessario prestare attenzione agli errori di digitazione. Anche la sintassi è diversa se si utilizza il prompt dei comandi di Windows rispetto a Linux. A seguito dell'identificazione di nuove varianti di AAV, il potenziale terapeutico e traslazionale deve essere verificato in un modello animale deceduto o più grande.
Questa tecnica consente un confronto diretto fianco a fianco delle varianti di AAV in condizioni identiche ed è estremamente versatile, aprendo la strada alla sua traduzione in animali di grandi dimensioni o persino nell'uomo.