Method Article
IR-TEx esplora i profili trascrizionali legati alla resistenza agli insetticidi nella specie Anopheles gambiae. Qui sono disponibili istruzioni complete per l'utilizzo dell'applicazione, modifiche per esplorare più set di dati trascrittomici e usare il framework per creare un database interattivo per raccolte di dati trascrittomici da qualsiasi organismo, generati in qualsiasi piattaforma.
IR-TEx è un'applicazione scritta in Shiny (un pacchetto R) che permette l'esplorazione dell'espressione di (oltre ad assegnare funzioni) trascrizioni la cui espressione è associata a fenotipi di resistenza agli insetticidi nelle zanzare gambiae di Anopheles. L'applicazione può essere utilizzata online o scaricata e utilizzata localmente da chiunque. L'applicazione locale può essere modificata per aggiungere nuovi set di dati di resistenza agli insetticidi generati da più piattaforme -omiche. In questa guida viene illustrato come aggiungere nuovi set di dati e gestire i dati mancanti. Inoltre, IR-TEx può essere ricodificato completamente e facilmente per utilizzare set di dati da qualsiasi dato sperimentale, rendendolo una risorsa preziosa per molti ricercatori. Il protocollo illustra l'utilità dell'IR-TEx nell'identificare nuovi candidati alla resistenza agli insetticidi utilizzando come esempio il transferte microsomico glutathione, GSTMS1. Questa trascrizione è regolata in più popolazioni resistenti ai piretroidi provenienti dalla Costa D'Avorio e dal Burkina Faso. L'identificazione delle trascrizioni co-correlate fornisce ulteriori informazioni sui ruoli putativi di questo gene.
La capacità di misurare l'espressione di un gran numero di trascrizioni simultaneamente attraverso piattaforme di microarray e tecnologia RNAseq ha portato alla generazione di vasti set di dati che associano l'espressione trascrizione a un particolare fenotipo sia negli organismi modello che in quelli non modello. Questi set di dati sono una risorsa estremamente ricca per i ricercatori, il cui potere può essere aumentato combinando set pertinenti in un approccio di integrazione dei Big Data. Tuttavia, questa metodologia è limitata a quelle con particolari competenze bioinformatiche. Descritto qui è un programma, IR-TEx (precedentemente pubblicato da Ingham et al.1) che è scritto in un pacchetto R chiamato Shiny2 e consente agli utenti con poca formazione bioinformatica di integrare e interrogare questi set di dati con relativa facilità.
IR-TEx, trovato a http://www.lstmed.ac.uk/projects/IR-TEx, è stato scritto per esplorare le trascrizioni associate alla resistenza agli insetticidi in Anopheles gambiae, il principale vettore di malaria africano1. La malaria è una malattia parassitaria causata dalle specie di Plasmodium, trasmessa tra gli esseri umani attraverso i morsi di zanzare femminili di Anopheles. Puntare sul vettore della zanzara con insetticidi si è dimostrato il mezzo più efficace per prevenire la morbilità e la mortalità correlate alla malaria in Africa. Anche l'aumento degli strumenti (cioè reti insetticide di lunga durata) è stato fondamentale nelle drastiche riduzioni dei casi di malaria dal 20003. Con un numero molto limitato di insetticidi disponibili, c'è una forte pressione evolutiva sulle zanzare, e la resistenza è ormai diffusa nei vettori della malaria africana4 .
Inoltre, le mutazioni del sito bersaglio5 e la clearance metabolica degli insetticidi6,7 rimangono i principali meccanismi studiati di resistenza, ma altri potenti meccanismi resistenti stanno emergendo1. Molti di questi nuovi meccanismi non sono stati precedentemente associati alla resistenza agli insetticidi, ma sono stati rilevati cercando modelli comuni di espressione genica in più popolazioni resistenti utilizzando l'app IR-TEx e successivamente convalidati funzionalmente dagli approcci genomici1.
Descritto di seguito è un approccio passo-passo all'utilizzo di IR-TEx, sia sul Web che quando installato localmente. Il protocollo descrive come i nuovi set di dati di resistenza agli insetticidi possono essere integrati nel pacchetto esistente e spiega come operare con i dati mancanti. Infine, descrive come utilizzare questo software con altri set di dati -omici che non sono correlati alla resistenza agli insetticidi, combinando così i dati provenienti da diversi approcci -omici mentre opera con valori mancanti e normalizzazione in modo che i dati siano comparabili.
1. Utilizzo dell'applicazione Web IR-TEx
2. Download e implementazione locale di IR-TEx
3. Modifica di IR-TEx per l'utilizzo con set di dati diversi
Utilizzando il file Fold_Changes.txt incluso in IR-TEx, abbiamo confrontato le trascrizioni che erano significativamente espresse in datadimi gambiai Anopheles coluzzii e Anopheles resistenti ai controlli suscettibili della Costa D'Avorio e del Burkina Faso. Ciò ha prodotto 18 trascrizioni di interesse (Tabella 1; questa ricerca può essere eseguita utilizzando Excel, R o altri programmi). Due di questi, un ATPase (AGAP006879) e la z-crystallin (AGAP007160), sono stati precedentemente segnalati, con il primo che ha un effetto significativo sulla resistenza ai piretroidi1. Oltre a queste due trascrizioni, erano presenti due trascrizioni di disintossicazione, GSTMS1 (FC- 1,95 e 1,85) e UGT306A2 (FC- 2,29 e 2,28).
La convalida qPCR di due di queste trascrizioni (GSTMS1, una trascrizione di disintossicazione; e AGAP009110-RA, una trascrizione sconosciuta, specifica per zanzara che contiene un dominio di legame di z-1,3-glucan) sono state eseguite come descritto in precedenza1. L'analisi è stata eseguita utilizzando i gruppi di primer descritti nel file aggiuntivo 3 e ha mostrato che queste trascrizioni sono state significativamente upregolate in una popolazione multiresistente proveniente dalla Costa d'Avorio (Tiassalé) e un'altra dal Burkina Faso (Banfora), rispetto al N'Gousso ( Figura4A)suscettibile al laboratorio .
Poiché entrambe le trascrizioni hanno mostrato una significativa upregulation in ciascuna delle popolazioni resistenti, è stato eseguito un knockdown indotto dall'RNAi sulle zanzare della colonia DistM Tiassalé. Questa colonia proviene dalla Costa D'Avorio ed è resistente a tutte le principali classi di insetticida utilizzate nella salute pubblica, come descritto in precedenza1,10. L'attenuazione dell'espressione di GSTMS1 ha provocato un aumento significativo (p - 0,021) della mortalità dopo l'esposizione alla deltametria rispetto ai controlli iniettati da GFP, dimostrando l'importanza di questa trascrizione nella resistenza ai piretroidi (Figura 4B). Al contrario, il knockdown di AGAP009110-RA non ha provocato variazioni significative (p - 0,082) nella mortalità dopo l'esposizione(Figura 4B).
GSTMS1 è un GST microsomico ed è uno dei tre trovati nelle zanzare A. gambiae 11. Anche se i membri delle classi epsilon e delta delle STO sono stati precedentemente implicati nella disintossicazione insetticida12,13,14, questa è la prima prova della nostra conoscenza per un ruolo di GST microsomici nella resistenza ai piretroidi15. Per esplorare la funzione putativa di questa trascrizione nelle zanzare sl gambiae di Anopheles, sono state identificate l'espressione e la correlazione in IR-TEx. GSTMS1 è stato significativamente sovraespresso in 20 dei 21 set di dati disponibili per queste specie, ad eccezione dell'isola di Bioko. In ogni posizione, la sovraespressione era inferiore a cinque volte rispetto alle popolazioni suscettibili (Figura 5).
Poiché i GG microsomici sono stati in gran parte ignorati come potenziali disintossicazioni insetticidi, si sa poco del loro ruolo nella resistenza agli insetticidi15. Esplorando la correlazione di altre trascrizioni, le funzioni putative possono essere chiarite attraverso l'assunzione di coregolamentazione o coinvolgimento negli stessi percorsi. Per massimizzare la potenza nella rete di correlazione, sono stati selezionati tutti i set di dati microarray presenti in IR-TEx, di >0.75 è stato selezionato. La tabella 2 mostra l'output di IR-TEx.
Queste trascrizioni sono arricchite nell'attività dell'osoreductae e nel metabolismo del glucosio/carboidrati nello strumento di annotazione funzionale di DAVID8. Sia la deidroasi glucosio-6-fosfato che la gamma-lyase di citathione mantengono il livello di glutathione nelle cellule dei mammiferi16,17 e quindi collegano direttamente con GSTMS1, un glutathione-S-transferase. La catalasi è un risponditore di stress ossidativo ad azione rapida che protegge le cellule dai danni reattivi delle specie di ossigeno, un sottoprodotto dell'esposizione ai piretroidi. L'idrolasi valaciclovir è un idrolasi che può svolgere un ruolo nella disintossicazione nelle cellule dei mammiferi18. CYP4H17 è presente anche nella rete di correlazione. I p450 citocromatici sono metabolizzanti diretti di insetticidi piretroidi, e questi prodotti di ripartizione possono essere ulteriormente metabolizzati dalle SGT. Infine, CYP4H17 è stato implicato nella resistenza ai piretroidi in A. funestus19. Nel loro insieme, questi dati sostengono fortemente un ruolo per GSTMS1 nella disintossicazione xenobiotica.
Figura 1: Modifica del registro2 di AGAP002865-RA in tutti i set di dati. L'asse x descrive in dettaglio i diversi set di dati, le cui informazioni sono disponibili nella Tabella supplementari 1 di una pubblicazione precedente1e l'asse y mostra la modifica di piegatura del log2 nella trascrizione degli interessi. Le linee tratteggiate grigio chiaro indicano soglie approssimative per significato, prese qui come un cambio di piegatura di <0.8 o un cambio di piegatura di >1.2. La linea nera tratteggiata indica un cambio di piegatura di 1 (cioè nessuna differenza di espressione tra le popolazioni resistenti e le popolazioni suscettibili). Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 2: Distribuzione di microarray che mostra una significativa espressione differenziale di AGAP002865-RA nelle popolazioni resistenti. Le modifiche di piegatura sono rappresentate in un sistema a semaforo: cambio piegatura verde di <1, cambio piega arancione di >1 e cambio piega rossa di >5. Vengono visualizzati solo i set di dati con un'espressione differenziale significativa (p - 0,05). Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 3: Reti di correlazione di AGAP001076-RA (CYP4G16). Le correlazioni pairwise vengono calcolate in tutte le trascrizioni nei 31 set di dati microarray, con un cut-off definito dall'utente applicato. Mostrato qui è (A) > 0,9 e (B) > 0,8. Tutte le trascrizioni visualizzate nel grafico soddisfano questo criterio e seguono le modifiche di espressione di AGAP001076-RA. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 4: espressione mRNA e fenotipo all'attenuazione di GSTMS1 e AGAP009110-RA. (A) espressione mRNA di GSTMS1 e AGAP009110-RA in due popolazioni multiresistenti An. coluzzii provenienti rispettivamente dalla Costa D'Avorio e dal Burkina Faso. I livelli sono stati confrontati con il laboratorio-suscettibile An. coluzzii N'Gousso. Livelli di significatività calcolati da ANOVA con un test post-hoc di Dunnett. (B) Attenuazione indotta dall'RNAi di entrambe le trascrizioni rispetto ai controlli iniettati dalla GFP. L'attenuazione del GSTMS1 mostra un aumento significativo della mortalità dopo l'esposizione alla deltametrina (calcolata da ANOVA con un test post-hoc per i tukey; Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 5: Espressione di GSTMS1 nelle popolazioni di Anopheles gambiae e Anopheles coluzzii. Mappa che mostra l'espressione significativamente differenziale di GSTMS1 nei set di dati di microarray disponibili. GSTMS1 è risultato essere significativamente differenziale in 20 dei 21 set di dati microarray. Fare clic qui per visualizzare una versione più grande di questa figura.
ID trascrizione | Descrizione | Burkina Faso | Costa d'Avorio |
AGAP006879-RA | Atpasi | 27.94 | 43.05 |
AGAP007160-RB | a-crystallin | 11.49 | 10.58 |
AGAP007160-RC | a-crystallin | 11.14 | 10.38 |
AGAP007160-RA | a-crystallin | 9.78 | 9.84 |
AGAP009110-RA | Sconosciuto | 9.26 | 5.96 |
AGAP007780-RA | Dihydrogenasi NADH | 10.49 | 3.77 |
AGAP006383-RA | oligosaccharyltransferasis complesso subunit beta | 3.69 | 5.57 |
AGAP007249-RB | Flightin | 4.61 | 3.86 |
AGAP003357-RA | Proteina 1-attivazione RAG1 | 4.31 | 4.05 |
AGAP007249-RA | Flightin | 4.48 | 3.46 |
AGAP001998-RA | mRpS10 (in quadra mRpS10) | 3.46 | 2.85 |
AGAP007589-RA | UGT306A2 | 2.29 | 2.28 |
AGAP000165-RA | GSTMS1 | 1.95 | 1.85 |
AGAP002101-RA | isoleucyl-tRNA sinotasi | 0.57 | 0.59 |
AGAP002969-RA | sintetasi asparaginyl-tRNA | 0.45 | 0.45 |
AGAP004199-RA | famiglia di vettori solute 5 (trasportatore monocarboxylato accoppiato al sodio), membro 8 | 0.35 | 0.48 |
AGAP004684-RA | proteina di elaborazione del rRNA CGR1 | 0.36 | 0.22 |
AGAP006414-RA | Cht8 | 0.024 | 0.36 |
Tabella 1: Trascrizioni significativamente differenziali nella stessa piega cambiano direzione attraverso le popolazioni del Burkina Faso e della Costa D'Avorio. ID trascrizione, descrizione del gene e modifica media della piega per ogni set di dati dei due paesi che rappresentano le popolazioni An. coluzzii e An. gambiae.
Correlazione | Nome sistematico | Tipo di trascrizione |
1 | AGAP000165-RA | GSTMS1 |
0.82 | AGAP004904-RA | Catalasi |
0.76 | AGAP007243-RA | 26S protease regolatoria sottounità 8 |
0.79 | AGAP008358-RA | CYP4H17 |
0.76 | AGAP009436-RA | Idrolasi Valacyclovir |
0.75 | AGAP010739-RA | Glucosio-6-fosfato 1-dehydrogenasi |
0.85 | AGAP011172-RA | cistathionine gamma-lyase |
0.76 | AGAP012678-RA | Glucosio-6-fosfato 1-dehydrogenasi |
Tabella 2: Trascrizioni co-correlate con GSTMS1. La tabella mostra l'output della rete di correlazione per GSTMS1 su IR-TEx con di >0.75. La tabella mostra la correlazione di Spearman, l'ID della trascrizione e la descrizione del gene per ogni trascrizione co-correlata.
File aggiuntivo 1: file di output dall'array A-MEXP-2196 analizzato su limma. Il file ha origine da un knockdown Met rispetto a una matrice di controlli GFP, descritta in modo più dettagliato in ArrayExpress (E-MTAB-4043) e da un'altra precedente pubblicazione1. Le colonne rappresentano l'identificatore AGAP (SystematicName), la modifica della piega del log (logFC), i valori dell'espressione del log (AveExpr), la statistica t (t), il valore p non corretto (P.Value), il valore p modificato (adj. statistica P.Val) e B (B)20. Ai fini di questo file, le zanzare sono Anopheles coluzzi della Costa D'Avorio e non sono esposte agli insetticidi, con una latitudine di raccolta e longitudine di -5.4 e 6.0, rispettivamente. Fare clic qui per visualizzare questo file (fare clic con il pulsante destro del mouse per scaricare).
File aggiuntivo 2: file di output dall'esperimento RNAseq. Analisi di RNAseq ricavata da Uyhelji et al.9 che descrive i cambiamenti nel trascrittoma delle zanzare Anopheles quando sono esposte al 50% di salinità. Questo file è adattato dalla tabella S2 della pubblicazione e include l'identificatore AGAP (SystematicID), la modifica della piega non elaborata (Fold_Change) e il valore p regolato (q_value). Fare clic qui per visualizzare questo file (fare clic con il pulsante destro del mouse per scaricare).
File aggiuntivo 3: elenco di primer per risultati rappresentativi. L'identificatore AGAP, il nome del gene, il dsRNA in avanti, l'inversione del dsRNA, il forward e il primer inverso qPCR vengono impostati per ogni trascrizione. Fare clic qui per visualizzare questo file (fare clic con il pulsante destro del mouse per scaricare).
File di codifica supplementare 1. Fare clic qui per visualizzare questo file (fare clic con il pulsante destro del mouse per scaricare).
File di codifica supplementare 2. Fare clic qui per visualizzare questo file (fare clic con il pulsante destro del mouse per scaricare).
File di codifica supplementare 3. Fare clic qui per visualizzare questo file (fare clic con il pulsante destro del mouse per scaricare).
La trascrittomica dei Big Data produce elenchi di migliaia di trascrizioni espresse in modo differenziale per ogni condizione sperimentale. Molti di questi esperimenti sono eseguiti su organismi e fenotipi correlati e sono quasi esclusivamente analizzati come esperimenti indipendenti. L'utilizzo di queste ricche fonti di dati esaminando i dati in modo olistico e senza ipotesi teoriche 1) porterà all'identificazione di nuove trascrizioni candidate e 2) impedire lo scarto di dati preziosi semplicemente perché ci sono troppe informazioni da convalidare in vivo1.
IR-TEx offre agli utenti uno sfondo di bioinformatica limitato con la possibilità di esaminare facilmente più set di dati, visualizzare le modifiche nei set di dati e scaricare le informazioni associate1. Sebbene IR-TEx non supporti la ricerca di più di una trascrizione in ogni ricerca, gli utenti possono esaminare i file Fold_Changes.txt associati semplicemente utilizzando Excel, R o altri programmi appropriati. Un'ulteriore utilità di IR-TEx deriva dall'uso di reti di correlazione per prevedere la funzione di trascrizione, l'input di ipotetiche proteine o trascrizioni con funzioni sconosciute e l'uso di software a valle per la ricerca di arricchimenti1.
Nell'esempio dimostrato in questo protocollo, IR-TEx viene utilizzato in base alla funzione originale. Qui, permette l'esplorazione delle trascrizioni associate alla resistenza agli insetticidi e alla visualizzazione della distribuzione di sovra e sottoespressione attraverso la mappatura grafica. Le trascrizioni di interesse sono convalidate in vivo per determinare se l'eccessiva o sottoespressione di determinate trascrizioni contribuisce a un fenotipo osservato1 (ad esempio, resistenza agli insetticidi). È stato dimostrato qui, come precedentemente riportato1, che un set di dati può essere utilizzato in un approccio basato su ipotesi per identificare le trascrizioni di interesse su base nazionale. IR-TEx può quindi essere utilizzato per esplorare l'espressione della trascrizione e 2) contestualizzare la funzione della trascrizione applicando una rete di correlazione a coppie tra tutte le trascrizioni contenute in ogni set di dati -omics. In questo caso, GSTMS1 ha dimostrato di essere co-correlato con una serie di altre trascrizioni implicate nella disintossicazione. Questi dati (insieme all'abbattimento della trascrizione che ha provocato un significativo aumento della mortalità dopo l'esposizione agli insetticidi) dimostrano l'importanza di questa trascrizione nella clearance xenbiotica.
IR-TEx rappresenta una risorsa preziosa per esplorare le trascrizioni relative alla resistenza agli insetticidi sul web o utilizzando applicazioni locali. Questo protocollo dimostra come modificare IR-TEx per diverse piattaforme -omics e dati completamente nuovi. La guida illustra come utilizzare IR-TEx per integrare dati da più piattaforme -omiche e set di dati con dati mancanti, nonché come ricodificare IR-TEx semplicemente in modo che sia utile per chiunque cerchi set di dati tracriomici.
Gli autori non hanno nulla da rivelare.
Questo lavoro è stato finanziato da una MRC Skills Development Fellowship a V.I. (MR/R024839/1) e dalla Royal Society Challenge Grant (CH160059) a H.R.
Name | Company | Catalog Number | Comments |
Laptop with browser | Any | - | - |
R Program | The R Project for Statistical Computing | - | https://www.r-project.org/ |
R Studio | R Studio | - | https://www.rstudio.com/ |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon