DiCoExpress fornisce un'analisi aoristica completa dal controllo qualità alla co-espressione. Esegue analisi differenziali basate sui contrasti all'interno del modello lineare generalizzato. Inoltre, può anche eseguire un'analisi di arricchimento sulla lista dei geni differenzialmente espressi e dei cluster di geni co-espressi.
Il vantaggio principale di DiCoExpress è che può essere utilizzato da persone come me, senza particolari conoscenze in statistica o programmazione aerea. Aiuta veramente un utente non specialista a scrivere il contrasto necessario per l'analisi dell'espressione genica differenziale. Fornisce inoltre output grafici che illustrano i risultati pronti per la pubblicazione.
DiCoExpress non è uno strumento dedicato al piano. Può essere utilizzato per qualsiasi organismo purché il disegno sperimentale sia completo di un massimo di due fattori biologici. Inoltre, è anche possibile il design di una membrana con un numero disuguale di repliche tra le condizioni.
Un principiante dovrebbe avere conoscenze preliminari in R.Dovresti sapere come usare una funzione e identificare gli argomenti richiesti e facoltativi. Quindi il passaggio critico è quello di fornire correttamente i file contenenti il e il disegno sperimentale. Per iniziare, apri la sessione R studio.
Impostare la directory su script modello e aprire il tutorial DiCoExpress dot R script. Caricare le funzioni DiCoExpress nella sessione R. Quindi caricare i file di dati nella sessione R e dividere i file di dati oggetto in diversi oggetti per manipolare facilmente i file.
Quindi, selezionare una strategia tra condizioni NB o repliche NB e una soglia per filtrare i geni a bassa espressione. Specificare i colori del gruppo e selezionare un metodo di normalizzazione. Quindi eseguire il controllo di qualità.
Se i dati sono accoppiati in base al fattore di replica, lo stato viene replicato come true, altrimenti lo stato come false. Assegnare l'interazione come vera per considerare un'interazione tra i due fattori biologici. In caso contrario, assegnare false, quindi specificare il modello statistico e definire la soglia del tasso di false discovery.
Eseguire l'analisi differenziale seguita dalla fissazione di una soglia per l'analisi di arricchimento e dall'esecuzione dell'analisi di arricchimento di liste geniche differenzialmente espresse. Selezionare gli elenchi DEG da confrontare. Fornire un nome per il confronto dell'elenco e utilizzare lo stesso nome per la directory in cui verranno salvati i file di output.
Impostate l'operazione dei parametri su unione o intersezione per specificare l'azione da eseguire sugli elenchi DEG e confrontate gli elenchi. Effettuare un'analisi di co-espressione seguita dall'analisi di arricchimento dei cluster di co-espressione. E infine, generare due file di registro contenenti tutte le informazioni necessarie per riprodurre l'analisi.
I conteggi totali normalizzati per campione dovrebbero essere simili quando si confrontano sia le condizioni intra che inter. I conteggi di espressione genica normalizzati hanno mostrato mediana e varianza simili, sia in condizioni intra che inter. Per identificare le potenziali strutture dati sottostanti, sono stati generati grafici PCA.
È stata osservata una chiara distinzione tra i trattamenti e il clustering era assente, indicando un set di dati di buona qualità. Gli istogrammi a valore grezzo sono stati tracciati per valutare la qualità della modellazione. La distribuzione dei valori grezzi era uniforme, con un picco all'estremità sinistra della distribuzione, come previsto.
L'assenza di un picco all'estremità destra indica che la modellazione statistica sembra corretta. È stato tracciato il profilo di espressione del gene CIG62301.1, in ogni genotipo e condizione. Oltre al numero di geni espressi in modo differenziale, sono stati tracciati anche per ogni contrasto testato.
L'analisi di co-espressione è stata eseguita sull'unione di cinque liste DEG. Identificato al contrario, alla ricerca di variazioni della risposta al trattamento tra genotipo uno o due rispetto ad altri. I geni co-espressi per ogni cluster identificato sono stati stampati in singoli file di testo ed è stato tracciato il profilo di espressione dei geni.
Con DiCoExpress i biologi otterranno analisi di espressione genica statisticamente valide. Il prossimo passo è dare un senso biologico, a partire da questi risultati.