Il nostro protocollo è significativo perché può essere utilizzato per identificare sequenze genomiche che non possono essere isolate da sequenze co-purificanti, che a loro volta possono essere conosciute solo parzialmente. I principali vantaggi di questa tecnica è che è economica, utilizzando principalmente software gratuito che può essere scaricato e flessibile. Puoi applicarlo a molte domande biologiche.
Le potenziali applicazioni includono l'identificazione di bersagli di vaccini batterici e l'identificazione di virus le cui sequenze sono estremamente diverse dai microbi noti. Questo metodo può essere applicato a qualsiasi sistema in cui l'ignoto non può essere separato sperimentalmente, purché sia disponibile la sequenza di riferimento senza il bersaglio genomico. Questa tecnica richiede alcuni tentativi ed errori, quindi la pazienza è importante.
Potrebbe essere necessario creare problemi a riprendere i programmi. È possibile utilizzare programmi diversi da quelli che descriviamo qui. Utilizzare i manuali d'uso il più possibile.
La dimostrazione visiva di questo metodo è utile perché il lavoro computazionale dipende da una comprensione di base di come è strutturata la programmazione della riga di comando. Per iniziare, utilizzare Trimmomatic 0.32 per rimuovere adattatori illuminanti e basi di bassa qualità. Utilizzate Pear versione 0.9.11 per creare letture unite di alta qualità da letture accoppiate di output trimmomatico utilizzando parametri predefiniti.
Quindi utilizzare Reptile versione 1.1 per correggere le letture prodotte tramite Pear. Infine, utilizzate Trinity versione 2.4.0 in modalità predefinita per assemblare le sequenze corrette. Per le librerie specifiche del filamento, utilizzare il SS_lib_type di sezione.
L'output è un file FASTA che verrà inserito in una nuova directory denominata trinity_output. Creare un database BLAST della sequenza di riferimento nucleotide_reference. fasta alla riga di comando.
BLAST corrispondeva alla query assemblata al database di riferimento. Per ottenere un file di output, utilizzare BLAST_results. txt Per generare l'output tabulare necessario per le fasi di elaborazione della sottosequenza con script Python, utilizzare outfmt 6 Per aumentare il rigore, utilizzare sequenze proteiche dall'assembly come query BLAST con blast nucleotidico tradotto, che esegue la traduzione a sei del database nucleotidico.
Per ottenere sequenze proteiche per la query, eseguire transdecoder. Long0rfs per identificare i frame di lettura aperti più lunghi dalle sequenze di query assemblate. Ora esegui tblastn.
Se necessario, assicurarsi che il codice genetico corretto sia selezionato per l'organismo studiato utilizzando il db_gencode con un'opzione di codice appropriata. Se è disponibile un riferimento proteico di alta qualità, utilizzare l'abbinamento proteina-proteina con blastp piuttosto che tblastn Creare un database BLAST del riferimento proteico. Assicurati di salvare il risultato come file per l'elaborazione downstream e usa l'output tabulare per assicurarti che gli script Python possano analizzarli correttamente.
Ora, usa lo script Python sottrattivo per rimuovere eventuali sequenze corrispondenti. Per mappare le letture sull'assembly, utilizzare BWA-MEM versione 0.7.12 o bowtie 2 per mappare le letture non elaborati scaricate nell'assembly di query. In primo luogo, indicizzare l'assembly, quindi mappare le letture.
L'output sarà in formato SAM. Eseguire lo script Python removeUnmapped. py utilizzando il file SAM come input.
In questo modo vengono identificati i nomi delle sequenze di query senza alcuna lettura corrispondente e vengono salvate in un nuovo file di testo. L'output del passaggio precedente è un elenco di nomi di sequenze in un file txt. Estrarre un file FASTA con queste sequenze.
L'output sarà un file fasta. Utilizzare Genius per determinare manualmente le sequenze di primer ottimali. Evidenziare una sequenza candidata da 21 a 28 coppie di basi per il primer in avanti, evitando corse di quattro o più di qualsiasi base.
Prova a indirizzare una regione con una combinazione abbastanza uniforme di tutte le coppie di basi. Una singola G o C a tre Prime End è benefica, aiutando ad ancorare il primer. Fare clic sulla scheda Statistiche sul lato destro dello schermo per visualizzare la temperatura di fusione stimata di tale sequenza man mano che viene evidenziata l'area candidata.
Puntare a una temperatura di fusione compresa tra 55 e 60 gradi Celsius, evitando ripetizioni, e lunghe corse di G C.Scegliere un primer inverso nello stesso modo, situato da 150 a 250 coppie di basi tre prime del primer in avanti. Mentre le lunghezze del primer non devono corrispondere, la temperatura di fusione prevista dovrebbe essere il più vicina possibile a quella del primer in avanti. Assicurati di invertire la sequenza facendo clic con il pulsante destro del mouse su Genius mentre una sequenza è evidenziata in un'opzione di menu.
Un metodo alternativo è quello di utilizzare la funzione Primer Design, che si trova nella barra degli strumenti superiore nella finestra Sequenza. Inserire l'area da amplificare in Area di destinazione. Nella scheda caratteristiche inserire la dimensione desiderata, la temperatura di fusione e la percentuale G C, quindi fare clic su OK per generare primer.
Per eseguire la convalida quantitativa pcr della sequenza rimanente, preparare prima una miscela di reazione per ogni modello in triplice copia, con il nostro SYBR Green Master Mix, primer avanti e indietro e acqua, per un volume totale di 25 microlitri. Eseguire un programma qPCR informato dalla temperatura e dal tempo di estensione convalidati in precedenza. Le curve finali di denaturazione devono essere generate almeno la prima volta che i primer vengono impiegati in qPCR per convalidare l'amplificazione di un singolo prodotto del DNA.
Misurare i segnali qPCR SYBR Green relativi ad Actin da Ct Per tutti i casi, calcolare la media e la deviazione standard di due alla Ct rispetto ad Actin. Eseguire l'elettroforesi del gel endpoint, per confermare il corretto rilevamento delle dimensioni del prodotto da parte di qPCR. Qui, eseguire 25 microlitri del prodotto qPCR miscelati con cinque microlitri di colorante glitterolo 6X su un gel 2%TAE Agarose a 200 volt per 20 minuti.
Se qPCR mostra che non sono state identificate le sequenze di destinazione, ripetere l'intero ciclo con un nuovo riferimento, che può essere ottenuto da un database online. Il progetto sottrattivo in questo caso è iniziato con il sequenziamento dell'RNA dal tessuto rivestito di germi di fringuello zebra adulto maschio e femmina. Alla fine, sono stati identificati 935 geni somatici che non erano precedentemente inclusi nell'annotazione dell'intero genoma.
Dopo il filtraggio computazionale, la PCR quantitativa può produrre un risultato negativo in cui non vi è stata alcuna differenza nel rilevamento tra i tessuti degli uccelli. Al contrario, un risultato positivo che rappresenta l'identificazione di una vera sequenza bersaglio è confermato quando il DNA genomico qPCR mostra un rilevamento statisticamente maggiore nel tessuto di interesse, rispetto al riferimento. Qui, il gene dello snap alfa è stato convalidato per essere limitato alla linea germinale perché era impoverito nel tessuto somatico rispetto al DNA dei testee dove era presente che livelli equivalenti ad Actin.
È importante ricordare di utilizzare gli input corretti durante ciascuno dei passaggi computazionali. Potrebbe essere necessario passare attraverso la sottrazione del ciclo più volte per ottenere la sequenza o le sequenze di destinazione. Una varietà di analisi filogenetiche, strutturali e funzionali possono essere eseguite sui geni scoperti.
Questi metodi aggiuntivi forniscono informazioni sui ruoli evolutivi e funzionali dei geni. Abbiamo identificato il primo gene su un cromosoma songbird limitato dalla linea germinale, che ha ampliato l'interesse per questo sorprendente elemento genomico. Lavori successivi hanno mostrato cromosomi simili in molte specie di uccelli canori contenenti molti geni aggiuntivi.