Questo protocollo completo istruisce come generare genomi vicini di diversi batteri urinari e consente ai lettori senza esperienza di codifica di implementare con successo pipeline di assemblaggio e analisi del genoma basate su terminali. Assemblaggi completi del genoma consentono la scoperta di geni che contribuiscono alla colonizzazione e alla virulenza tra batteri commensali e uropatogeni. I genomi ravvicinati forniscono informazioni sull'architettura del genoma e sugli elementi genetici mobili.
Il metodo di assemblaggio del genoma ibrido può essere applicato a qualsiasi batterio coltivabile isolato da altri siti anatomici o nicchie ambientali per fornire informazioni simili sul contenuto e sull'architettura del genoma. Seguire il protocollo e la guida del produttore per preparare un pool di DNA a doppio filamento e procedere alla pulizia aggiungendo 2,5 volte il volume di perline paramagnetiche al pool di DNA, quindi facendo scorrere delicatamente il tubo per mescolare il contenuto. Ruotare brevemente il campione a 2.000 volte G e posizionare il campione su un rotatore per cinque minuti a temperatura ambiente, quindi pellettare le perline sul magnete.
Quindi, lavare il pellet due volte con 250 microlitri di etanolo al 70% appena preparato in acqua priva di nucleasi senza disturbare il pellet. Lasciare il tubo sul magnete durante i lavaggi. Aspirare l'etanolo dopo ogni lavaggio, quindi girare brevemente il campione a 2.000 volte G prima di restituirlo al magnete.
Pipettare l'etanolo residuo e lasciare asciugare il pellet per 30 secondi. Una volta essiccato, risospesciare il pellet in 60-70 microlitri di acqua priva di nucleasi e incubare il campione a temperatura ambiente per due minuti, quindi pellettare il campione sul magnete fino a quando l'elute è chiaro. Trasferire l'elute in un tubo microcentrifuga pulito da 1,5 millilitri.
Quantificare il pool di DNA concentrato a doppio filamento utilizzando un fluorometro, quindi preparare un'aliquota di 700 nanogrammi del campione in un volume finale di 65 microlitri per procedere alla fase di legatura dell'adattatore e mantenere il resto del pool a quattro gradi Celsius per una seconda corsa dopo che la prima corsa è terminata. Continuare con la legatura dell'adattatore secondo le istruzioni del produttore. Per procedere con il sequenziamento, mescolare i buffer di innesco e innescare la cella di flusso.
Preparare la soluzione della libreria DNA e caricare il campione a goccia sulla porta di caricamento. Avviare l'esecuzione della sequenziazione. Apri il software operativo per la sequenziazione e fai clic sul pulsante Start, quindi inserisci un nome per l'esperimento.
Vai a Continuare con la selezione del kit per selezionare il kit di preparazione della libreria appropriato e il pacchetto di espansione del codice a barre utilizzato, quindi fai clic su Continua per eseguire le opzioni. Se si prevede di preparare una libreria sufficiente per una seconda esecuzione, regolare la lunghezza di esecuzione da 72 ore predefinite a 48 ore e premere continua a basecalling. Seleziona l'opzione basecalling in config fast basecalling.
Impostare il codice a barre su abilitato in modo che l'output FASTQ venga tagliato dalle sequenze di codici a barre e de-multiplexato in directory separate in base al codice a barre. Fare clic su Continua per l'output. Quindi, scegli dove salvare i dati di sequenziamento dell'output.
Aspettatevi circa 30-50 gigabyte di dati se si salva solo l'output FASTQ e più di 500 gigabyte di dati se si salva l'output FAST5. Se si prevede di procedere con il filtraggio manuale dopo la sequenziazione, deselezionare l'opzione di filtro Qscore seven in lunghezza di lettura non filtrata. In caso contrario, lasciare selezionata l'opzione.
Vai a continuare a eseguire la scheda di installazione per rivedere tutte le impostazioni. Se le impostazioni sono corrette, fare clic sul pulsante Start. Altrimenti, fai clic su Indietro per apportare le modifiche necessarie.
Nella directory di letture lunghe, creare nuove directory per ogni codice a barre utilizzato nell'esecuzione. Copiare tutti i file fastq che corrispondono a ciascun codice a barre nella cartella appropriata. Combina tutti i file fastq per ogni codice a barre di ogni esecuzione.
Una volta combinati i file, aprire il terminale e passare alle directory dei codici a barre all'interno della directory di letture lunghe utilizzando il comando cd. Per concatenare tutti i file fastq per codice a barre in un unico file fastq, eseguire il comando e ripetere la procedura per ciascun codice a barre. Utilizzare NanoStat per valutare la qualità di lettura del campione eseguendo il comando e quindi registrare i risultati copiando l'output in un file di testo o Word per riferimento futuro.
Dopo aver salvato i risultati, utilizzare NanoFilt per filtrare le letture MinION, scartando le letture con Q inferiore a sette e lunghezza inferiore a 200 eseguendo il comando. Nel file tagliato generato, eseguire NanoStat con il comando. Registrare i risultati copiando l'output in un file di testo o Word e confrontarli con i risultati precedenti per assicurarsi che il filtro abbia avuto esito positivo.
Ripetere i passaggi per ogni codice a barre utilizzato nell'esecuzione della sequenziazione. Per generare l'assemblaggio del genoma ibrido, organizzare i file di lettura breve e i file di lettura lunga in un'unica directory denominata trimmed_reads. Quindi la directory contiene un fastq generato in precedenza.
gz per letture lunghe tagliate e due fastq. gz come R1 e R2 per brevi letture tagliate. Passare alla directory trimmed_reads che memorizza i file letti utilizzando il comando cd nel terminale.
Una volta nella directory corretta, comprimi i due brevi file di lettura da memorizzare nel fastq. gz eseguendo il comando. Ripetere il passaggio sia per R1 che per R2. Assicurarsi che tutti i file letti siano nel fastq.
gz e verificare che tutti i file corrispondano allo stesso isolato. Iniziate l'assembly ibrido utilizzando Unicycler eseguendo il comando. Al termine dell'esecuzione, esaminare il monociclo.
per garantire l'assenza di errori. Registrare il numero, le dimensioni e lo stato completo o incompleto del contesto generato. Se nel registro monociclo vengono identificati contesti incompleti, eseguire nuovamente Unicycler in grassetto aggiungendo il flag al comando.
Apri Bandage e fai clic su file, quindi scegli Carica grafico e seleziona l'assieme. gfa che è stato precedentemente salvato nel unicycler_output_directory generato da Unicycler. Una volta caricato il file, fare clic sul pulsante disegna grafico sulla barra degli strumenti a sinistra e valutare se l'assemblaggio è completo esaminando come i contigs sono collegati e organizzati.
Navigare all'interno del terminale fino alla cartella che memorizza l'output del monociclo utilizzando il comando cd. Quindi eseguire il protocollo quast eseguendo il comando. Esaminare i report generati da quast nella directory di output quast_output_directory.
Naviga all'interno del terminale fino alla cartella che memorizza l'output del Monociclo usando il comando cd, quindi esegui prokka eseguendo il comando. Rivedere le annotazioni aprendo la tabella tsv e caricando il file gff generato nel software di analisi della sequenza. Visualizza e analizza le annotazioni nel software.
Nelle immagini rappresentative del gel, vengono rappresentati i risultati dell'estrazione genomica del DNA o del gDNA. Si può osservare un'estrazione e una separazione di gDNA intatte. Sono rappresentate anche l'estrazione non riuscita che mostra una contaminazione frammentata di gDNA e RNA.
I grafici di assemblaggio del genoma dei batteri sono stati generati dall'assemblaggio ibrido de novo di Unicycler e visualizzati da Bandage. Il genoma completo di Klebsiella oxytoca KoPF10 ha dimostrato un singolo cromosoma chiuso e il genoma completo di Klebsiella pneumoniae KpPF25 consisteva in un cromosoma chiuso e cinque plasmidi chiusi. Il cromosoma incompleto di Klebsiella pneumoniae KpPF46 consisteva in due contig interconnessi.
Le mappe di assemblaggio generate da Geneious Prime per il genoma completo di Klebsiella oxytoca KoPF10 e Klebsiella pneumoniae KpPF25 mostrano geni annotati denotati da frecce colorate lungo le dorsali plasmidiche. Per garantire che il caricamento delle celle di flusso abbia esito positivo, filtrare le letture lunghe utilizzando le impostazioni consigliate e assicurarsi che tutti i file siano nel fastq. formato gz.
Eseguire il comando Unicycler corretto utilizzando file appartenenti allo stesso esempio.