Bu içeriği görüntülemek için JoVE aboneliği gereklidir. Oturum açın veya ücretsiz deneme sürümünü başlatın.
Method Article
Bu analitik hesaplama platformu, bakteriyel popülasyon genomiği ile ilgilenen mikrobiyologlar, ekolojistler ve epidemiyologlar için pratik rehberlik sağlar. Özellikle, burada sunulan çalışma nasıl gerçekleştirileceğini göstermiştir: i) hiyerarşik genotiplerin filogeni rehberliğinde haritalanması; ii) genotiplerin frekansa dayalı analizi; iii) akrabalık ve klonalite analizleri; iv) Soy farklılaştırıcı aksesuar lokuslarının tanımlanması.
Bakteriyel tüm genom dizilemesinin (WGS) rutin ve sistematik kullanımı, Halk Sağlığı laboratuvarları ve düzenleyici kurumlar tarafından yürütülen epidemiyolojik araştırmaların doğruluğunu ve çözünürlüğünü arttırmaktadır. Halka açık WGS verilerinin büyük hacimleri, patojenik popülasyonları büyük ölçekte incelemek için kullanılabilir. Son zamanlarda, bakteriyel WGS verilerini kullanarak tekrarlanabilir, otomatik ve ölçeklenebilir hiyerarşik tabanlı popülasyon genomik analizlerini mümkün kılmak için ProkEvo adlı ücretsiz olarak kullanılabilen bir hesaplama platformu yayınlandı. ProkEvo'nun bu uygulaması, popülasyonların standart genotipik haritalamasını ekolojik çıkarım için aksesuar genomik içerik madenciliği ile birleştirmenin önemini göstermiştir. Özellikle, burada vurgulanan çalışma, R programlama dilini kullanarak popülasyon ölçekli hiyerarşik analizler için ProkEvo'dan türetilmiş çıktıları kullandı. Temel amaç, mikrobiyologlar, ekolojistler ve epidemiyologlar için nasıl yapılacağını göstererek pratik bir rehber sağlamaktı: i) hiyerarşik genotiplerin filogeni rehberliğinde bir haritasını kullanmak; ii) genotiplerin frekans dağılımlarını ekolojik uygunluk için bir vekil olarak değerlendirmek; iii) belirli genotipik sınıflandırmaları kullanarak akrabalık ilişkilerini ve genetik çeşitliliği belirlemek; ve iv) aksesuar lokuslarını farklılaştıran harita soyu. Tekrarlanabilirliği ve taşınabilirliği artırmak için, tüm analitik yaklaşımı göstermek için R markdown dosyaları kullanılmıştır. Örnek veri kümesi, zoonotik gıda kaynaklı patojen Salmonella Newport'un 2.365 izolatından genomik veriler içeriyordu. Hiyerarşik genotiplerin (Serovar -> BAPS1 -> ST -> cgMLST) filogeni bağlantılı haritalanması, genotipi farklılaştıran kilit taşı olarak dizi tiplerini (ST'ler) vurgulayarak popülasyon genetik yapısını ortaya koymuştur. En baskın üç soy boyunca, ST5 ve ST118, yüksek klonal ST45 filotipinden daha yakın zamanda ortak bir atayı paylaştı. ST bazlı farklılıklar, aksesuar antimikrobiyal direnç (AMR) lokuslarının dağılımı ile daha da vurgulanmıştır. Son olarak, akrabalık yapısını ve soya özgü genomik imzaları ortaya çıkarmak için hiyerarşik genotipleri ve AMR içeriğini birleştirmek için filogeni bağlantılı bir görselleştirme kullanıldı. Kombine olarak, bu analitik yaklaşım, pan-genomik bilgileri kullanarak sezgisel bakteri popülasyonu genomik analizleri yapmak için bazı kılavuzlar sağlar.
Halk Sağlığı laboratuvarları ve düzenleyici kurumlar tarafından rutin sürveyans ve epidemiyolojik araştırmalar için bir temel olarak bakteriyel tüm genom dizilemesinin (WGS) artan kullanımı, patojen salgın araştırmalarını önemli ölçüde artırmıştır 1,2,3,4. Sonuç olarak, büyük hacimli kimliksizleştirilmiş WGS verileri artık kamuya açıktır ve patojenik türlerin popülasyon biyolojisinin yönlerini benzeri görülmemiş bir ölçekte incelemek için kullanılabilir: popülasyon yapıları, genotip frekansları ve çoklu rezervuarlar, coğrafi bölgeler ve ortam türleri arasındaki gen / alel frekansları5 . En sık kullanılan WGS rehberliğindeki epidemiyolojik araştırmalar, yalnızca paylaşılan (korunmuş) içeriğin tek başına genotipik sınıflandırma (örneğin, varyant çağrısı) için kullanıldığı paylaşılan çekirdek-genomik içeriği kullanan analizlere dayanır ve bu varyantlar epidemiyolojik analiz ve izleme için temel oluşturur 1,2,6,7 . Tipik olarak, bakteriyel çekirdek-genom tabanlı genotipleme, yedi ila birkaç bin lokus 8,9,10 kullanılarak çok lokuslu dizi tipleme (MLST) yaklaşımlarıyla gerçekleştirilir. Bu MLST tabanlı stratejiler, önceden monte edilmiş veya bir araya getirilmiş genomik dizilerin yüksek küratörlü veritabanlarına haritalandırılmasını kapsar, böylece allelik bilgileri epidemiyolojik ve ekolojik analiz için tekrarlanabilir genotipik birimlerde birleştirir11,12. Örneğin, bu MLST tabanlı sınıflandırma iki çözünürlük düzeyinde genotipik bilgi üretebilir: düşük seviyeli dizi tipleri (ST'ler) veya ST soyları (7 lokus) ve daha üst düzey çekirdek-genom MLST (cgMLST) varyantları (~ 300-3.000 lokus)10.
MLST tabanlı genotipik sınıflandırma, hesaplamalı olarak taşınabilir ve laboratuvarlar arasında yüksek oranda tekrarlanabilir, bu da bakteri türü seviyesi 13,14'ün altında doğru bir alt tipleme yaklaşımı olarak yaygın olarak kabul edilmesini sağlar. Bununla birlikte, bakteri popülasyonları, türe özgü değişen klonalite dereceleri (yani, genotipik homojenlik), genotipler arasındaki hiyerarşik akrabalığın karmaşık kalıpları 15,16,17 ve aksesuar genomik içeriğinin dağılımındaki geniş bir varyasyon yelpazesi ile yapılandırılmıştır18,19 . Bu nedenle, daha bütünsel bir yaklaşım, MLST genotiplerine ayrık sınıflandırmaların ötesine geçer ve farklı çözünürlük ölçeklerinde genotiplerin hiyerarşik ilişkilerini, aksesuar genomik içeriğin genotipik sınıflandırmalara eşlenmesiyle birlikte dahil eder, bu da popülasyon tabanlı çıkarımı kolaylaştırır 18,20,21 . Dahası, analizler ayrıca uzaktan ilişkili genotipler21,22 arasında aksesuar genomik lokusların ortak kalıtım kalıplarına da odaklanabilir. Genel olarak, kombine yaklaşım, popülasyon yapısı arasındaki ilişkilerin agnostik sorgulanmasını ve belirli genomik bileşimlerin (örneğin, lokuslar) jeo-uzamsal veya çevresel gradyanlar arasında dağılımını sağlar. Böyle bir yaklaşım, belirli popülasyonların ekolojik özellikleri hakkında hem temel hem de pratik bilgiler verebilir ve bu da tropizmlerini ve gıda hayvanları veya insanlar gibi rezervuarlar arasındaki dağılım modellerini açıklayabilir.
Bu sistem tabanlı hiyerarşik popülasyon odaklı yaklaşım, ayırt edilebilir genomik imzaları tahmin etmek için yeterli istatistiksel güç için büyük miktarda WGS verisi gerektirir. Sonuç olarak, yaklaşım aynı anda binlerce bakteri genomunu işleyebilen bir hesaplama platformu gerektirir. Son zamanlarda, ProkEvo geliştirilmiştir ve pan-genomik haritalama20 dahil olmak üzere bütünleştirici hiyerarşik tabanlı bakteri popülasyonu analizlerine izin veren serbestçe kullanılabilir, otomatik, taşınabilir ve ölçeklenebilir bir biyoinformatik platformudur. ProkEvo, orta ila büyük ölçekli bakteri veri kümelerinin incelenmesine izin verirken, kullanıcı tarafından özelleştirilebilen test edilebilir ve çıkarılabilir epidemiyolojik ve ekolojik hipotezler ve fenotipik tahminler üretmek için bir çerçeve sağlar. Bu çalışma, ProkEvo'dan türetilmiş çıktı dosyalarının hiyerarşik popülasyon sınıflandırmalarının ve aksesuar genomik madenciliğinin analizi ve yorumlanması için girdi olarak nasıl kullanılacağına dair bir kılavuz sağlamada bu boru hattını tamamlamaktadır. Burada sunulan vaka çalışmasında Salmonella enterica soyu I zoonotik serovar S popülasyonu kullanılmıştır. Örnek olarak Newport ve özellikle mikrobiyologlar, ekolojistler ve epidemiyologlar için aşağıdaki konularda pratik kılavuzlar sağlamayı amaçlamıştır: i) hiyerarşik genotipleri haritalamak için otomatik filogeniye bağımlı bir yaklaşım kullanmak; ii) genotiplerin frekans dağılımını ekolojik uygunluğu değerlendirmek için bir vekil olarak değerlendirmek; iii) bağımsız istatistiksel yaklaşımlar kullanarak soya özgü klonalite derecelerini belirlemek; ve iv) popülasyon yapısı bağlamında aksesuar genomik içeriğinin nasıl çıkarılacağına dair bir örnek olarak soy farklılaştırıcı AMR lokuslarını haritalandırın. Daha geniş anlamda, bu analitik yaklaşım, hedeflenen türlerden bağımsız olarak evrimsel ve ekolojik kalıpları çıkarmak için kullanılabilecek bir ölçekte popülasyon tabanlı bir genomik analiz gerçekleştirmek için genelleştirilebilir bir çerçeve sağlar.
1. Giriş dosyalarını hazırlama
NOT: Protokol burada mevcuttur - https://github.com/jcgneto/jove_bacterial_population_genomics/tree/main/code. Protokol, araştırmacının bu Figshare deposunda gerekli çıktıları elde etmek için özellikle ProkEvo'yu (veya karşılaştırılabilir bir boru hattını) kullandığını varsayar (https://figshare.com/account/projects/116625/articles/15097503 - giriş kimlik bilgileri gereklidir - Kullanıcı dosya erişimine sahip olmak için ücretsiz bir hesap oluşturmalıdır!). Not olarak, ProkEvo genomik dizileri NCBI-SRA deposundan otomatik olarak indirir ve yalnızca giriş20 olarak genom tanımlamalarının bir listesini içeren bir .txt dosyası ve S üzerindeki bu çalışma için kullanılanı gerektirir. Newport USA izolatları burada verilmiştir (https://figshare.com/account/projects/116625/articles/15097503?file=29025729). Bu bakteri genomik platformunun nasıl kurulacağı ve kullanılacağı hakkında ayrıntılı bilgiye buradan ulaşabilirsiniz (https://github.com/npavlovikj/ProkEvo/wiki/2.-Quick-start)20
2. İstatistiksel yazılım ve entegre geliştirme ortamı (IDE) uygulamasını indirin ve yükleyin
3. Veri bilimi kitaplıklarını yükleme ve etkinleştirme
4. Veri girişi ve analizi
NOT: Bu çözümlemenin her adımıyla ilgili ayrıntılı bilgi mevcut komut dosyasında (https://github.com/jcgneto/jove_bacterial_population_genomics/blob/main/code/data_analysis_R_code.Rmd) bulunabilir. Ancak, dikkat edilmesi gereken bazı önemli noktalar şunlardır:
5. Analizler yapın ve görselleştirmeler oluşturun
NOT: Tüm analiz ve görselleştirmeleri üretmek için gereken her adımın ayrıntılı bir açıklaması bu makalenin markdown dosyasında bulunabilir (https://github.com/jcgneto/jove_bacterial_population_genomics/tree/main/code). Her şekil için kod parçalar halinde ayrılır ve tüm komut dosyası sırayla çalıştırılmalıdır. Ek olarak, her ana ve tamamlayıcı şekil için kod ayrı bir dosya olarak sağlanır (bkz. Ek Dosya 1 ve Ek Dosya 2). İşte her bir ana ve ek rakamı oluştururken göz önünde bulundurulması gereken bazı önemli noktalar (kod parçacıklarıyla).
Popülasyon genomik analizleri için hesaplama platformu ProkEvo'yu kullanarak, bakteriyel WGS veri madenciliğinde ilk adım, hiyerarşik popülasyon yapısını bir çekirdek-genom filogenisi bağlamında incelemekten ibarettir (Şekil 1). S. durumunda. enterica soyu I, S tarafından örneklendiği gibi . Newport veri kümesi, popülasyon hiyerarşik olarak aşağıdaki gibi yapılandırılmıştır: serovar (en düşük çözünürlük düzeyi), BAPS1 alt grupl...
Sistem tabanlı sezgisel ve hiyerarşik popülasyon yapısı analizinin kullanılması, benzersiz ekolojik ve epidemiyolojik kalıpları açıklama potansiyeline sahip bakteri veri kümelerindeki yeni genomik imzaları tanımlamak için bir çerçeve sağlar20. Ek olarak, aksesuar genom verilerinin popülasyon yapısına haritalanması, ST soylarının veya cgMLST varyantlarının rezervuarlar 6,20,21,45,46 arasında yayılmasını kolaylaştıran atalardan edinilmiş ve / veya yakın ...
Yazarlar, rakip çıkarların olmadığını ilan etmişlerdir.
Bu çalışma, UNL-IANR Tarımsal Araştırma Bölümü ve Ulusal Antimikrobiyal Direnç Araştırma ve Eğitim Enstitüsü ve Gıda Bilimi ve Teknolojisi Departmanı'ndaki (UNL) Nebraska Sağlık için Gıda Merkezi tarafından sağlanan fonlarla desteklenmiştir. Bu araştırma ancak Nebraska Araştırma Girişimi'nden destek alan UNL'deki Hollanda Bilgi İşlem Merkezi'ni (HCC) kullanarak tamamlanabildi. Ayrıca, HCC aracılığıyla, Ulusal Bilim Vakfı ve ABD Enerji Bakanlığı Bilim Ofisi tarafından desteklenen Açık Bilim Şebekesi (OSG) tarafından sağlanan kaynaklara erişebildiğimiz için minnettarız. Bu çalışmada Ulusal Bilim Vakfı tarafından finanse edilen Pegasus İş Akışı Yönetim Yazılımı kullanılmıştır (hibe #1664162).
Name | Company | Catalog Number | Comments |
amr_data_filtered | https://figshare.com/account/projects/116625/articles/14829225?file=28758762 | ||
amr_data_raw | https://figshare.com/account/projects/116625/articles/14829225?file=28547994 | ||
baps_output | https://figshare.com/account/projects/116625/articles/14829225?file=28548003 | ||
Core-genome phylogeny | https://figshare.com/account/projects/116625/articles/14829225?file=28548006 | ||
genome_sra | https://figshare.com/account/projects/116625/articles/14829225?file=28639209 | ||
Linux, Mac, or PC | any high-performance platform | ||
mlst_output | https://figshare.com/account/projects/116625/articles/14829225?file=28547997 | ||
sistr_output | https://figshare.com/account/projects/116625/articles/14829225?file=28548000 | ||
figshare credentials are required for login and have access to the files |
Bu JoVE makalesinin metnini veya resimlerini yeniden kullanma izni talebi
Izin talebiThis article has been published
Video Coming Soon
JoVE Hakkında
Telif Hakkı © 2020 MyJove Corporation. Tüm hakları saklıdır