Bu analitik protokol, büyük ölçekli patojenik bakteri popülasyonlarının incelenmesine izin verir. Bu çok önemlidir çünkü ekolojik ve epidemiyolojik araştırmaların nasıl yapılabileceğini geliştirir. Ancak bunun gerçekleşmesi için ihtiyacımız olan şey, otomatik ve ölçeklenebilir bir araç veya binlerce genom dizisinin aynı anda analiz edilmesine izin veren hesaplamalı bir platformdur.
ProkEvo bu nişe uyar ve ekolojik ve epidemiyolojik araştırmalar için genotipleri ve bu genotiplerle ilgili benzersiz özellikleri gözden geçiren pan-genomik içeriği haritalandırırken, pratik bakteri popülasyonu analizinin ölçekli olarak yapılmasına izin verir. Bu protokolün temel avantajı, bakteri popülasyonlarındaki hiyerarşik genotiplerin sezgisel madenciliğini yapmak için ProkEvo gibi güçlü, otomatik ve ölçeklenebilir hesaplama platformlarının kullanılmasıdır. Bugün burada sunulan analitik protokolün birkaç pratik etkisi vardır.
Bunlardan biri, bakteriyel genotiplerin gerçek zamanlı olarak, ölçeklenebilir bir şekilde haritalandırılmasına ve izlenmesine izin verecek anlamda tanılamayı kolaylaştırmaktır; bu, patojenlerin patojenik soylarının ayırt edilmesine ve tanımlanmasına izin verir. Diğer bir uygulama, patojenlerin farklı ticari ortamlarda izlenmesini kolaylaştırmak için yapılan halk sağlığı laboratuvarlarının ve düzenleyici kurumların rutin gözetimini arttırmaktır. Burada sunulan protokol, mikrobiyologlar, ekolojistler, epidemiyologlar ve bakteriyel popülasyon genomiği ile ilgilenen herkes için pratik rehberlik sağlar.
ProkEvo açık kaynaklı ve genel kullanıma açık bir platformdur ve GitHub sayfası ayrıntılı kullanım talimatları sağlar. Burada açıklanan protokol GitHub'da da bulunabilir. Verilen talimatlarla, ProkEvo'yu ve bu protokolü acemi ve ileri düzey araştırmacılar tarafından kullanımı ve kullanımını kolaylaştırmak istiyoruz.
Genotipik bilgilerle birlikte filogenetik bir ağacı çizmek için Gigi ağacını kullanarak analizleri yapmaya başlayın. Bunu yapmak için, x-lim ve G ısı haritası içindeki sayısal değerleri değiştirerek halkaların çapı ve genişliği de dahil olmak üzere Gigi ağacı figür boyutunu optimize edin. Filogenetik ağaçla birden fazla veri katmanı çizerken, renklendirme paneli seçimini kolaylaştırmak için tüm meta verileri mümkün olan en düşük sayıda kategoride toplayın.
İlgi alanı ve alan bilgisi sorusuna dayalı veri toplamayı gerçekleştirin. İşiniz bittiğinde, dizi türü veya ST soyları için veri toplayarak göreceli frekansları değerlendirmek için bir çubuk grafik ve görselleştirmeleri kolaylaştırmak için çekirdek genom çok lokuslu dizi tiplemesi veya cgMLST varyantları kullanın. Veri toplama için kullanılan ampirik veya istatistiksel bir eşik seçin.
Örnek kod, ST soylarının frekans dağılımını incelemek ve kesmeyi belirlemek için kullanılabilir. Örnek kod, küçük veya düşük frekanslı ST'lerin nasıl toplandığını gösterir. Numaralandırılmayan ST'ler diğer ST'ler olarak gruplandırılabilir.
cgMLST varyantları için benzer bir kod kullanın. Aynı BAPS1 alt grubuna ait ST'leri tanımlamak üzere her BAPS1 alt grubundaki her ST soyunun oranını hesaplamak için iç içe geçmiş yaklaşımı kullanın. Kod, ST tabanlı oranın BAPS1 alt grupları arasında nasıl hesaplanabileceğini örneklemektedir.
Antimikrobiyal direncin veya AMR lokuslarının ST soyları arasındaki dağılımını çizmek için, görselleştirmeleri kolaylaştırmak üzere en önemli AMR lokuslarını filtrelemek için ampirik veya istatistiksel bir eşik kullanın. Ham bir ürün sağlayın. Tüm ST soylarındaki tüm AMR lokuslarının hesaplanan oranlarını içeren csv dosyası.
Ardından, kodu kullanarak her ST için AMR oranını hesaplayın. Tüm ST'ler için hesaplamalar yapıldıktan sonra, kodu kullanarak veri kümelerini tek bir veri çerçevesi olarak birleştirin ve hesaplanan oranları içeren csv dosyasını kodla dışa aktarın. ST soyları arasında AMR tabanlı dağılımı çizmeden önce, görselleştirmeleri kolaylaştırmak için verileri bir eşiğe göre filtreleyin.
Daha sonra, çekirdek genom filogenisini, AMR verilerindeki hiyerarşik genotipik sınıflandırmalarla birlikte Gigi ağacını kullanarak tek bir grafikte çizin. Ardından, daha önce belirtilen parametreleri kullanarak Gigi ağacının içindeki şekil boyutunu optimize edin. Değişkenleri toplayarak veya gen varlığı ya da yokluğu gibi ikili sınıflandırmayı kullanarak görselleştirmeleri optimize edin.
Salmonella enterica soyunun hiyerarşik popülasyon yapısı çekirdek genom filogenisi bağlamında incelenmiştir. Tüm hiyerarşik genotiplerin göreceli frekansları daha sonra genel dağılımı ve en sık gözlenen sınıflandırmaları değerlendirmek için kullanıldı. Daha az sıklıkta ST soyları, veri görselleştirmeyi kolaylaştırmak için diğer ST'ler gibi toplanmıştır.
Benzer şekilde, daha az sıklıkta cgMLST varyantları diğer cgMLST'ler olarak toplanmıştır. ST'ler arasındaki atasal ilişkiler, BAPS1 alt grupları veya haplotipleri tarafından ST soylarının göreceli sıklığı değerlendirilerek iç içe geçmiş bir yaklaşım kullanılarak incelenmiştir. AMR lokuslarını farklılaştıran ST soyunun göreceli sıklığı, serovar Newport popülasyon yapısına bağlı benzersiz aksesuar genomik imzaları tanımlamak için değerlendirildi.
Sonuçlarda, MDFA ve AAC6IAA lokuslarının serovar Newport popülasyonu tarafından atasal olarak edinildiği görülürken, ST45'in çoklu ilaca dirençli olduğu tahmin edilmektedir. ST45 ile karşılaştırıldığında, ST5 ve ST118 gibi diğer büyük ST soylarının çoklu ilaca duyarlı olma olasılığı daha yüksektir. Ek olarak, hiyerarşik popülasyon yapısı verilerini sistematik olarak entegre etmek için filogeni bağlantılı bir görselleştirme kullanılmıştır.
Bu analitik protokol, bakteri popülasyonlarının ölçekli veri madenciliği için bir temel sunmaktadır. İzin verdiği şey, genotiplerin ProkEvo kullanılarak ölçekte haritalanması ve izlenmesidir, ancak genotipik bilgilerle ilişkili metabolik yolların ve virülans faktörlerinin dağılımını keşfetmek gibi diğer soruları cevaplamak için de genişletilebilir. Yani, ilgilenilen belirli genotiplerle ilişkili fenotipleri tahmin edebiliriz.
Burada açıklanan protokol, araştırmacıların popülasyon genomiği alanındaki yeni soruları keşfetmelerinin ve patojenik ve patojenik olmayan bakteri türleri için evrimsel ve ekolojik kalıplar çıkarmalarının yolunu açmaktadır.