Araştırma odak noktamız, mikrobiyal proteinleri tespit etmek ve ölçmek ve klinik hastalıklardaki rollerini anlamak olmuştur. Bu araştırma alanına klinik metaproteomik denir. Bu çalışmada, araştırmacıların bakteri aktivitesinin hastalığın ilerlemesini nasıl etkileyebileceğini anlamalarını sağlayacak bir biyoinformatik iş akışı geliştirdik.
Klinik numunelerin metaproteomik analizi, sonuçların biyolojik olarak yorumlanmasını sağlamak için niceliksel peptitlerin ve proteinlerin taksonomik ve fonksiyonel açıklamalarının gerçekleştirilmesine ek olarak, hassas ve doğru mikrobiyal peptit ve kütle spektrometresi verilerinden protein tanımlaması için çok büyük protein dizisi veri tabanlarının işlenmesi de dahil olmak üzere çok sayıda zorluk sunar. İş akışı, veritabanı azaltma iş akışımızı kullanarak veri tabanı azaltma, birden fazla arama algoritması kullanarak mikrobiyal peptitleri arama yeteneği, kütle spektrometresi verilerinde tespit edilen mikrobiyal peptitleri doğrulama yeteneği, konakçı proteinlerle birlikte mikrobiyal proteinleri ölçme yeteneği ve istatistiksel ve görsel analiz kullanarak verilerin biyolojik olarak yorumlanması dahil olmak üzere birçok avantaj sunar. COVID-19 pandemik dalgaları sırasında ko-enfeksiyon durumunu incelemek için kistik fibroz hastalığı-progresyon çalışmaları için mikrobiyal peptit panelini tanımlamak için klinik metaproteomik iş akışını kullandık.
Bu çalışmalar hakemli akademik dergilerde yayınlanmıştır. Şu anda bu iş akışını, yumurtalık kanseri için öngörücü bir hedef peptit paneli geliştirmek için devam eden bir çalışma için kullanıyoruz. Galaxy P ekibi multiomik araştırmalarda yer alıyor ve proteogenomik ve metaproteomik analiz için birkaç gelişmiş iş akışı geliştiriyoruz.
Şu anda, araştırmacıların bağışıklık sistemine sunulan peptitleri, bazıları neoantijenler olarak adlandırılan kanserin ilerlemesi sırasında ve ayrıca bunların da mikrobiyal peptitler olabileceği diğer hastalıklarla tespit etmelerini ve karakterize etmelerini sağlayacak immünopropetitikler için iş akışları geliştirmek üzerinde çalışıyoruz. Başlamak için, hastalığa veya ilgilenilen duruma bağlı türlerin bir listesini edinin. Türler başlıklı tür listesi dosyasını kullanın.
tabular"UniProt için giriş olarak. Bir protein dizisi veritabanı oluşturmak için proteomu FASTA formatında indirin. İki ek protein dizisi veritabanı, yalnızca gözden geçirilmiş girişleri içeren bir insan Swiss-Prot veritabanı ve ortak bir maceracı protein deposu veya cRAP içeren bir kirletici protein veritabanı oluşturmak için protein veritabanı indiricisini çalıştırın.
FASTA birleştirme dosyaları için girdi olarak üç protein veritabanını kullanın ve kopyaları hariç tutmak için benzersiz dizileri filtreleyin. Oluşturulan büyük veri tabanını ve kütle spektrometresi veri kümesini girdi olarak kullanarak, azaltılmış bir protein dizisi veritabanı oluşturmak için MetaNovo'yu çalıştırın, ardından FASTA birleştirme dosyalarını çalıştırın ve peptit tespiti için mikrobiyal, insan ve kirletici protein dizileri içeren azaltılmış bir hedef veritabanı oluşturmak için MetaNovo tarafından oluşturulan veritabanı, insan Swiss-Prot ve cRAP veritabanlarında benzersiz dizileri filtreleyin. Peptit spektrum eşleşmeleri veya PSM'ler içeren bir arşiv dosyası oluşturmak için Arama GUI'sini Yürütün.
PSM, peptit ve protein raporlarını oluşturmak için Peptide-Shaker için giriş olarak Arama GUI "arşiv dosyasını" kullanın. Protein grupları ve peptit dosyaları üretmek için MaxQuant"ı çalıştırın. Metin işleme araçlarını kullanarak, Search GUI, Peptide-Shaker" ve MaxQuant'tan elde edilen çıktıları düzenleyin.
İki peptit listesini SGPS-MQ-Peptides.tabular etiketli tek bir veri kümesinde birleştirin. Yinelenen peptit dizilerini ortadan kaldırmak ve benzersiz mikrobiyal peptitlerin nihai listesini elde etmek için birleştirilmiş peptit listesini gruplandırın. PepQuery2 doğrulaması için, farklı mikrobiyal peptitlerin listesini, MS spektral veri kümelerini, izoformlu insan UniProt referans veritabanını ve kirletici protein dizisi veritabanını girin.
Peptit dizilerini ve ilişkili protein girişlerini çıkarmak için Search GUI, Peptide-Shaker" ve MaxQuant'tan gelen peptit raporlarında "Cut"ı çalıştırın. Yeni bir birleşik peptit protein veri seti oluşturmak için her iki programdan peptit dizilerini ve protein girişlerini birleştirin, ardından her doğrulanmış peptidi ilişkili protein girişine atamak için kombine peptit protein veri seti ve doğrulanmış peptitler üzerinde Sorgu Tablosunu "çalıştırın. Benzersiz doğrulanmış peptitleri ve bunlarla ilişkili UniProt ID'lerini korumak için gruplandırın.
Ardından, UniProt kimliklerini çıkarmak için Query Tabular'ı çalıştırın ve doğrulanmış Peptides.tabular'dan Uniprot-ID etiketli bir liste oluşturun. İlişkili protein dizilerini almak ve bunları yeni bir UniProt FASTA dosyası olarak kaydetmek için UniProt ID'lerini UniProt'a yükleyin. Peptit miktar tayini için doğrulanmış bir veritabanı oluşturmak için yeni oluşturulan UniProt FASTA, izoformlu insan UniProt veritabanı ve cRAP kirletici veritabanında FASTA birleştirme dosyalarını çalıştırın ve benzersiz dizileri filtreleyin.
MaxQuant için girdi olarak doğrulanmış protein dizisi veritabanını ve MS veri setini kullanın. MaxQuant "peptitler dosyasından, yalnızca mikrobiyal peptitleri seçin ve seçim dosyasından yalnızca mikrobiyal peptit dizilerini çıkarmak için Kes" komutunu çalıştırın. Niceliksel mikrobiyal peptitlerin bir listesini derlemek için Cut" dosyasını gruplandırın.
Unipept'in taksonomik ve işlevsel açıklamaları gerçekleştirmesi için girdi olarak niceliksel-mikrobiyal-peptitler listesini kullanın. Unipept çıktılarını, özellikle mikrobiyal taksonomi ağacını ve mikrobiyal enzim komisyonu proteinleri ağacını çıkarın. Mikrobiyal taksonomi ve EC protein ağaçlarını görüntülemek için veri setini seçin ve seçenekleri açın.
Görselleştir'e ve ardından Unipept Taxonomy Viewer'a tıklayın. Tablo biçimindeki taksonomik ve işlevsel ek açıklamalar için, Unipept_peptinfo adlı tablo veri kümesinin göz simgesini tıklayın. Her peptidi kendi satırında ve karşılık gelen bilgi sütunlarında gözden geçirmek için kaydırın.
MSstatsTMT ile istatistiksel analiz yapmadan önce, mikrobiyal ve insan proteinleri için ayrı veri setleri oluşturmak üzere MaxQuant" protein grupları dosyasında "Select" komutunu çalıştırın. Bu proteinler, kaynaklarını gösteren taksonomi etiketleri içerir. con_ etiketiyle etiketlenmiş tüm kirletici proteinleri hariç tutun.
Yalnızca _9laco" gibi etiketlere sahip mikrobiyal proteinleri ve "_human" etiketli insan proteinlerini sırasıyla Microbial_Proteins "tabular ve Human_Proteins" tabular içinde tutun. Son olarak, MSstatsTMT'yi kullanarak, MaxQuant" kanıt dosyası ve seçilen mikrobiyal veya insan proteinleri ile istatistiksel analiz yapın. Ortaya çıkan grafikleri görüntülemek için göz simgesine tıklayın.
Toplam 2.595.745 protein dizisi kapsamlı bir veri tabanında derlendi ve daha sonra etkili peptit tanımlaması için 21.289 protein dizisi içeren daha hedefli bir veri tabanına indirgendi. Search GUI, Peptide-Shaker ve MaxQuant kullanılarak 196 farklı mikrobiyal peptit tanımlandı. PepQuery2, 73 protein dizisine bağlı 134 mikrobiyal peptidi doğruladı ve miktar tayini için doğrulanmış bir veri tabanı oluşturdu.
MaxQuant "analizi, 155 niceliksel mikrobiyal peptit ile 3.203 peptit içeren bir peptit dosyası sağladı. Unipept analizi, 155 kantitatif mikrobiyal peptit arasında en bol bulunan cins olarak lactobacillus'u ve en yaygın enzim kategorisi olarak sınıf 2 transferazları ortaya çıkardı. MSstatsTMT'nin analizi, yumurtalık kanseri vakalarında iyi huylu vakalara kıyasla üç laktobasil proteininin aşağı regüle edildiğini gösteren, diferansiyel olarak ifade edilen proteinleri gösteren volkan ve karşılaştırma grafikleri üretti.