Bu hesaplama protokolü önemlidir, çünkü biyomedikal yayınlarda bildirildiği gibi, hücresel bileşenler, örneğin mitokondri proteinleri ve bunların hastalıkla ilişkileri arasındaki ilişkileri araştırmak için bir çalışmaya izin verir. CaseOLAP LIFT, araştırmacılara biyomedikal raporlardan ve bilgi tabanlarından bilgi çıkarma ve entegre etme yetkisi verir. Bir bilgi grafiği olarak düzenlenen bu sonuçlar, yeni ilişkileri tahmin etmek için kullanılabilir.
Bu araştırma bulguları, hastalık patolojisi ve terapötik hakkında yeni anlayışlar ortaya çıkarmak için yararlı olan, tanımlanmış ve tahmin edilen protein hastalığı ilişkilerinin öncelikli bir listesini vurgulayarak hipotez oluşturmayı desteklemektedir. Bu son derece özelleştirilebilir iş akışı, herhangi bir yayın tarihi aralığında herhangi bir hastalık listesine GO terimi aracılığıyla herhangi bir hücresel bileşene, MeSH terimi aracılığıyla uygulanabilir. Bu kullanıcı dostu protokol, analiz için gereken hesaplama uzmanlığını en aza indirir.
Yazılım, yalnızca yeterli bilgi işlem depolama alanı ve yürütülmesi gereken kaynaklar gerektiren bir docker kapsayıcısı olarak piyasaya sürülür. Başlamak için, CaseOLAP LIFT docker kapsayıcısını indirmek için terminal penceresini açın ve docker pull CaseOLAP slash CaseOLAP_LIFT en son yazın. Tüm program verilerini ve çıktısını depolayacak bir dizin oluşturun.
Docker kapsayıcısını ekranda gösterilen komutla başlatın ve klasörün tam dosya yolu olarak PATH_TO_FOLDER değiştirin. Kapsayıcı içinde Elasticsearch'ü başlatmak için yeni bir terminal penceresi açın ve ekranda gösterilen komutu yazın. CaseOLAP_LIFT klasörüne gidin.
İndirme bağlantılarının ve yapılandırma eğik çizgisinin knowledge_base_links emin olun. JSON, her bilgi bankası kaynağının en son sürümü için güncel ve doğrudur. Gen ontolojisini veya GO terimini belirlemek için web sitesine gidin şecere.
org yazın ve tüm GO terimlerinin tanımlayıcılarını bulun. Benzer şekilde, ekranda gösterilen web sitesinden Tıbbi Konu Başlığı veya MeSH tanımlayıcıları aracılığıyla hastalık kategorilerini bulun. Ön işleme modülünü çalıştırmak için, kısa çizgi C bayrağını kullanarak kullanıcı tanımlı çalışılan GO terimlerini, çizgi D bayrağını kullanarak hastalık MeSH ağaç numaralarını belirtin ve kısaltmaları bir çizgi A bayrağıyla belirtin.
Metin madenciliği modülünü yürütmek için Python, space CaseOLAP_LIFT yazın. py, boşluk, text_mining ve kategorize edilmemiş belgelerin konularını belirtmek için tire L bayrağını ve hastalıkla ilgili belgelerin tam metnini indirmek için tire T bayrağını ekleyin. Metin madenciliği sonuçlarının sonuç klasöründe olduğundan emin olun.
İşlevsel olarak ilişkili tüm proteinleri içerecek şekilde tüm proteinleri analiz edin veya yalnızca GO terimiyle ilgili proteinleri içerecek şekilde çekirdek proteinleri analiz edin belirterek analiz için kullanılacak metin madenciliği sonuçlarını belirtin. Her hastalık için en iyi proteinleri ve yolları belirlemek için, CaseOLAP skorları her hastalık kategorisi içinde dönüştürülen Z-skorudur. Proteinlerin önemli kabul edileceği belirli bir eşik puanını belirtmek için kısa çizgi Z bayrağını belirtin.
Analiz sonuçlarını gözden geçirin ve gerektiği gibi ayarlayın. Dosyayı z_score_cutoff_table açın. csv, her hastalık kategorisi için önemli olan protein sayısını içeren oluşturulan Z-skoru tablosunu görüntülemek için kullanılır.
Bu, kullanıcıyı uygun bir Z skoru eşiği seçmesi için bilgilendirmeye yardımcı olur. Sonuçlar klasörünü açın ve ön işlemeden oluşturulan klasör de dahil olmak üzere gerekli dosyaların klasörde olduğundan emin olun. Çekirdek proteinler klasörlerindeki tüm proteinleri kontrol edin.
Bilgi grafiğini tasarlamak için, MeSH hastalığı ağacını MeSH bayrağıyla birlikte ekleyin. Diziden protein-protein etkileşimleri PPI bayrağını, paylaşılan Reactome yolları PW bayrağını içerir ve GRNdb GTEx'ten transkripsiyon faktörü bağımlılığını içerir TFD bayrağını içerir. Yalnızca GO terimiyle ilgili proteinleri içerecek şekilde analiz çekirdek proteinlerini belirterek bilgi grafiği oluşturma modülünü çalıştırın.
Kenar ağırlıklarını ölçeklendirmek için, varsayılan CaseOLAP puanları yerine negatif olmayan Z puanları için ölçek Z puanını kullanın. Çıktıyı kontrol edin ve bilgi grafiği dosyalarının merged_edges emin olun. TSV ve merged_nodes.
TSV dosyaları mevcuttur. Son olarak, protein hastalığı ilişkilerini tahmin etmek için bilgi grafiği tahmin komut dosyasını çalıştırmak için ekranda gösterilen komutu yazın. Bu şekil, her hastalık kategorisi için önemli olan mitokondriyal proteini sunar.
Z-skoru dönüşümü, üç eşik kullanılarak önemli proteinleri tanımlamak için her kategorideki CaseOLAP skorlarına uygulandı. Her hastalık kategorisi için önemli olan toplam protein sayısı, her keman grafiğinin üzerinde gösterilmiştir. Bu proteinlerin Reactome yolağı analizi, tüm hastalıklar için önemli olan 12 yolu ortaya çıkardı.
Hastalığa özgü bir bilgi grafiğine derin öğrenmenin uygulanmasına ilişkin bir örnek bu şekilde sunulmuştur. Proteinler ve hastalık arasındaki gizli ilişkiler tahmin edilir ve her iki tahmin için hesaplanan olasılıklar burada sıfırdan bire kadar değişen değerlerle görüntülenir, burada biri güçlü bir tahmine işaret eder. Belirtilen sıra, bu protokolün, özellikle ön işleme ve metin madenciliği modüllerinin yürütülmesi için çok önemlidir.
Bu iki adım, her hastalık için en iyi proteinlerin ve yolların tanımlanmasını ve ayrıca hastalığa özgü bilgi grafiğinin oluşturulmasını doğrudan etkiler. Ortaya çıkan bilgi grafiği, Neo4j ve Cytoscape gibi grafik araçları tarafından etkili bir şekilde görselleştirilir ve yeni ilişkilerin gelişmiş derin öğrenme tahminleri için kullanılabilir. CaseOLAP LIFT, herhangi bir hücresel bileşen ve hastalık kategorileri arasındaki ilişkilerin incelenmesini sağlar.
Ortaya çıkan bilgi grafiği ve sıralanmış protein hastalığı ilişkileri, doğal dil işlemeyi ve takip grafiği tabanlı analizleri destekler.