Abstract
Biochemistry
Her biri çok sayıda varlık ve zengin bilgi içeren, hızla artan ve çok sayıda biyomedikal rapor, biyomedikal metin madenciliği uygulamaları için zengin bir kaynak oluşturmaktadır. Bu araçlar, araştırmacıların hastalık patolojisi ve terapötiklerine ilişkin yeni içgörüleri ortaya çıkarmak için bu keşifleri entegre etmelerini, kavramsallaştırmalarını ve tercüme etmelerini sağlar. Bu protokolde, metin veri kümelerinden (örneğin, biyomedikal literatür) kullanıcı tarafından seçilen bilgileri çıkararak hücresel bileşenleri ve bunların hastalık ilişkilerini araştırmak için yeni bir hesaplama hattı olan CaseOLAP LIFT'i sunuyoruz. Yazılım, hastalıkla ilgili belgelerde hücre altı proteinleri ve bunların fonksiyonel ortaklarını tanımlar. Hastalıkla ilgili ek belgeler, yazılımın etiket atama yöntemiyle tanımlanır. Ortaya çıkan protein-hastalık ilişkilerini bağlamsallaştırmak ve birden fazla ilgili biyomedikal kaynaktan gelen bilgileri entegre etmek için, daha fazla analiz için otomatik olarak bir bilgi grafiği oluşturulur. Bu yöntemi kullanarak farklı kardiyovasküler hastalık fenotiplerinde mitokondriyal proteinlerin rolünü aydınlatmaya bir örnek sağlamak için çevrimiçi olarak indirilen ~34 milyon metin belgesinden oluşan bir derlem içeren bir kullanım durumu sunuyoruz. Ayrıca, proteinler ve hastalık arasında daha önce bildirilmemiş ilişkileri tahmin etmek için ortaya çıkan bilgi grafiğine bir derin öğrenme modeli uygulandı ve bu, tahmin edilen olasılıklarla >0.90 ve test setinde 0.91'lik alıcı işletim karakteristik eğrisinin (AUROC) altındaki bir alanla 1.583 ilişki ile sonuçlandı. Bu yazılım, analiz için geniş bir ham veri kapsamı ile son derece özelleştirilebilir ve otomatikleştirilmiş bir iş akışına sahiptir; Bu nedenle, bu yöntem kullanılarak, protein-hastalık ilişkileri, bir metin derlemi içinde gelişmiş güvenilirlikle tanımlanabilir.
ABOUT JoVE
Copyright © 2024 MyJoVE Corporation. All rights reserved