Bu içeriği görüntülemek için JoVE aboneliği gereklidir. Oturum açın veya ücretsiz deneme sürümünü başlatın.
Farklı ön işleme adımlarını, çoklu omik faktör analizi modelinin tahminini ve çeşitli aşağı akış analizlerini birleştiren karmaşık multi-omik veri kümelerinin denetimsiz analizi için esnek, genişletilebilir Jupyter-lab tabanlı bir iş akışı sunuyoruz.
Hastalık mekanizmaları genellikle karmaşıktır ve birkaç farklı moleküler sürecin etkileşimi tarafından yönetilir. Karmaşık, çok boyutlu veri kümeleri, bu süreçler hakkında daha fazla içgörü oluşturmak için değerli bir kaynaktır, ancak bu tür veri kümelerinin analizi, örneğin farklı hastalık koşullarından, zaman noktalarından ve süreci farklı çözünürlüklerde yakalayan omiklerden kaynaklanan yüksek boyutluluk nedeniyle zor olabilir.
Burada, akut ve kronik koroner sendromlarda bağışıklık tepkisini yakalayan kan örneklerinden oluşturulan bir veri setine multi-omik faktör analizi (MOFA) uygulayarak böylesine karmaşık bir multiomik veri setini denetimsiz bir şekilde analiz etmek ve keşfetmek için bir yaklaşım sergiliyoruz. Veri seti, numune düzeyinde sitokin verileri, plazma-proteomik ve nötrofil prime-seq ve tek hücreli RNA-seq (scRNA-seq) verileri dahil olmak üzere farklı çözünürlüklerde birkaç testten oluşur. Hasta başına ölçülen birkaç farklı zaman noktasına ve birkaç hasta alt grubuna sahip olarak daha fazla karmaşıklık eklenir.
Analiz iş akışı, verilerin birkaç adımda nasıl entegre edileceğini ve analiz edileceğini ana hatlarıyla belirtir: (1) Veri ön işleme ve uyumlaştırma, (2) MOFA modelinin tahmini, (3) Aşağı akış analizi. 1. Adım, farklı veri türlerinin özelliklerinin nasıl işleneceğini, düşük kaliteli özelliklerin nasıl filtreleneceğini ve daha fazla analiz için dağılımlarını uyumlu hale getirmek üzere bunların nasıl normalleştirileceğini ana hatlarıyla belirtir. 2. Adım, MOFA modelinin nasıl uygulanacağını ve tüm omikler ve özelliklerde veri kümesi içindeki ana varyans kaynaklarının nasıl keşfedileceğini gösterir. Adım 3, yakalanan modellerin aşağı akış analizi için çeşitli stratejiler sunar ve bunları hastalık koşullarına ve bu koşulları yöneten potansiyel moleküler süreçlere bağlar.
Genel olarak, diğer bağlamlara ve çoklu omik veri kümelerine de uygulanabilen farklı moleküler özelliklerden oluşan ana varyasyon eksenlerinin tanımlanmasını sağlamak için karmaşık multi-omik veri kümelerinin denetimsiz veri keşfi için bir iş akışı sunuyoruz (örnek kullanım durumunda sunulan diğer tahliller dahil).
Hastalık mekanizmaları genellikle karmaşıktır ve birkaç farklı moleküler sürecin etkileşimi tarafından yönetilir. Belirli hastalıklara yol açan veya bir hastalığın evrimini yöneten karmaşık moleküler mekanizmaları deşifre etmek, hastalıkları anlamak ve tedavi etmek için yeni içgörüler ortaya çıkarabileceğinden, tıbbi önemi yüksek bir görevdir.
Son teknolojik gelişmeler, bu süreçlerin aynı anda daha yüksek bir çözünürlükte (örneğin, tek hücre düzeyinde) ve çeşitli biyolojik katmanlarda (örneğin, DNA, mRNA, kromatin erişilebilirliği, DNA metilasyonu, proteomik) ölçülmesini sağlar. Bu, altta yatan süreçler hak....
1. Hazırlıklar: Teknik kurulum ve kurulum
NOT: Bu programı çalıştırmak için wget, git ve Apptainer'ın cihaza önceden yüklenmiş olmasını sağlayın. Apptainer'ı farklı sistemlere (Linux, Windows, Mac) kurmak için bir kılavuz burada verilmiştir: https://apptainer.org/docs/admin/main/installation.html. Git ile ilgili kurulum bilgileri burada bulunabilir: https://git-scm.com/book/en/v2/Getting-Started-Installing-Git. Farklı giriş veri kümelerinin boyutuna bağlı olarak, iş akışının uygun bir makinede (16 CPU, 64 GB Bellek) çalıştırılması önerilir. Sağlanan örnek verilerle bir duman testi yerel makin....
İş akışının başarılı bir şekilde yürütülmesinin ardından, Şekil 2'de gösterildiği gibi birkaç tablo ve şekil oluşturulur. Şekiller /figures klasörüne yerleştirilir (Şekil 6, Şekil 7, Şekil 8, Ek Şekil 1, Ek Şekil 2, Ek Şekil 3, Ek Şekil 4) ve tablolar beli.......
Ana hatlarıyla belirtilen protokolle, karmaşık bir çoklu omik veri kümesini hızlı bir şekilde keşfetmek için kullanılabilecek modüler ve genişletilebilir Jupyter-notebook tabanlı bir iş akışı sunulmaktadır. İş akışının ana kısımları, ön işleme ve veri uyumlaştırma bölümünden (verilerin filtrelenmesi ve normalleştirilmesi için farklı standart adımlar sunar), MOFA9 modelinin tahmininden ve bazı örnek aşağı akış analizler.......
Yazarlar herhangi bir çıkar çatışması beyan etmemektedir.
C.L., "Münih Veri Bilimi Okulu - MUDS" ortak araştırma okulu altındaki Helmholtz Derneği tarafından desteklenmektedir.
....Name | Company | Catalog Number | Comments |
Apptainer | NA | NA | https://apptainer.org/docs/admin/main/installation.html |
Compute server or workstation or cloud (Linux, Mac or Windows environment). Depending on the size of the different input datasets we recommend running the workflow on a suitable machine (in our setting we use: 16 CPU, 64GB Memory) | Any manufacturer | 16 CPU, 64GB Memory | Large Memory is only required for the processing of the raw single cell data. After preprocessing the later analysis steps can also be performed on regular desktop or laptop computers |
git | NA | NA | https://git-scm.com/book/en/v2/Getting-Started-Installing-Git |
GitHub | GitHub | NA | https://github.com/heiniglab/mofa_workflow |
Bu JoVE makalesinin metnini veya resimlerini yeniden kullanma izni talebi
Izin talebiDaha Fazla Makale Keşfet
This article has been published
Video Coming Soon
JoVE Hakkında
Telif Hakkı © 2020 MyJove Corporation. Tüm hakları saklıdır