Method Article
Hedeflenen çapraz bağlama kütle spektrometresi, üç farklı edinme protokolü kullanılarak elde edilen kütle spektrometresi verilerini kullanarak kuaterner protein yapı modelleri oluşturur. Cheetah-MS web sunucusunda basitleştirilmiş bir iş akışı olarak yürütüldüğünde, sonuçlar bir Jupyter Not Defterinde raporlanır. Burada, Jupyter Notebook daha derinlemesine bir analiz için nasıl genişletilebileceğinin teknik yönlerini gösteriyoruz.
Protein-protein etkileşimlerini incelemek zor olabilir, ancak biyolojik sistemlerin nasıl çalıştığına dair içgörüler sağlar. Kuaterner protein yapı modellemesini ve kimyasal çapraz bağlamalı kütle spektrometrisini birleştiren bir yöntem olan hedefli çapraz bağlama kütle spektrometresi (TX-MS), karmaşık, fraksiyone edilmemiş numunelerden elde edilen verileri kullanarak yüksek hassasiyetli yapı modelleri oluşturur. Bu, protein kompleks yapı analizinin önündeki en büyük engellerden birini ortadan kaldırır, çünkü ilgilenilen proteinlerin artık büyük miktarlarda saflaştırılmasına gerek yoktur. Cheetah-MS web sunucusu, protokolün basitleştirilmiş sürümünü topluluk için daha erişilebilir hale getirmek için geliştirilmiştir. Tandem MS / MS verilerini göz önünde bulundurarak, Cheetah-MS, en önemli analiz sonuçlarını özetleyen grafiksel bir rapor olan bir Jupyter Notebook oluşturur. Jupyter Dizüstü Bilgisayarını genişletmek, daha derinlemesine içgörüler sağlayabilir ve modeli ve onu destekleyen kütle spektrometresi verilerini daha iyi anlayabilir. Burada sunulan teknik protokol, en yaygın uzantılardan bazılarını gösterir ve hangi bilgilerin elde edilebileceğini açıklar. Tandem MS / MS toplama verilerini ve tespit edilen XL'lerin bildirilen kuaterner modeller üzerindeki genel etkisini analiz etmeye yardımcı olacak bloklar içerir. Bu tür analizlerin sonucu, NGLView kullanılarak dizüstü bilgisayara gömülü yapısal modellere uygulanabilir.
Protein-protein etkileşimleri, biyolojik sistemlerin yapısını ve işlevini destekler. Proteinlerin kuaterner yapılarına erişebilmek, iki veya daha fazla proteinin yüksek dereceli yapılar oluşturmak için nasıl etkileşime girdiğine dair fikir verebilir. Ne yazık ki, kuaterner yapıların elde edilmesi zor olmaya devam etmektedir; bu, birden fazla polipeptit içeren nispeten az sayıda Protein DataBank (PDB) girişi1'e yansır. Protein-protein etkileşimleri, X-ışını kristalografisi, NMR ve kriyo-EM gibi teknolojilerle incelenebilir, ancak yöntemlerin uygulanabileceği koşullar altında yeterli miktarda saflaştırılmış protein elde etmek zaman alıcı olabilir.
Kimyasal çapraz bağlama kütle spektrometrisi, protein-protein etkileşimleri hakkında deneysel veriler elde etmek için geliştirilmiştir ve kütle spektrometresi keyfi olarak karmaşık numuneler hakkında veri elde etmek için kullanılabilir 2,3,4,5,6,7,8,9 . Bununla birlikte, veri analizinin kombinatoryal doğası ve nispeten az sayıda çapraz bağlı peptit, numunelerin analizden önce parçalanmasını gerektirir. Bu eksikliği gidermek için, hesaplamalı modellemeyi kimyasal çapraz bağlama kütle spektrometresi10 ile birleştiren bir yöntem olan TX-MS'yi geliştirdik. TX-MS, keyfi olarak karmaşık numunelerde kullanılabilir ve önceki yöntemlere kıyasla önemli ölçüde daha hassastır10. Bunu, her MS spektrumunu bağımsız olarak yorumlamak yerine, belirli bir protein-protein etkileşimi ile ilişkili tüm verileri bir set olarak puanlayarak gerçekleştirir. TX-MS ayrıca üç farklı MS edinme protokolü kullanır: yüksek çözünürlüklü MS1 (hrMS1), veriye bağımlı edinme (DDA) ve veriden bağımsız edinme (DIA), birden fazla gözlemi birleştirerek çapraz bağlı bir peptidi tanımlamak için fırsatlar sunar. TX-MS hesaplamalı iş akışı çeşitli nedenlerden dolayı karmaşıktır. İlk olarak, protein yapı modelleri14,15 oluşturmak için birden fazla MS analiz yazılımı programı 11,12,13'e dayanır. İkincisi, veri miktarı önemli olabilir. Üçüncüsü, modelleme adımı önemli miktarda bilgisayar işlem gücü tüketebilir.
Sonuç olarak, TX-MS en iyi şekilde, bilgisayar bulutları veya kümeleri gibi büyük hesaplama altyapılarında çalışan Cheetah-MS web sunucusu16 aracılığıyla otomatik, basitleştirilmiş bir hesaplama iş akışı olarak kullanılır. Sonuçların yorumlanmasını kolaylaştırmak için interaktif bir Jupyter Notebook17 hazırladık. Burada, Jupyter Notebook raporunun, belirli bir sonucun daha derinlemesine bir analizini sağlamak için nasıl genişletilebileceğini gösteriyoruz.
1. İş akışını https://txms.org'de gönderin.
2. Çita-MS'i çalıştırın.
NOT: ProteoWizard MSConvert yazılımı19'u kullanarak satıcıya özgü formatları mzML veya MGF'ye dönüştürün.
3. JupyterHub'ı yükleyin.
4. Raporu indirin.
5. Raporu genişletin.
XT-MS, MS türevi deneysel kısıtlamalarla desteklenen yapısal çıktılar sağlar. Farklı MS veri toplama türlerini hesaplamalı modelleme ile birleştirerek çalışır. Bu nedenle, her MS verisini ayrı ayrı ayrıştırmak ve çıktı yapısının görselleştirilmesini sağlamak yararlıdır. Ek Veri 1, TX-MS çıktısı olarak üretilen DDA ve DIA verilerini ayrıştırabilen örnek bir not defteri içerir. Kullanıcılar ilgilendikleri XL'yi seçebilirler. Not defterini çalıştırarak, bu XL'nin MS2 spektrumu, farklı renklerin birinci peptit, ikinci peptit ve kombinatoryal fragman iyonları ile ilgili parçalar arasında ayrım yapmaya yardımcı olduğu yerlerde gösterilecektir. XL, Jupyter Notebook'a katıştırılmış NGLView widget'ı kullanılarak da yapıya eşlenebilir.
Bu not defterindeki başka bir hücre, kullanıcıların DIA verilerini ayrıştırmasına ve görselleştirmesine yardımcı olabilir. Ancak analiz edilen verilerin doğru formatta hazırlanması gerektiğinden DIA verilerinin görselleştirilmesi daha zordur.
Şekil 1 , M1 ve albüminin örnek bir yapısını, yapı üzerinde üst XL'lerin eşlendiği şekilde göstermektedir. TX-MS, hrMS1, DDA ve DIA verilerini ayrıştırdıktan sonra tüm XL'leri elde etti ve RosettaDock protokolü hesaplama modellerini sağladı.
Bu rapor bir Jupyter Not Defteri olduğundan, herhangi bir geçerli Python kodu yeni not defteri hücrelerine eklenebilir. Örneğin, aşağıdaki kod, MS2 sayımları üzerinden, her çapraz bağlantının temel alınan veriler tarafından ne kadar iyi desteklendiğini gösteren bir histogram oluşturur.
sns olarak denizden ithal
sns.distplot(ms2['sayım']);
Şekil 1: Streptococcus pyogenes M1 proteininin yapısal modeli ve XL'li insan albümini yapı üzerinde haritalandırılmıştır. M1 proteini gri renkte gösterilir ve bir homodimer oluşturur. Altı albümin molekülü, mavinin çeşitli tonlarında çiftler halinde sunulur. Çapraz bağlantılar ve mesafeler siyah metinle kırmızı renkte verilir. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın.
Ek Dosya. Jupyter not defteri verileri. Bu Dosyayı indirmek için lütfen tıklayınız.
Modern hesaplamalı iş akışları, birçok farklı satıcıdan birden çok araç, karmaşık karşılıklı bağımlılıklar, yüksek veri hacimleri ve çok yönlü sonuçlarla genellikle karmaşıktır. Sonuç olarak, bir sonuç elde etmek için gereken tüm adımları doğru bir şekilde belgelemek giderek zorlaşmakta ve verilen sonucun çoğaltılmasını zorlaştırmaktadır. Burada, genel bir rapor üreten otomatik bir iş akışının otomasyonunu ve kolaylığını, raporu yeniden üretilebilir bir şekilde özelleştirme esnekliğiyle birleştiren genel bir strateji gösteriyoruz.
Protokolün çalışması için üç gereksinimin yerine getirilmesi gerekir: Birincisi, analiz için seçilen proteinlerin, kimyasal çapraz bağlama deneyinin, kütle spektrometresi tarafından tespit edilecek kadar yüksek bir konsantrasyonda çapraz bağlı türler üretebileceği şekilde etkileşime girmesi gerekir; Farklı kütle spektrometreleri farklı algılama seviyelerine sahiptir ve ayrıca edinme protokolüne ve çapraz bağlama reaktifinin seçimine de bağlıdır. TX-MS protokolünün mevcut sürümü yalnızca lizin-lizin homobifonksiyonel çapraz bağlama reaktifi olan DSS'ye izin verir. Yine de, bu sınırlama öncelikle makine öğrenimi adımının diğer reaktifler için ayarlanması gerekme olasılığından kaynaklanmaktadır. Bu sınırlama, Cheetah-MS web sunucusunda iki çapraz bağlama reaktifi daha düşünülebildiği için geliştirilmiştir, ancak üçü de bölünemeyen reaktiflerdir. İkincisi, iki proteinin ya deneysel olarak belirlenmiş bir yapıya sahip olması ya da karşılaştırmalı modelleme teknikleri veya de novo teknikler kullanılarak modellenmesi gerekir. Tüm proteinler modellenemez, ancak geliştirilmiş yazılımın ve PDB'deki deneysel yapıların sürekli birikmesinin bir kombinasyonu, modellenebilecek protein sayısını genişletir. Üçüncüsü, etkileşen proteinler bağlı ve bağlanmamış hallerinde yeterince benzer kalmalıdır, böylece TX-MS ve Cheetah-MS tarafından kullanılan yerleştirme algoritmaları, puanlamayı sağlamak için yeterli kalitede kuaterner yapılar oluşturabilir. Bu gereklilik nispeten belirsizdir, çünkü kabul edilebilir kalite oldukça sisteme bağımlıdır, burada bilinen yapıdaki daha küçük proteinlerin karşılaştırılması genellikle bilinmeyen yapıya sahip daha büyük proteinlerden daha kolaydır.
Negatif bir sonuç durumunda, önce TX-MS'nin aynı polipeptit zincirinin bir parçası olan kalıntılar arasında iç bağlantılar, çapraz bağlantılar bulduğunu kontrol edin. Hiçbiri keşfedilmediyse, en olası açıklama, numune hazırlama veya veri toplama işleminde bir şeylerin ters gittiğindir. Birden fazla mesafe kısıtlaması modelleri desteklemiyorsa, konformasyonun çapraz bağlı kalıntılar tarafından desteklendiğinden emin olmak için modelleri görsel olarak inceleyin. En az bir çapraz bağlantıyı bozmadan interaktörlerden birini döndürmenin açık bir yolu yoktur. Verilen çapraz bağlama reaktifi için izin verilen mesafeden daha uzun çapraz bağlantılar varsa, çapraz bağlama verilerini dahil ederek ara aktörlerin modellemesini geliştirmeye çalışın.
Seçilen yazılımın hassasiyetinin TX-MS'in hassasiyeti ile karşılaştırılabilir olması koşuluyla eşdeğer sonuçlar elde etmek için alternatif yazılım uygulamaları kullanmak mümkündür. Örneğin, RosettaDock, HADDOCK ve diğerlerinin çevrimiçi sürümleri vardır. Kimyasal çapraz bağlama verilerini xQuest/xProphet5,6, plink7 ve SIM-XL26 aracılığıyla analiz etmek de mümkündür.
TX-MS ve Cheetah-MS'iyeni projeler 27,28,29'a sürekli olarak uyguluyoruz, böylece bu yaklaşımlarla üretilen raporları, raporları büyütmeden sonuçların daha ayrıntılı bir analizini sağlayacak şekilde geliştiriyoruz.
Yazarların açıklayacak hiçbir şeyleri yoktur.
Bu çalışma Knut ve Alice Wallenberg Vakfı (hibe no. 2016.0023) ve İsviçre Ulusal Bilim Vakfı (hibe no. P2ZHP3_191289). Ayrıca, Zürih Üniversitesi S3IT'ye hesaplama altyapısı ve teknik desteği için teşekkür ederiz.
Name | Company | Catalog Number | Comments |
Two Protein DataBank files of the proteins of interest. | N/A | N/A | Example files available on txms.org and zenodo.org, DOI 10.5281/zenodo.3361621 |
An mzML data file acquired on a sample where the proteins of interest were crosslinked. | N/A | N/A | Example files available on txms.org or zenodo.org, DOI 10.5281/zenodo.3361621 |
Bu JoVE makalesinin metnini veya resimlerini yeniden kullanma izni talebi
Izin talebiThis article has been published
Video Coming Soon
JoVE Hakkında
Telif Hakkı © 2020 MyJove Corporation. Tüm hakları saklıdır