A subscription to JoVE is required to view this content. Sign in or start your free trial.
Method Article
يقدم علم البروتين السريري نظرة ثاقبة على الميكروبيوم البشري ومساهماته في المرض. لقد سخرنا القوة الحسابية لمنصة Galaxy لتطوير سير عمل معياري للمعلوماتية الحيوية يسهل التحليل المعقد القائم على قياس الطيف الكتلي وتوصيف أنواع العينات السريرية المتنوعة ذات الصلة بدراسات المرض.
يكشف علم البروتين السريري عن تفاعلات المضيف والميكروبيوم الكامن وراء الأمراض. ومع ذلك، توجد تحديات تواجه هذا النهج. على وجه الخصوص ، من الصعب توصيف البروتينات الميكروبية الموجودة بوفرة منخفضة بالنسبة للبروتينات المضيفة. تعزى التحديات المهمة الأخرى إلى استخدام قواعد بيانات تسلسل البروتين الكبيرة جدا ، مما يعيق الحساسية والدقة أثناء تحديد الببتيد والبروتين من بيانات قياس الطيف الكتلي بالإضافة إلى استرداد التصنيف والتعليقات التوضيحية الوظيفية وإجراء التحليل الإحصائي. لمعالجة هذه المشكلات ، نقدم سير عمل متكاملا للمعلوماتية الحيوية لعلم البروتين القائم على قياس الطيف الكتلي والذي يجمع بين إنشاء قاعدة بيانات تسلسل البروتين المخصص ، وإنشاء مطابقة طيف الببتيد والتحقق منه ، والقياس الكمي ، والتعليقات التوضيحية التصنيفية والوظيفية ، والتحليل الإحصائي. يوفر سير العمل هذا أيضا توصيفا للبروتينات البشرية (مع إعطاء الأولوية للبروتينات الميكروبية) ، وبالتالي تقديم رؤى حول ديناميكيات الميكروبات المضيفة في المرض. يتم نشر الأدوات وسير العمل في نظام Galaxy البيئي ، مما يتيح تطوير هذه الموارد الحسابية وتحسينها ونشرها. لقد طبقنا سير العمل هذا للتحليل metaproteomic للعديد من أنواع العينات السريرية ، مثل مسحات البلعوم الأنفي وسائل غسل القصبات الهوائية. هنا ، نوضح فائدته من خلال تحليل السائل المتبقي من مسحات عنق الرحم. يمكن الوصول إلى سير العمل الكامل وموارد التدريب المصاحبة له على شبكة تدريب Galaxy لتزويد غير الخبراء والباحثين ذوي الخبرة بالمعرفة والأدوات اللازمة لتحليل بياناتهم.
يحدد الميثبروتينات القائمة على قياس الطيف الكتلي (MS) البروتينات الميكروبية والبشرية من العينات السريرية وتحدد كميا. يوفر هذا النهج فهما جديدا لاستجابات الميكروبيوم للمرض ويكشف عن الوسطاء المحتملين لتفاعلات المضيف والميكروبيوم1،2. على الرغم من أن التحليل الميتروبوتي للعينات السريرية يمكن أن يكشف عن تفاعلات الميكروبيوم مع بيئته المضيفة ، إلا أن المجال لا يزال يواجه العديد من التحديات. يتمثل أحد التحديات الرئيسية في الوفرة العالية نسبيا للبروتينات المضيفة (البشرية) ، مما يعيق تحديد البروتينات الميكروبية المنخفضة الوفرة. علاوة على ذلك ، تعتمد metaproteomics القائمة على MS على استخدام قواعد بيانات تسلسل البروتين الكبيرة جدا. تشتمل قواعد البيانات هذه على بروتينات ميكروبية موجودة في العينة ، والتي يمكن أن تؤدي إلى قاعدة بيانات كبيرة تحتوي على ملايين التسلسلات. بعد توليد أطياف قياس الطيف الكتلي الترادفي (MS / MS) من البروتينات المهضومة بشكل مطبق، يتم البحث في أطياف MS / MS مقابل قواعد بيانات تسلسل البروتين الكبيرة، ومطابقة تسلسل الببتيد مع كل طيف (تطابق طيف الببتيد ، أو PSM). ومع ذلك ، تقل الحساسية ، وتزداد احتمالية الإيجابيات الخاطئة مع قواعد البيانات الكبيرة المستخدمة في metaproteomics3. بالإضافة إلى ذلك ، فإن تسلسل البروتين المحفوظ عبر الأصناف وعدم كفاية التعليقات التوضيحية للبروتينات المشفرة تحد من التعليقات التوضيحية التصنيفية والوظيفية للببتيدات والبروتينات المكتشفة4،5. نقدم سير عمل المعلوماتية الحيوية للتحليل الميتابروتيني الفعال للعينات السريرية الذي يعالج العديد من هذه التحديات ويوفر موارد برمجية يمكن الوصول إليها للباحثين للتحقيق في ديناميكيات الميكروبيوم المضيف الكامنة وراء الأمراض البشرية.
تم استخدام metaproteomics السريرية للتحقيق في أنواع العينات المتنوعة ، بما في ذلك البراز والمسحات المهبلية ، من بين أمور أخرى ، لفك تشفير الآليات المسببة للأمراض في الأمراض والظروف6،7،8،9،10،11،12،13،14،15،16،17،18، 19،20. هنا ، نستخدم سير عمل المعلوماتية الحيوية metaproteomic لتحليل مجموعة فرعية من بيانات MS / MS من عينات سائل اختبار عنق الرحم (PTF) من سرطان المبيض (OVCA) والمرضى غير المصابين ب OVCA21. يمكن الوصول إلى أدوات البرامج وسير العمل عبر منصة Galaxy ، والتي تبسط تطوير وتنفيذ تدفقات عمل metaproteomic السريريةالمعقدة 22،23،24،25. Galaxy عبارة عن منصة مفتوحة المصدر مصممة للمعلوماتية الحيوية والبيولوجيا الحاسوبية. يوفر بيئة قائمة على الويب لاستخدام الأدوات مفتوحة المصدر ومهام سير العمل حيث يمكن للباحثين الأكاديميين إجراء تحليلات البيانات المعقدة ومشاركتها. يحافظ مجتمع عالمي مزدهر من مطوري البرمجيات وعلماء البيانات والمستخدمين النهائيين على نظام Galaxy البيئي ، بما في ذلك شبكة تدريب Galaxy (GTN ؛ https://training.galaxyproject.org/) ، التي تقدم موارد تدريب عبر الإنترنت وعند الطلب22،23،24،25،26،27. يهدف سير عملنا إلى الكشف عن فهم جديد لديناميكيات الميكروبات المضيفة في العينات السريرية بالإضافة إلى إنشاء أهداف ببتيد جديدة وذات خصائص جيدة الأهمية لتطوير فحوصات سريرية مستهدفة قائمة على التصلب العصبي المتعدد لمزيد من الدراسة للعينات السريرية6،20،28. علاوة على ذلك ، تهدف هذه المخطوطة إلى تسليط الضوء على منهجية سير عمل metaproteomics السريرية. يتم توفير أدلة أكثر تفصيلا وملاءمة للمبتدئين في GTN (https://training.galaxyproject.org/) لأنها مورد قيم يمكن استخدامه بالتوازي مع هذه المخطوطة للمستخدمين الذين يبحثون عن تفسيرات إضافية غير مشمولة. قام مجتمع Galaxy بتأليف العديد من المخطوطات لمساعدة المستخدمين المبتدئين لمنصة Galaxy20،21،22،23،24،25،26،27.
تم توفير جميع الجداول التكميلية (على سبيل المثال ، معلمات الأداة) والأشكال (على سبيل المثال ، أمثلة على المخططات) لهذه المخطوطة كملفات منفصلة ويتم الرجوع إليها وفقا لذلك. تم استخدام إصدارات الأدوات الحالية داخل الإصدار 2.3.0 من Galaxy لهذه المخطوطة. لذلك ، قد تختلف النتائج قليلا اعتمادا على تحديثات إصدار Galaxy والأداة. منصة Galaxy وأدواتها مفتوحة المصدر ويمكن استخدامها لأغراض البحث الأكاديمي.
Access restricted. Please log in or start a trial to view this content.
تم الحصول على البيانات الطيفية ل MS / MS من عينات PTF المتبقية غير المحددة التي تم جمعها باستخدام إجراءات تتبع المبادئ التوجيهية واللوائح المعتمدة من المجلس المؤسسي ، كما هو موضحسابقا 21،29،30.
ملاحظة: يقدم الشكل 1 نظرة عامة على سير العمل الكامل ، والذي يتكون من خمس وحدات. يتم تلخيص جميع المدخلات والمخرجات وأدوات البرامج في الجدول التكميلي 1.
الشكل 1: ملخص وحدات سير عمل Metaproteomics السريرية داخل Galaxy. يتكون سير العمل الكامل لعلم الميتابروتينات السريري من خمس وحدات: إنشاء قواعد البيانات ، والاكتشاف ، والتحقق ، والقياس الكمي ، وتفسير البيانات. (أ) تتضمن قاعدة البيانات الشاملة الكبيرة تسلسلات البروتين من الأنواع الميكروبية التي يعتقد أنها موجودة في العينة والبشر والملوثات الشائعة. قامت أداة برنامج MetaNovo بمطابقة البيانات الطيفية ل MS / MS بشكل مباشر مع الببتيدات واستنتاج البروتينات والكائن المصدر الخاص بها من بيانات MS الخام وقاعدة بيانات تسلسل بروتين الإدخال الكبيرة ، مما أدى إلى إنشاء قاعدة بيانات مخفضة33. ثم يتم دمج قاعدة البيانات المخفضة من MetaNovo مع البروتينات البشرية والملوثة لإنشاء قاعدة بيانات لاكتشاف الببتيد. (ب)تقوم خوارزميتان لتحديد الببتيد ، SearchGUI/PeptideShaker و MaxQuant بمطابقة تسلسلات الببتيد مع أطياف MS / MS وقاعدة بيانات البروتين الخداعالمستهدف 49. (ج)يتم التحقق من الببتيدات التي تم تحديدها بواسطة SearchGUI/PeptideShaker وMaxQuant بعد ذلك باستخدام PepQuery2. يعيد PepQuery2 بدقة فحص تسلسلات الببتيد الميكروبية المحددة بشكل مفترض وأطياف MS / MS المتطابقة مقابل التطابقات المحتملة الأخرى للبروتين البشري المضيف و / أو الملوثات ، وبالتالي التحقق من التطابقات الميكروبية عالية الثقة40،41. تستخدم الببتيدات التي تم التحقق منها لإنشاء قاعدة بيانات تسلسل البروتين التي تم التحقق منها والتي سيتم استخدامها لقياس كمية الببتيد والبروتين. (د) يبحث MaxQuant42 في بيانات MS / MS مقابل تسلسل البروتين الذي تم التحقق منه ويحدد الببتيدات الميكروبية والبروتينات المستنبطة جنبا إلى جنب مع البروتينات البشرية. (ه) يتم استخدام Unipept45 و MSstatsTMT46 في الخطوة النهائية للتعليق على البروتينات مع التصنيف والمعلومات الوظيفية (مدخلات لجنة الإنزيم) بالإضافة إلى إنشاء مخططات البراكين والمقارنة. الرجاء النقر هنا لعرض نسخة أكبر من هذا الرقم.
1. وضع العلامات على TMT وتوليد أطياف MS / MS
2. إعداد الوحدة
ملاحظة: تحديدات الأزرار / القائمة غامقة. يمكن الوصول إلى أمثلة الملفات ومهام سير العمل ومعلمات الأداة عبر الجداول التكميلية. يمكن العثور على مزيد من المعلومات حول كيفية استخدام Galaxy في صفحة الأسئلة الشائعة حول GTN (https://training.galaxyproject.org/training-material/faqs/galaxy/).
3. الوحدة 1: إنشاء قاعدة بيانات تسلسل البروتين
ملاحظة: إذا أراد مستخدم استخدام مثال المدخلات وسير العمل من الجدول التكميلي 2، فتأكد من اتباع الإرشادات الواردة في القسم 2. بالنسبة للوحدة النمطية 1، قم باستيراد الإدخال وسير العمل لإنشاء قاعدة البيانات. يتضمن عمود الإخراج في الجدول التكميلي 2 أمثلة على تواريخ المخرجات المكتملة للرجوع إليها. بالنسبة لجميع الوحدات ، يمكن العثور على البرنامج التعليمي المقابل ل GTN في الجدول التكميلي 3.
4. الوحدة 2: اكتشاف الببتيد عبر البحث في قاعدة البيانات
ملاحظة: إذا أراد مستخدم استخدام مثال المدخلات وسير العمل من الجدول التكميلي 2، فتأكد من اتباع الإرشادات الواردة في القسم 2. بالنسبة للوحدة 2، قم باستيراد الإدخال وسير العمل ل DISCOVERY. بالنسبة لجميع الوحدات ، يمكن العثور على البرنامج التعليمي المقابل ل GTN في الجدول التكميلي 3. SearchGUI34،35،36 و PeptideShaker37 هما برنامجان منفصلان ولكن سيتم اعتبارهما برنامجا واحدا لتحديد الببتيد ومعالجته حيث يتم استخدامهما جنبا إلى جنب. لتوافق البرامج ، سيتم تحويل مجموعات بيانات MS / MS من RAW إلى MGF ل SearchGUI/PeptideShaker باستخدام أداة msconvert (في سير العمل المقدم). يمكن ل MaxQuant38 معالجة ملفات RAW.
5. الوحدة 3: التحقق من الببتيدات الميكروبية
ملاحظة: إذا أراد مستخدم استخدام مثال المدخلات وسير العمل من الجدول التكميلي 2، فتأكد من اتباع الإرشادات الواردة في القسم 2. بالنسبة للوحدة 2، قم باستيراد الإدخال وسير العمل للتحقق. بالنسبة لجميع الوحدات ، يمكن العثور على البرنامج التعليمي المقابل ل GTN في الجدول التكميلي 3.
6. الوحدة 4: القياس الكمي MaxQuant
ملاحظة: إذا أراد مستخدم استخدام مثال المدخلات وسير العمل من الجدول التكميلي 2، فتأكد من اتباع الإرشادات الواردة في القسم 2. بالنسبة للوحدة 2، قم باستيراد الإدخال وسير العمل ل QUANTIFICATION. بالنسبة لجميع الوحدات ، يمكن العثور على البرنامج التعليمي المقابل ل GTN في الجدول التكميلي 3.
7. الوحدة 5: تفسير البيانات
ملاحظة: إذا أراد مستخدم استخدام مثال المدخلات وسير العمل من الجدول التكميلي 2، فتأكد من اتباع الإرشادات الواردة في القسم 2. بالنسبة للوحدة 2، قم باستيراد الإدخال وسير العمل ل DATA INTERPRETATION. بالنسبة لجميع الوحدات ، يمكن العثور على البرنامج التعليمي المقابل ل GTN في الجدول التكميلي 3. سيتم استخدام المخرجات من القياس الكمي MaxQuant في الوحدة السابقة هنا للتعليقات التوضيحية التصنيفية والوظيفية باستخدام Unipept والتحليل الإحصائي باستخدام MSstatsTMT. يمكن Unipept الباحثين من تحديد الكائنات الحية الدقيقة وتحديدها في بيئات متنوعة ويتكامل مع قواعد البيانات العامة (مثل UniProt) لاسترداد التعليقات التوضيحية المحدثة. تم تصميم MSstatsTMT للتحليل الإحصائي القوي لبيانات البروتينات الكمية القائمة على قياس الطيف الكتلي باستخدام وضع العلامات TMT.
Access restricted. Please log in or start a trial to view this content.
تم عرض البروتوكول العام الموصوف هنا على ملفات MS / MS التي تم الحصول عليها من مجموعة فرعية من عينات PTF21. قام Do et al.21 بتحليل أربعة ملفات MS / MS من عينات PTF التي تم جمعها باتباع الإجراءات التي وصفها Boylan et al.29و Afiuni-Zadel et al.30. يعطي سي?...
Access restricted. Please log in or start a trial to view this content.
تقدم أبحاث metaproteomics السريرية اختراقات محتملة للدراسات السريرية ، لكن التحديات في تنفيذها لا تزال قائمة. تعيق الوفرة المنخفضة للبروتينات الميكروبية بالنسبة للبروتينات المضيفة في معظم العينات اكتشاف وتوصيف البروتينات غير المضيفة6،10. يمثل...
Access restricted. Please log in or start a trial to view this content.
ويعلن أصحاب البلاغ عدم وجود تضارب في المصالح.
نشكر الدكتورة إيمي سكوبيتز والدكتورة كريستين بويلان (جامعة مينيسوتا) على مجموعات البيانات التجريبية والدكتور بول بيهوفسكي والدكتور تاو ليو والدكتورة كارين رودلاند (مختبرات شمال غرب المحيط الهادئ الوطنية (PNNL)) على خبرتهم في جمع العينات ومعالجة عينات PTF وتوليد بيانات MS المسمى TMT المستخدمة في هذه الدراسة. تم تمويل هذا المشروع جزئيا من قبل تحالف مينيسوتا لسرطان المبيض (MOCA) ، والمعاهد الوطنية للصحة / رقم منحة المعهد الوطني للسرطان: 5R01CA262153 (A.P.N.S.) ، 1R21CA267707 (P.D.J و TJG) ، والمعاهد الوطنية للصحة / رقم منحة المعهد الوطني للسرطان: P30CA077598 (P.D.J. و T.J.G.).
Access restricted. Please log in or start a trial to view this content.
Name | Company | Catalog Number | Comments |
Collapse Collection | GalaxyP | Galaxy Version 5.1.1 | Combines a dataset list collection into a single file (in the order of the list) |
Concatenate datasets | GalaxyP | Galaxy Version 0.1.1 | Concatenate files tail-to-head |
Cut | GalaxyP | Galaxy Version 1.0.2 | Cut (select) specified columns from a file |
FASTA Merge Files and Filter Unique Sequences | GalaxyP | Galaxy Version 1.2.0 | Concatenate FASTA database files together |
FastaCLI | GalaxyP | Galaxy Version 4.0.41+galaxy1 | Appends decoy sequences to FASTA files |
FASTA-to-Tablular | GalaxyP | Galaxy Version 1.1.0 | Convert FASTA-formatted sequences to TAB-delimited format |
Filter | GalaxyP | Galaxy Version 1.1.1 | Filter columns using simple expressions |
Filter Tabular | GalaxyP | Galaxy Version 3.3.0 | Filter a tabular file via line filters |
Galaxy Europe (EU) server | GalaxyP | https://usegalaxy.eu/ | |
Group | GalaxyP | Galaxy Version 2.1.4 | Group a file by a particular column and perform aggregate functions |
Identification Parameters | GalaxyP | Galaxy Version 4.0.41+galaxy1 | Set identification parameters for SearchGUI/PeptideShaker |
Learning Pathway: Clinical metaproteomics workflows within Galaxy | GalaxyP | https://training.galaxyproject.org/training-material/learning-pathways/clinical-metaproteomics.html | |
MaxQuant | GalaxyP | Galaxy Version 2.0.3.0+galaxy0 (Discovery module); Galaxy Version 1.6.17.0+galaxy4 (Quantification module) | Quantitative proteomics software package for analysis of large mass spectrometric data files |
MetaNovo | GalaxyP | Galaxy Version 1.9.4+galaxy4 | Search MS/MS data against a FASTA database (of known proteins) to produce a targeted database (of matched proteins) for mass spectrometry analysis |
msconvert | GalaxyP | Galaxy Version 3.0.20287.2 | Convert and/or filter mass spectrometry files |
MSstatsTMT | GalaxyP | Galaxy Version 2.0.0+galaxy1 | R-based package for detection of differentially abundant proteins in shotgun mass spectrometry-based proteomic experiments using tandem mass tag (TMT) labeling |
PepQuery2 | GalaxyP | Galaxy Version 2.0.2+galaxy0 | Peptide-centric search engine for identification and/or validating known and novel peptides of interest |
PeptideShaker | GalaxyP | Galaxy Version 2.0.33+galaxy1 | Interpret results from SearchGUI for protein identification |
Protein Database Downloader | GalaxyP | Galaxy Version 0.3.4 | Download specified protein sequences as a FASTA file |
Query Tabular | GalaxyP | Galaxy Version 3.3.0 | Load tabular files intoa SQLite database |
Remove beginning | GalaxyP | Galaxy Version 1.0.0 | Remove the specified number of (header) lines from a file |
SearchGUI | GalaxyP | Galaxy Version 4.0.41+galaxy1 | Run search engines on MGF peak lists and prepare results for input to Peptide Shaker |
Select | GalaxyP | Galaxy Version 1.0.4 | Select lines that match an expression |
Unipept | GalaxyP | Galaxy Version 4.5.1 | Retrieve UniProt entries and taxonomic information for tryptic peptides |
UniProt | GalaxyP | Galaxy Version 2.3.0 | Download proteome as a XML (UniProtXML) or FASTA file from UniProtKB |
Access restricted. Please log in or start a trial to view this content.
Request permission to reuse the text or figures of this JoVE article
Request PermissionThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. All rights reserved