ينصب تركيزنا البحثي على اكتشاف البروتينات الميكروبية وقياسها وفهم دورها في الأمراض السريرية. يسمى هذا المجال من البحث metaproteomics السريرية. في هذه الدراسة ، قمنا بتطوير سير عمل المعلوماتية الحيوية الذي سيمكن الباحثين من فهم كيف يمكن للنشاط البكتيري أن يؤثر على تطور المرض.
يمثل التحليل الميتابروتيني للعينات السريرية العديد من التحديات ، بما في ذلك التعامل مع قواعد بيانات تسلسل البروتين الكبيرة جدا لتحديد الببتيد الميكروبي والبروتين الحساس والدقيق من بيانات قياس الطيف الكتلي ، بالإضافة إلى إجراء التعليقات التوضيحية التصنيفية والوظيفية للببتيدات والبروتينات الكمية لتمكين التفسير البيولوجي للنتائج. يوفر سير العمل مزايا متعددة ، بما في ذلك تقليل قاعدة البيانات باستخدام سير عمل تقليل قاعدة البيانات ، والقدرة على البحث عن الببتيدات الميكروبية باستخدام خوارزميات بحث متعددة ، والقدرة على التحقق من الببتيدات الميكروبية المكتشفة في بيانات قياس الطيف الكتلي ، والقدرة على تحديد البروتينات الميكروبية جنبا إلى جنب مع البروتينات المضيفة ، والتفسير البيولوجي للبيانات باستخدام التحليل الإحصائي والمرئي. لقد استخدمنا سير عمل metaproteomics السريري لتحديد لوحة الببتيد الميكروبية لدراسات تطور مرض التليف الكيسي لدراسة حالة العدوى المشتركة أثناء موجات جائحة COVID-19.
تم نشر هذه الدراسات في المجلات الأكاديمية التي راجعها الأقران. نحن نستخدم حاليا سير العمل هذا لدراسة مستمرة لتطوير لوحة نبؤية للببتيد المستهدف لسرطان المبيض. يشارك فريق Galaxy P في أبحاث البصمات المتعددة ، ونحن نعمل على تطوير العديد من تدفقات العمل المتقدمة لتحليل البروتينات والبروتينات.
نحن نعمل حاليا أيضا على تطوير تدفقات عمل للببتيدات المناعية ، والتي ستمكن الباحثين من اكتشاف وتوصيف الببتيدات المقدمة إلى الجهاز المناعي ، بعضها أثناء تطور السرطان والتي تسمى المستضدات الجديدة ، وأيضا مع أمراض أخرى حيث قد تكون أيضا ببتيدات ميكروبية. للبدء ، احصل على قائمة بالأنواع المرتبطة بالمرض أو الحالة ذات الاهتمام. استخدم ملف قائمة الأنواع بعنوان الأنواع.
tabular"كمدخل ل UniProt. قم بتنزيل البروتين بتنسيق FASTA لإنشاء قاعدة بيانات تسلسل البروتين. قم بتشغيل أداة تنزيل قاعدة بيانات البروتين لإنشاء قاعدتي بيانات إضافيتين لتسلسل البروتين ، وقاعدة بيانات Swiss-Prot بشرية تحتوي فقط على الإدخالات التي تمت مراجعتها وقاعدة بيانات بروتين ملوث تحتوي على مستودع مشترك للبروتينات العرضية ، أو cRAP.
استخدم قواعد بيانات البروتين الثلاث كمدخلات لملفات دمج FASTA وتصفية التسلسلات الفريدة لاستبعاد التكرارات. باستخدام قاعدة البيانات الكبيرة التي تم إنشاؤها ومجموعة بيانات قياس الطيف الكتلي كمدخلات ، قم بتشغيل MetaNovo لإنشاء قاعدة بيانات تسلسل البروتين المصغر ، ثم قم بتشغيل ملفات دمج FASTA وتصفية التسلسلات الفريدة على قاعدة البيانات التي تم إنشاؤها بواسطة MetaNovo ، وقواعد بيانات Swiss-Prot و cRAP البشرية لإنشاء قاعدة بيانات مستهدفة مخفضة تحتوي على تسلسلات البروتين الميكروبية والبشرية والملوثة للكشف عن الببتيد. تنفيذ واجهة المستخدم الرسومية للبحث "لإنشاء ملف أرشيف يحتوي على تطابقات طيف الببتيد أو PSMs.
استخدم ملف أرشيف البحث عن واجهة المستخدم الرسومية كمدخلات ل Peptide-Shaker" لإنشاء تقارير PSM والببتيد والبروتين. قم بتشغيل MaxQuant"لإنتاج مجموعات البروتين وملفات الببتيدات. باستخدام أدوات معالجة النص ، قم بتنظيم المخرجات التي تم الحصول عليها من واجهة المستخدم الرسومية للبحث ، و Peptide-Shaker "و MaxQuant.
قم بتسلسل قائمتي الببتيد في مجموعة بيانات واحدة تسمى SGPS-MQ-Peptides.tabular. قم بتجميع قائمة الببتيد المتسلسلة للتخلص من تسلسل الببتيد المكرر والحصول على القائمة النهائية للببتيدات الميكروبية الفريدة. للتحقق من PepQuery2 ، أدخل قائمة الببتيدات الميكروبية المميزة ، ومجموعات بيانات MS الطيفية ، وقاعدة البيانات المرجعية ل UniProt البشرية مع الأشكال الإسوية ، وقاعدة بيانات تسلسل البروتين الملوث.
قم بتشغيل Cut"على تقارير الببتيد من Search GUI, Peptide-Shaker" و MaxQuant"لاستخراج تسلسل الببتيد وإدخالات البروتين المرتبطة بها. قم بتسلسل تسلسل الببتيد وإدخالات البروتين من كلا البرنامجين لإنشاء مجموعة بيانات جديدة مدمجة لبروتين الببتيد ، ثم قم بتشغيل Query Tabular "على مجموعة بيانات بروتين الببتيد المدمجة والببتيدات التي تم التحقق منها لتعيين كل ببتيد تم التحقق منه لإدخال البروتين المرتبط به. مجموعة للاحتفاظ بالببتيدات الفريدة التي تم التحقق منها ومعرفات UniProt المرتبطة بها.
بعد ذلك ، قم بتشغيل Query Tabular "لاستخراج معرفات UniProt ، وإنشاء قائمة تسمى Uniprot-ID من Peptides.tabular الذي تم التحقق منه. قم بتحميل معرفات UniProt إلى UniProt لاسترداد تسلسلات البروتين المرتبطة وحفظها كملف UniProt FASTA جديد. قم بتشغيل ملفات دمج FASTA وتصفية التسلسلات الفريدة على UniProt FASTA التي تم إنشاؤها حديثا ، وقاعدة بيانات UniProt البشرية مع الأشكال الإسوية وقاعدة بيانات ملوثات cRAP لإنشاء قاعدة بيانات تم التحقق منها لقياس الببتيد.
استخدم قاعدة بيانات تسلسل البروتين التي تم التحقق منها ومجموعة بيانات MS كمدخلات ل MaxQuant. من ملف MaxQuant "الببتيدات ، حدد الببتيدات الميكروبية فقط وقم بتشغيل Cut" لاستخراج تسلسلات الببتيد الميكروبية فقط من ملف التحديد. قم بتجميع ملف Cut"لتجميع قائمة بالببتيدات الميكروبية الكمية المحددة.
استخدم ملف قائمة الببتيدات الميكروبية الكمية كميا كمدخلات ل Unipept لإجراء التعليقات التوضيحية التصنيفية والوظيفية. استخرج مخرجات Unipept ، وتحديدا شجرة التصنيف الميكروبي وشجرة بروتينات لجنة الإنزيم الميكروبي. لعرض التصنيف الميكروبي وأشجار بروتين EC ، حدد مجموعة البيانات وافتح الخيارات.
انقر فوق Visualize ، متبوعا بعارض Unipept Taxonomy. بالنسبة للتعليقات التوضيحية التصنيفية والوظيفية بتنسيق جدول، انقر فوق أيقونة العين لمجموعة البيانات الجدولية المسماة Unipept_peptinfo. قم بالتمرير لمراجعة كل ببتيد في صفه الخاص وأعمدة المعلومات المقابلة له.
قبل إجراء التحليل الإحصائي باستخدام MSstatsTMT ، قم بتشغيل Select"على ملف مجموعات البروتين MaxQuant" لإنشاء مجموعات بيانات منفصلة للبروتينات الميكروبية والبشرية. تحتوي هذه البروتينات على علامات تصنيف تشير إلى مصدرها. استبعد أي بروتينات ملوثة تحمل علامة con_.
احتفظ فقط بالبروتينات الميكروبية ذات العلامات مثل _9laco" والبروتينات البشرية التي تحمل العلامة _human" في الجدولة Microbial_Proteins" و Human_Proteins" على التوالي. أخيرا ، باستخدام MSstatsTMT ، قم بإجراء تحليل إحصائي باستخدام ملف الأدلة MaxQuant والبروتينات الميكروبية أو البشرية المختارة. انقر فوق أيقونة العين لعرض المخططات الناتجة.
تم تجميع ما مجموعه 2،595،745 تسلسل بروتيني في قاعدة بيانات شاملة ، والتي تم تخفيضها بعد ذلك إلى قاعدة بيانات أكثر استهدافا تحتوي على 21،289 تسلسل بروتيني لتحديد الببتيد بشكل فعال. باستخدام واجهة المستخدم الرسومية للبحث ، شاكر الببتيد "و MaxQuant ، تم تحديد 196 ببتيد ميكروبي متميز. أكد PepQuery2 134 ببتيدا ميكروبيا مرتبطا ب 73 تسلسلا بروتينا ، مما يشكل قاعدة بيانات تم التحقق منها للقياس الكمي.
قدم تحليل MaxQuant ملف ببتيدات يحتوي على 3،203 ببتيدات ، مع 155 ببتيدا ميكروبيا كميا. كشف تحليل Unipept أن العصيات اللبنية هي الجنس الأكثر وفرة ، والترانسفيراز من الفئة 2 باعتبارها فئة الإنزيم الأكثر انتشارا من بين 155 ببتيدا ميكروبيا كميا. أنتج تحليل MSstatsTMT بركانا ومخططات مقارنة توضح البروتينات المعبر عنها تفاضليا ، مما يدل على أن ثلاثة بروتينات من العصيات اللبنية تم تنظيمها بشكل منخفض في حالات سرطان المبيض مقابل الحالات الحميدة.