يسمح هذا البروتوكول التحليلي بدراسة مجموعات البكتيريا المسببة للأمراض على نطاق واسع. هذا مهم جدا لأنه يعزز كيفية إجراء التحقيقات البيئية والوبائية. ولكن لكي يحدث ذلك، ما نحتاجه هو أداة آلية وقابلة للتطوير، أو منصة حسابية تسمح بتحليل عدة آلاف من تسلسلات الجينوم في وقت واحد.
يناسب ProkEvo هذا المكان المناسب ، ويسمح بإجراء تحليل عملي للسكان البكتيريين على نطاق واسع ، مع رسم خرائط للمحتوى الجيني الشامل ، الذي يستعرض الأنماط الجينية والميزات الفريدة حول تلك الأنماط الوراثية للتحقيق البيئي والوبائي. الميزة الرئيسية لهذا البروتوكول هي استخدام منصات حسابية قوية وآلية وقابلة للتطوير ، مثل ProkEvo للقيام بالتعدين الإرشادي للأنماط الجينية الهرمية في مجموعات البكتيريا. وللبروتوكول التحليلي المعروض هنا اليوم عدة آثار عملية.
أحدها هو تسهيل التشخيص بالمعنى الذي من شأنه أن يسمح برسم خرائط للأنماط الجينية البكتيرية وتتبعها في الوقت الفعلي ، بطريقة قابلة للتطوير ، مما يسمح بتمييز السلالات المسببة للأمراض من مسببات الأمراض وتحديدها لتتبع ورسم خرائط لتلك مسببات الأمراض في بيئات مختلفة. وهناك تطبيق آخر يتمثل في تعزيز الترصد الروتيني لمختبرات الصحة العمومية والوكالات التنظيمية، وهو ما يتم لتيسير تتبع مسببات الأمراض في مختلف البيئات التجارية. يوفر البروتوكول المقدم هنا إرشادات عملية لعلماء الأحياء الدقيقة وعلماء البيئة وعلماء الأوبئة وأي شخص مهتم بعلم جينوم السكان البكتيري.
ProkEvo هي منصة مفتوحة المصدر ومتاحة للجمهور ، وتوفر صفحة GitHub الخاصة بها تعليمات استخدام مفصلة. يمكن العثور على البروتوكول الموضح هنا على GitHub أيضا. من خلال التعليمات المقدمة ، نريد أن نجعل ProkEvo وهذا البروتوكول سهل الاستخدام ويستخدمه الباحثون المبتدئون والمتقدمون.
ابدأ في إجراء التحليلات باستخدام شجرة جيجي لرسم شجرة جينية جنبا إلى جنب مع معلومات النمط الوراثي. للقيام بذلك ، قم بتحسين حجم شكل شجرة Gigi ، بما في ذلك قطر وعرض الحلقات عن طريق تغيير القيم العددية داخل الخريطة الحرارية x-lim و G. عند رسم طبقات متعددة من البيانات باستخدام شجرة التكاثر الجيني ، قم بتجميع جميع البيانات الوصفية في أقل عدد ممكن من الفئات لتسهيل اختيار لوحة التلوين.
إجراء تجميع البيانات بناء على مسألة الاهتمام ومعرفة المجال. بمجرد الانتهاء من ذلك ، استخدم مخططا شريطيا لتقييم الترددات النسبية عن طريق تجميع البيانات لنوع التسلسل أو سلالات ST ، وكتابة تسلسل الجينوم الأساسي متعدد المواقع أو متغيرات cgMLST لتسهيل التصورات. اختر عتبة تجريبية أو إحصائية تستخدم لتجميع البيانات.
يمكن استخدام رمز المثال لفحص التوزيع الترددي لسلالات ST وتحديد القطع. يوضح رمز المثال كيفية تجميع STs ذات التردد المنخفض أو المنخفض. يمكن تجميع STs التي لم يتم ترقيمها كSTs أخرى.
استخدم تعليمة برمجية مشابهة لمتغيرات cgMLST. استخدم النهج المتداخل لحساب نسبة كل سلالة ST داخل كل مجموعة فرعية BAPS1 لتحديد STs التي تنتمي إلى نفس المجموعة الفرعية BAPS1. توضح التعليمة البرمجية كيفية حساب النسبة المستندة إلى ST عبر المجموعات الفرعية BAPS1.
لرسم توزيع مقاومة مضادات الميكروبات أو مواقع مقاومة مضادات الميكروبات عبر سلالات ST ، استخدم عتبة تجريبية أو إحصائية لتصفية أهم مواقع مقاومة مضادات الميكروبات لتسهيل التصورات. توفير الخام. ملف csv يحتوي على النسب المحسوبة لجميع مواقع AMR عبر جميع سلالات ST.
بعد ذلك احسب نسبة مقاومة مضادات الميكروبات لكل ST باستخدام الرمز. بعد إجراء العمليات الحسابية لجميع STs ، قم بدمج مجموعات البيانات كإطار بيانات واحد باستخدام الرمز ، ثم قم بتصدير ملف csv الذي يحتوي على النسب المحسوبة مع التعليمة البرمجية. قبل رسم التوزيع القائم على مقاومة مضادات الميكروبات عبر سلالات ST ، قم بتصفية البيانات بناء على عتبة لتسهيل التصورات.
بعد ذلك ، ارسم علم الوراثة الجينوم الأساسي جنبا إلى جنب مع تصنيفات النمط الجيني الهرمي في بيانات AMR في مؤامرة واحدة باستخدام شجرة جيجي. ثم قم بتحسين حجم الشكل داخل شجرة Gigi باستخدام المعلمات المذكورة سابقا. قم بتحسين التصورات عن طريق تجميع المتغيرات أو استخدام التصنيف الثنائي ، مثل وجود الجين أو غيابه.
تم فحص التركيب السكاني الهرمي لسلالة السالمونيلا المعوية الأولى في سياق سلالة الجينوم الأساسية. ثم استخدمت الترددات النسبية لجميع الأنماط الجينية الهرمية لتقييم التوزيع العام والتصنيفات الأكثر شيوعا. تم تجميع سلالات ST الأقل تواترا مثل STs الأخرى لتسهيل تصور البيانات.
وبالمثل ، تم تجميع متغيرات cgMLST الأقل تواترا مثل cgMLSTs الأخرى. تم فحص علاقات الأجداد بين STs باستخدام نهج متداخل من خلال تقييم التردد النسبي لسلالات ST بواسطة المجموعات الفرعية BAPS1 أو الأنماط الفردية. تم تقييم التردد النسبي لسلالة ST التي تميز مواقع مقاومة مضادات الميكروبات لتحديد التوقيعات الجينومية الملحقة الفريدة المرتبطة بالبنية السكانية لسيروفار نيوبورت.
في النتائج ، يبدو أن مواقع MDFA و AAC6IAA قد تم الحصول عليها من قبل سكان سيروفار نيوبورت ، في حين أنه من المتوقع أن يكون ST45 مقاوما للأدوية المتعددة. بالمقارنة مع ST45 ، من المرجح أن تكون سلالات ST الرئيسية الأخرى ، مثل ST5 و ST118 ، عرضة للأدوية المتعددة. بالإضافة إلى ذلك ، تم استخدام تصور مرتكز على علم الوراثة لدمج بيانات الهيكل السكاني الهرمي بشكل منهجي.
يقدم هذا البروتوكول التحليلي أساسا لاستخراج البيانات من المجموعات البكتيرية على نطاق واسع. ما يسمح به هو رسم خرائط للأنماط الجينية وتتبعها على نطاق واسع باستخدام ProkEvo ، ولكن يمكن أيضا توسيعها للإجابة على أسئلة أخرى ، مثل استكشاف توزيع المسارات الأيضية وعوامل الضراوة المرتبطة بمعلومات النمط الوراثي. أي أنه يمكننا التنبؤ بالأنماط الظاهرية المرتبطة بأنماط جينية محددة ذات أهمية.
من المؤكد أن البروتوكول الموصوف هنا يمهد الطريق للباحثين لاستكشاف أسئلة جديدة في مجال علم الجينوم السكاني واستنتاج الأنماط التطورية والبيئية للأنواع البكتيرية المسببة للأمراض وكذلك غير المسببة للأمراض.