4.0K Views
•
14:58 min
•
March 5th, 2022
DOI :
March 5th, 2022
•0:07
Introduction
1:15
Docker Desktop Installation
4:25
Quality Control
5:10
Mapping and Annotation Steps
5:51
Differentially Expressed Genes Process
6:10
Transfer Data to the Personal Computer
12:02
Representative Results
14:22
Conclusions
Transcript
مرحبا بكم في بروتوكول تحليل النسخ عالية الإنتاجية للتحقيق في التفاعلات بين المضيف ومسببات الأمراض. ينقسم هذا البروتوكول في الخطوات التالية. مراقبة الجودة لتصفية القراءات منخفضة الجودة وأيضا لإزالة تسلسلات المحول التسلسل والتعليقات التوضيحية ، أين يجب عليك تعيين القراءات في جينومات مرجعية والتعليق التوضيحي على القراءات في الجينات.
التحليل الإحصائي و تحليل التعبير المشترك، الذي يحدد الجينات المعرب عنها بشكل متفاوت و يجد أيضا وحدات التعبير المشترك. درجة الجزيئية لتحليل اضطراب للعثور على عينات المتطرفة المحتملة. وأخيرا، التحليل الوظيفي لتحديد الوظائف البيولوجية للجينات المعرب عنها بشكل متفاوت.
جميع الأدوات التي تستخدم خطوط الأنابيب هذه تم تثبيتها مسبقا في نظام لينكس وتغليفها في حاوية Docker. العينات التي تستخدم هذه البروتوكولات المستمدة من ورقة نشرتها مجموعتنا في منظمة التحرير الفلسطينية الممرض. وتضم العينات 20 شخصا أصحاء و39 مريضا مصابا بفيروس شيكونغونيا.
تم جمع عينات الدم، وتم إجراء تسلسل الحمض النووي الريبي. لتثبيت Docker في نظام Windows، يجب اتباع هذه الخطوات. انتقل إلى صفحة الويب الرسمية ل Docker ، وانقر فوق البدء.
ابحث عن المثبت لسطح المكتب Docker للنوافذ. قم بتنزيل الملف. تثبيت محليا في الجهاز.
تأكد من وضع علامة على هذين الخيارين. بعد تثبيت البرنامج ، قم بتنزيل صورة Docker لهذا البروتوكول. انتقل إلى محطة Windows الطرفية.
نفذ الأوامر لتنزيل الصورة. بعد تحميل الصورة، يمكنك أن ترى الملف في سطح المكتب دوكر، ومن هذه الصورة، يمكننا بدء الحاوية. بعد النقر فوق الزر round، يجب توسيع المعلمات والخيارات الأصلية لتعريف اسم الحاوية و لربط مجلد في الكمبيوتر المحلي بالمجلد داخل Docker.
بعد ذلك، انقر فوق تشغيل لبدء الحاوية. يمكنك بعد ذلك الوصول إلى المحطة الطرفية ، والتي هي في نظام لينكس داخل دوكر. اكتب أوامر bash ، ومن ثم يمكنك تنفيذ كافة أوامر هذا البروتوكول.
أولا ، علينا تنفيذ المصدر لجعل جميع أدوات هذا البروتوكول متاحة. يجب عليك الوصول إلى البرامج النصية للدليل. لإجراء تحليل النسخ، لديك لتحميل الجينوم المرجعي أولا.
لهذا، يجب تنفيذ الأوامر التالية. بعد تحميل الجينوم، عليك تنزيل التعليق التوضيحي للجينات. للقيام بذلك، يجب عليك كتابة الأوامر التالية.
بعد ذلك، يجب عليك تكوين تفريغ fastq. هذا هو السماح لك بتحميل ملفات التسلسل الأمثلة. بعد كتابة الأوامر التالية، يجب عليك استخدام الزر Tab للانتقال إلى خيار أدوات ووضع علامة على دليل تيارات الخيارات.
استخدم أزرار Tab لحفظها، ثم موافق. ثم قم بإنهاء أداة سريع تفريغ. الآن يمكننا بدء التحميلات من يقرأ بكتابة الأوامر التالية.
مراقبة الجودة يتكون ويقيم بيانيا احتمال الأخطاء في تسلسل يقرأ. في هذه الخطوة، يجب عليك أيضا إزالة التسلسلات الفنية مثل المحولات. لإنشاء الرسوم البيانية لمراقبة الجودة ، يجب عليك تشغيل برنامج FastQC.
لإزالة تسلسلات المحول وتسلسلات ذات جودة منخفضة، يجب عليك كتابة الأوامر التالية. مع قراءات ذات نوعية جيدة، لدينا الآن لرسم خريطة يقرأ في الجينوم المرجعي. بعد رسم الخرائط، سيكون علينا أن نشرح الجينات وفقا للجينات البشرية ومن ثم حساب عدد القراءات التي تتطابق مع كل جين بشري.
الخطوة الأولى هي فهرسة الجينوم المرجعي عن طريق كتابة الأمر التالي. ومن ثم اكتبنا هذه الأوامر لرسم خريطة القراءات في الجينوم البشري. بعد ذلك، يجب تشغيل البرامج النصية التي تقوم بإضافة تعليق توضيحي على القراءات.
بعد تعيين والتعليق التوضيحي، يمكنك إجراء تحليل التعبير التفاضلي الذي يتكون في العثور على الجينات التي التعبير أعلى أو أقل في مجموعة واحدة مقارنة مع مجموعة أخرى. لتحديد الجينات المعرب عنها بشكل تفاضلي، أو DEGs، عليك تشغيل الأوامر التالية. بعد ذلك، يمكنك نقل نتائج البيانات من Docker إلى الكمبيوتر المحلي.
لهذا، انتقل إلى المحطة الطرفية واكتب الأوامر التالية لحفظ كافة النتائج إلى مجلد محلي. لإجراء التحليل المتبقي ، يجب عليك أيضا نسخ كافة ملفات بيانات الدليل إلى دليل في الكمبيوتر المحلي. في الكمبيوتر المحلي الخاص بك، سوف تكون قادرا على رؤية الدلائل حيث قمت بحفظ البيانات من Docker.
كما ترون، يمكنك الوصول إلى جميع المكتبات. يمكنك أيضا فتح ملف HTML الذي يحتوي على تقارير مراقبة الجودة. يمكنك أيضا الوصول إلى دليل يحتوي على الجينات المعرب عنها بشكل متفاوت.
وداخل هذا الدليل، سوف تجد المؤامرات بركان حيث يمكنك أن ترى الجينات التي هي أعلى أو أسفلالتنظيم في مجموعة واحدة مقابل أخرى، في هذه الحالة، المرضى المصابين بفيروس شيكونغونيا مقابل ضوابط صحية. سيتم تنفيذ جميع الخطوات المتبقية من هذا البروتوكول في أدوات الويب باستخدام المتصفح الخاص بك. دعونا نبدأ أولا مع CEMiTool.
انتقل إلى المستعرض واكتب العنوان التالي. يعرف CEMiTool وحدات التعبير المشترك من مجموعات بيانات التعبير التي يوفرها المستخدمون. في الصفحة الرئيسية، يمكنك الانتقال إلى القائمة والنقر فوق الزر تشغيل.
سيؤدي ذلك إلى فتح صفحة جديدة حيث يمكنك تحميل ملف التعبير. هذا الملف موجود في بيانات الدليل للكمبيوتر المحلي. سترى أن هناك ثلاثة ملفات تعبير ، والملف الذي سنستخدمه ل CEMiTool هو tmm استدعاء التطبيع.
ثم عليك تحديد ملف الفينوداتا، نفس الشيء للملف الذي يحتوي على التفاعلات البروتين البروتين، وأخيرا، تحميل الملف الذي يحتوي على مجموعات الجينات أو المسارات. ملف مجموعات الجينات تمكن CEMiTool لإجراء تحليل الإثراء لكل واحد من وحدة التعبير المشترك. بعد ذلك، يجب توسيع مقطع المعلمة ثم انقر فوق تطبيق VST.
بعد ذلك، يمكنك فقط النقر فوق تشغيل CEMiTool. بعد تشغيل CEMiTool ، سترى أنه تم تحديد 12 وحدة تعبير مشترك. بالنقر هنا ، يمكنك تنزيل جميع نتائج هذه التحليلات.
أداة أخرى سنستخدمها في هذا البروتوكول هي MDP ، أو الدرجة الجزيئية للاضطراب. فقط اكتب في متصفحك mdp.sysbio.tools. يحسب MDP المسافة الجزيئية لكل عينة مقارنة بمجموعة مرجعية من العينات ، في هذه الحالة ، الضوابط الصحية ، من أجل العثور ليس فقط على القيم المتطرفة المحتملة ولكن أيضا على مدى اضطراب كل عينة مقارنة بهذه المجموعة.
في الصفحة تشغيل، يمكنك فقط تحميل ملف التعبير بالنقر فوق الزر وتحديد الملف. ثم عليك تحميل ملف phenodata. ثم يجب عليك تحديد العمود الذي يحتوي على معلومات حول المجموعة أو الفئة ثم الفئة أو المجموعة التي تتوافق مع مجموعة التحكم.
بعد ذلك، يمكنك تشغيل MDP فقط. يظهر الرسم البياني الشريطي لكل عينة من العينات كشريط درجة الدرجة الجزيئية للاضطرابات، وتمثل الألوان المجموعات المختلفة. ومؤامرة مربع هو وسيلة أخرى لتصور نفس النتائج حيث ترى على كل النقاط هو عينات مختلفة منفصلة عن طريق مجموعتين.
لإجراء التحليل الوظيفي ، سنستخدم أداة Enrichr. لهذا ، يجب عليك تحديد قائمة الجينات التي تم التعبير عنها بشكل تفاضلي ، إما لأعلى أو لأسفل ، واستخدامها كقائمة جينات إدخال في أداة Enrichr. سترى أن هناك علامات تبويب مختلفة.
يمكن أيضا تنزيل جميع النتائج إلى الكمبيوتر المحلي. تم وضع بيئة الكمبيوتر لتحليل النسخ على منصة Docker. هذا النهج يسمح للمستخدمين الذين ليس لديهم خبرة سابقة مع نظام لينكس للاستفادة من محطة.
في هذه الحاوية، هناك بنية مجلد معرفة مسبقا لمجموعة البيانات والبرامج النصية الضرورية لكافة التحليلات. وفي طور الإعداد، سيستخدم المستخدمون بيانات نسخ الدم من 20 فردا سليما و39 مريضا مصابا بفيروس الشيكونغونيا بشكل حاد. تقوم منصة التسلسل بإرجاع مجموعة من ملفات FASTQ التي تحتوي على تسلسل الحمض النووي ، أي
يقرأ، والجودة المرتبطة بها لكل قاعدة النيوكليوتيدات. مقياس جودة Phred يشير إلى احتمال قراءة غير صحيحة لكل قاعدة. أدوات تحديد وإزالة قراءات منخفضة الجودة من العينات وزيادة احتمال رسم الخرائط يقرأ.
في هذه الخطوة، وحدة رسم الخرائط، وتستخدم قراءات عالية الجودة استرداد كمدخلات لمحاذاتها ضد الجينوم المرجعي البشري. يحدد CEMiTool وحدات التعبير المشترك ويحللها. يتم التعبير عن الجينات داخل نفس الوحدة بشكل مشترك ، مما يعني أنها تظهر أنماطا مماثلة من التعبير عبر عينات مجموعات البيانات.
يوفر تحليل الشبكة معلومات حول الجينات الأكثر اتصالا، أي المحاور. وتظهر أسماء هذه الجينات في الشبكة.
يتناسب حجم العقد مع درجة الاتصال الخاصة به. وقد لخصت النتائج التي تم الحصول عليها من تحليل DEG في قطع بركان. تحليل درجة الجزيئية من اضطراب يسمح بتحديد عينات مضطربة من الأفراد الأصحاء والمصابين.
يقترح MDP العينات التي تعتبر قيما بيولوجية شاذة محتملة. إزالة تلك العينات ستؤثر على نتائج المصب. يمكن إجراء تحليل إثراء وظيفي باستخدام AURA باستخدام أداة Enrichr.
تساعد هذه الخطوات على تفسير النتائج من خلال الكشف عن الأدوار الوظيفية المشتركة للعديد من الجينات التي تم التعبير عنها بشكل تفاضلي. العملية البيولوجية المبينة في الرسوم البيانية الشريطية هي أفضل 10 مجموعات جينية غنية استنادا إلى ترتيبها P-value. وفي الختام، تغطي هذه البروتوكولات جميع خطوات تحليل الحمض النووي الريبي - Seq.
تم تطوير خط الأنابيب وتغليفه في النظام غير التجاري المسمى دوكر. على صورة وإتاحتها للمجتمع العلمي. بسبب نظام الحاويات ، وجميع البرامج النصية والأدوات هي تحت نفس الإصدار المحدد لضمان استنساخ.
وعلاوة على ذلك، أجريت أجزاء من تحليل المعلوماتية الحيوية عن طريق أدوات مجانية سهلة الاستخدام على شبكة الإنترنت.
يصف البروتوكول المعروض هنا خط أنابيب كامل لتحليل بيانات النسخ التسلسلية من قراءات الخام إلى التحليل الوظيفي ، بما في ذلك مراقبة الجودة وخطوات المعالجة المسبقة للنهج التحليلية الإحصائية المتقدمة.
Explore More Videos
ABOUT JoVE
Copyright © 2025 MyJoVE Corporation. All rights reserved