نستخدم التسلسل الوراثي للفيروسات لمحاولة فهم من أين تأتي الفيروسات وكيف تنتشر. ومن أجل استخدام تلك البيانات في الوقت الحقيقي، على سبيل المثال أثناء تفشي المرض، علينا أن نفهم بالضبط مدى دقة البيانات التي نقدمها. المزايا الرئيسية لهذه التقنيات هي أنها رخيصة نسبيا ، انها سريعة ، وتمكن من الترميز قاعدة في الوقت الحقيقي والتي يمكن استخدامها لتسلسل في الميدان.
ويمكن استخدام هذه الطريقة لتوليد البيانات في الوقت المناسب من تسلسل التي، على سبيل المثال، يمكن استخدامها لتحديد مصدر العديد من مسببات الأمراض. يمكن أن تكون هذه التقنية معقدة للمستخدمين لأول مرة والمعرفة الأساسية يونكس مطلوب. خاصة لتركيب حزم البرامج المختلفة.
تساعد مرئيات هذه الطريقة المستخدمين على تحديد معدل الخطأ في بروتوكولات التسلسل الخاصة بهم. والإجابة على أسئلة البحث. يتم بدء تشغيل تسلسل على MinION متصلة MinIT.
بعد preforming تسلسل على منصة Nanopore، تحميل تحميل البيانات في Porechop. لمنع التلوث و لتحسين الدقة، استخدم علامة التسطير السفلي 2، الباركود السفلية وأدخل الأمر كما هو مبين. بعد إزالة تعدد الانبعاثات، استخدم cutadapt لإزالة تسلسلات وتسلسلات التمهيدي بطول أقصر من 75 نوكليوتيدات باستخدام الأمر كما هو مبين.
استخدام Minimap2 لرسم خريطة دي multiplex تسلسل يقرأ ضد لوحة من سلالات مرجعية متميزة باستخدام Minimap2. واستخدام Samtools لتوليد تسلسل توافق الآراء. بالنسبة للمحاذاات المستندة إلى المراجع، من الضروري إعداد انفجار والبحث مع تسلسل التوافق الناتج لتحديد أقرب سلالة مرجعية.
ثم كرر المحاذاة المستندة إلى المرجع مع سلالة المرجع الأقرب كمرجع. لتحديد التغطية المطلوبة للقراءة للتعويض عن ملف تعريف الخطأ في تسلسل Nanopore، حدد تعيين التسلسل إلى أمبليكون واحد واستخدم Minimap2 لتعيين يقرأ Nanopore مقابل هذا أمبليكون. استخدام Samtools لتحديد فقط القراءة تعيين Amplicon26 وتحويل ملف بام إلى fastq باستخدام الأوامر كما هو مبين.
اختر عشوائياً مجموعات فرعية، على سبيل المثال، 200 تسلسل يقرأ ألف مرة. تتم محاذاة كافة عمليات القراءة التي تم تحديدها بشكل عشوائي إلى Amplicon26. استخدم KMA لتعيين عمليات القراءة التسلسلية لإنشاء تسلسل توافقي على الفور باستخدام الإعدادات المحسنة لتسلسل Nanopore كما هو مشار إليه من قبل علامة NANO BC.
لفحص تسلسلات التوافق التي تم إنشاؤها استخدم الأوامر كما هو مبين. لعرض معدل الخطأ في txt نقطة الإحصائيات تحت العنوان، معدل الخطأ عدم تطابق أسس تعيين، استخدم الأمر كما هو مبين. لعرض عدد indels يتم عرض تحت العنوان indels لكل دورة استخدام الأمر كما هو مبين.
باستخدام أحدث تدفق الخلية في تركيبة مع اللون الأساسي الوجه بالتخبط، تغطية قراءة من 40 مرات النتائج متطابقة بالمقارنة مع تسلسل Illumina. ينتج عن تغطية القراءة 30 مرة معدل خطأ 0.02٪ الذي يتوافق مع خطأ واحد في كل 585، 000 نوكليوتيدات تسلسل. في حين أن تغطية القراءة من 20 مرات النتائج في خطأ واحد في كل 63، 529 نوكليوتيدات تسلسل.
ينتج عن تغطية القراءة 10 مرات خطأ واحد في كل 3, 312 نوكليوتيدات تسلسل. وهذا يعني أن أكثر من 3 نيوكليوتيدات لكل أربعة الجينوم فيروس Usutu يتم استدعاء خاطئ. مع تغطية القراءة أعلاه 30 مرة، لا يتم ملاحظة أي إندلس.
وقراءة التغطية من 20 مرات النتائج في الكشف عن موقف واحد indel في حين أن التغطية قراءة 10 مرات النتائج indels في 29 مواقف. أهم شيء يجب تذكره هو أنه ، على الرغم من عدم وضوح دائمًا ، إلا أن التحديثات في البرامج تحدث بشكل متكرر ويمكن أن تؤثر على النتائج. هناك العديد من الخيارات من البرامج لاستخدامها.
لقد أظهرنا البرامج الأكثر استخداما. ولكن البرامج المختلفة والإصدارات المختلفة من تلك البرامج قد تؤدي إلى نتائج مختلفة. لقد أظهرنا لك مثالاً على كيفية التحقق من جودة بيانات التسلسل التي نولدها.
وهذا أمر بالغ الأهمية لدعم فاشية موثوق بها.