يوفر هذا البروتوكول فهما شاملا للأشكال المتماثلة للجينات الناتجة عن الربط البديل و polyadenylation من خلال توفير سير عمل خطوة بخطوة لتحديد مواقع الربط التفاضلي ، والإكسونات المعبر عنها بشكل تفاضلي ، ومواقع poly (A). الميزة الرئيسية لهذا البروتوكول هي أنه يقيم كلا من الطرق القائمة على exon والقائمة على الأحداث لدراسة الربط البديل. كما يطبق الطريقة القائمة على exon لدراسة polyadenylation البديلة.
تم توفير ملفات R Markdown التي تتضمن الرموز والملاحظات لتحليل AS و AP. ينصح باتباع الخطوات الموجودة في ملف R Markdown والوصول إلى الملاحظة لكل خطوة بعناية. لتحديد الربط التفاضلي باستخدام diffSplice من limma ، اتبع ملف دفتر الملاحظات R.
قم بإعداد ملفات الإدخال كما هو موضح في مخطوطة النص. تأكد من اتباع الخطوات من الأول إلى الثالث في المخطوطة بالتتابع لإعداد ملفات الإدخال قبل المضي قدما. ابدأ بتحميل المكتبات اللازمة.
لإجراء تصفية غير محددة ، قم أولا باستخراج مصفوفة أعداد القراءة التي تم الحصول عليها مسبقا وإنشاء قائمة بالميزات باستخدام وظيفة DGEList من حزمة edgeR ، حيث تمثل الصفوف الجينات والأعمدة تمثل العينات. بعد ذلك ، قم بتحويل البيانات من مقياس خام إلى أعداد لكل مليون باستخدام وظيفة CPM من حزمة edgeR ، واحتفظ ب exons بأعداد أكبر من عتبة قابلة للتعيين. تحتوي مجموعة البيانات هذه على ست عينات.
ومن ثم ، يتم تعيين CPM على أكثر من عينة واحدة وثلاث عينات على الأقل من أصل ستة. قم بتسوية الأعداد عبر العينات باستخدام الدالة calcNormFactors من حزمة edgeR باستخدام قيم المتوسط المقتطع ل M. ستحسب هذه الوظيفة عوامل القياس لضبط أحجام المكتبة.
استخدم جدول العينة الذي تم إنشاؤه مسبقا لإنشاء مصفوفة التصميم لتحديد الشروط التجريبية لكل عينة. قم بتشغيل وظيفة voom لحزمة limma لمعالجة بيانات تسلسل الحمض النووي الريبي لتقدير التباين. ستولد هذه الوظيفة أوزانا دقيقة لتصحيح ضوضاء عد بواسون وتحويل أعداد مستوى إكسون لتسجيل عددين لكل مليون أو logCPM.
قم بتشغيل الدالة lmfit لملاءمة النماذج الخطية مع بيانات التعبير لكل إكسون. ثم قم بتشغيل وظيفة eBayes لحساب الإحصائيات المستندة إلى التجريبية للنموذج المجهز للكشف عن تعبير exon التفاضلي. حدد مصفوفة تباين للمقارنات التجريبية ذات الأهمية.
استخدم التناقضات. دالة الملاءمة للحصول على المعاملات والأخطاء القياسية لكل زوج من المقارنات. قم بتشغيل diffSplice على النموذج المجهز لاختبار الاختلافات في استخدام exon للجينات بين النوع البري والضربة القاضية.
استكشف النتائج الأعلى تصنيفا باستخدام دالة topSplice حيث يعطي الاختبار الذي يساوي t ترتيبا ل AS exons والاختبار المتساوي ل simes يعطي ترتيبا للجينات. قم بتشغيل الدالة plotSplice لرسم النتائج. عند وضع الجين محل الاهتمام في وسيطة معرف الجين ، تظهر النقاط الحمراء الإكسونات المعبر عنها بشكل تفاضلي.
قم بإنشاء قطعة أرض بركان باستخدام حزمة الموصلات الحيوية EnhancedVolcano لعرض الإكسونات المعبر عنها بشكل تفاضلي. لاستخدام rMATS، تأكد من تثبيت أحدث إصدار من rMATS الإصدار 4.1.1 إما باستخدام conda أو GitHub في دليل العمل. انتقل إلى المجلد الذي يحتوي على ملفات bam التي تم الحصول عليها بعد التعيين.
قم بإعداد الملفات النصية كما هو مطلوب بواسطة rMATS لشرطي نسخ اسم ملفات bam ومسارها مفصولا بفاصلة. قم بتشغيل rmas. PY باستخدام ملفي نص الإدخال اللذين تم إنشاؤهما ويصفان مسار ملفات BAM والتعليق التوضيحي.
GTF تم الحصول عليها سابقا. يؤدي هذا إلى إنشاء مجلد إخراج يحتوي rmats_out ملفات نصية تصف الإحصائيات بما في ذلك قيم P ومستويات التضمين لكل حدث ربط بشكل منفصل. استخدم مازر حزمة الموصلات الحيوية لاستكشاف نتائج rMATS.
قم بتحميل التقاطع ويقوم exon بحساب الملفات النصية بامتداد JCEC في كائن maser وقم بتضمين ما لا يقل عن خمسة قراءات متوسطة لكل حدث ربط لتصفية النتيجة بناء على التغطية. لتصور نتائج rMATS ، قم أولا بتشغيل وظيفة topEvents من حزمة maser ، وتحديد أحداث الربط المهمة بمعدل اكتشاف خاطئ يبلغ 10٪ وتغيير لا يقل عن 10٪ في النسبة المئوية المقسمة أو PSI. تحقق من أحداث الجينات للجينات الفردية ذات الأهمية وارسم قيم PSI لكل حدث ربط لهذا الجين.
قم بإنشاء مخطط بركان عن طريق تحديد نوع الحدث. استخدم نتائج أحداث الربط التي تم الحصول عليها باستخدام rMATS في شكل ملفات نصية لإنشاء مؤامرات الساشيمي باستخدام حزمة rmats2sashimiplot. تظهر مؤامرة الساشيمي حدث إكسون تم تخطيه في جين Wnk1.
يمثل كل صف عينة RNA-seq ، وثلاث نسخ مكررة من النوع البري وضربة قاضية Mbnl1. يظهر الارتفاع تغطية القراءة في RPKM وتصور الأقواس المتصلة قراءات التقاطع عبر exons. يوضح الجزء السفلي الأشكال المتماثلة البديلة لنموذج الجينات المشروحة.
يمكن ملاحظة تغيير كبير في الطيات وأدلة إحصائية قوية على وجود اختلافات حقيقية في الجينات الموجودة في الأرباع العلوية اليسرى أو اليمنى من مخططات البركان التي تم الحصول عليها باستخدام diffSplice و DEXSeq. تم العثور على إكسون كاسيت يختلف بين الظروف المختلفة للجين Wnk1. أظهر مخطط استخدام الإكسون التفاضلي دليلا على الربط التفاضلي في خمسة مواقع إكسون بالقرب من Wnk1.6.45 ، مع احتمال أن يتم تقسيم الإكسونات المميزة باللون الوردي في عينات خروج المغلوب Mbnl1 مقارنة بالنوع البري.
ساعدت قطعة البركان للجينات التي يتم تقسيمها بدلا من ذلك على التمييز بين الجينات التي تم استبعادها من النوع البري وتلك التي تم تضمينها في النوع البري. تم تصور أنواع أحداث الربط SE و A5SS و A3SS و MXE و RI باستخدام مخططات الساشيمي لأهم الجينات لتلك الأحداث. لوحظ نشاط APA التفاضلي في ثلاث مناطق رئيسية غير مترجمة من الجينات باستخدام قطع البركان.
تم تصور نتائج استخدام موقع PA ذات التفاضل الكبير التي تم الحصول عليها من خطوط أنابيب مختلفة باستخدام مخطط الحدث. يمكن ملاحظة تحول كبير من البعد إلى القريب من استخدام موقع PA في الضربات القاضية المزدوجة في كل من الجينات FOSL1 و Papola. تم تحديد متوسط التغطية في المناطق المحيطة الراسية في مواقع انقسام السلطة الفلسطينية المعروفة على مستوى الجينوم باستخدام مخطط تشخيصي.
تأكد من استخدام المعلمات مثل المعلومات الخاصة بالنقل والسماح بالتداخل المتعدد بشكل صحيح عند إنشاء مقاييس العدد. يعد تركيب النموذج الخطي وتوليد أزواج التباين أمرا مهما للمقارنة المناسبة. بالنسبة إلى rMATS ، تأكد من تعيين جميع المعلمات بشكل صحيح وفقا لبياناتك قبل تشغيل الأمر.
يمكن استخدام الجينات التي تم الحصول عليها من نشاط الربط التفاضلي لإجراء تحليل إثراء مجموعة الجينات. يمكن استخدام أداة أخرى تسمى MISO لمزيد من التحليل القائم على الأحداث.