العناصر المتنقلة هي أحد المصادر الرئيسية لعدم الاستقرار الوراثي البشري. فهم التعبير في الأنسجة والظروف المختلفة أمر بالغ الأهمية لفهم تأثيرها على الجينوم. إن النصوص الواسعة من L1 هي نتيجة لتضمين سلبي للتسلسلات ذات الصلة L1 في النصوص الأخرى التي ليس لها دور في دورة حياة L1.
نهجنا يلغي هذه الخلفية غير ذات الصلة. ويمكن تكييف هذا البروتوكول مع دراسات أي عنصر متنقل، أو حتى الفيروسات في أي تسلسل الجينوم. يجب أن يكون هناك على الأقل بعض الاختلاف في التسلسل للسماح بالتمييز بين loci.
إن العرض التوضيحي المرئي لهذه الطريقة أمر بالغ الأهمية في توضيح الصرامة والرعاية المطلوبة لتحديد العناصر المتكررة التي تم التعبير عنها بدقة L1 على المستوى المحدد للوُوَس. ابدأ هذا الإجراء باستخراج الحمض النووي الريبي السيتوبلازمي وتسلسل الجيل التالي كما هو موضح في بروتوكول النص. عن طريق اختيار للRNA cytoplasmic، L1 ذات الصلة يقرأ وجدت داخل الميرنا intronic أعرب في النواة نضبت بشكل كبير.
في إعداد مكتبة التسلسل خطوة أخرى اتخذت للحد من الضوضاء النسخية لا علاقة لها L1s يتضمن اختيار النصوص polyadenylated. وهذا يزيل الضوضاء نسخة L1 ذات الصلة وجدت في الأنواع غير مرنا. تشغيل نموذج محاذاة تسلسل الملفات FASTQ مع عينة RNA seq من الفائدة باستخدام bowtie1 بكتابة سطر الأوامر في محطة لينكس.
وتتطلب استراتيجية المحاذاة هذه أن تكون النصوص متوافقة بشكل فريد وتداخلي مع بحث مُجمومي شامل. توفر هذه الاستراتيجية الثقة في استدعاء رسم الخرائط القراءة على وجه التحديد إلى مكان L1 واحد. Strand فصل إخراج ملفات BAM باستخدام أوامر SAMtools و Linux لتحديد حبلا العلوي و حبلا أسفل.
لاحظ أن قيم العلامة الفعلية قد تختلف إذا كان أحد لا يستخدم بروتوكولات تسلسل الجيل التالي القياسية. تعمل خطوة الفصل هذه على تصفية الضوضاء النسخية التي تم إنشاؤها داخل تسلسلات L1 التي لا علاقة لها بالتبرت L1 عن طريق القضاء على القراءات المعينة المحتملة المتعلقة بـ L1 antisense. إنشاء عدد القراءة مقابل التعليقات التوضيحية لL1 loci باستخدام أدوات السرير.
أولاً اكتب سطر الأوامر لإنشاء عدد القراءة لـ L1s في اتجاه الإحساس على حبل العلوي ثم اكتب سطر الأوامر لإنشاء عدد القراءة لـ L1s في اتجاه الإحساس على حبل القاع. تشير التعليقات التوضيحية المستخدمة لتحديد L1s إلى الطول الكامل L1 مع مناطق المروج الوظيفية التي تعمل على إزالة الضوضاء الخلفية التي تنشأ بخلاف ذلك من L1s مبتورة.
نسخ على عدد القراءة التي تم إنشاؤها عدد الملفات النصية التي تم إنشاؤها من أجل حبلا أسفل وتسمية الصفحة minus_bottom. فرز كافة الأعمدة استناداً إلى أعلى إلى أقل عدد من القراءات العثور على في العمود J.Copy على ملف نصي عدد القراءات التي تم إنشاؤها من أجل خيط العلوي. فرز كافة الأعمدة استناداً إلى أعلى إلى أقل عدد من القراءات العثور في العمود J.And تسمية الصفحة top_plus.
إنشاء صفحة ثالثة تسمى كما دمج وإضافة كافة loci مع 10 أو أكثر من القراءات من minus_bottom وصفحات plus_top. فرز جميع الأعمدة على أساس أعلى إلى أدنى عدد من القراءات الموجودة في العمود J.To تساعد على تعيين المناطق الجينومية، وتحديدا في L1 أو بالقرب loci، تم تحميل الجينوم بأكمله الاقتران وتسلسل الملفات من الأنواع ذات الأهمية من NCBI وتحويلها إلى ملفات FASTQ كما هو موضح في بروتوكول النص. الآن ، فهرسة ملفات BAM لجعلها قابلة للعرض في عارض الجينوم التكاملي ، مختصر IGV ، قبل تحميل الملفات.
في تحميل IGV الجينوم المرجعي من الفائدة لتصور الجينات المشروحة. أيضا تحميل ملف التعليقات التوضيحية لكامل طول L1 العناصر لتصور التعليق L1، وملف BAM للتعبير RNA الإنسان، لتصور النصوص المعينة من عينة من الفائدة وملف BAM لإمكانية تعيين الجينوم البشري لتقييم قابلية تعيين المناطق الجينومية. إزالة تغطية وتقاطع الصفوف المرتبطة بكل ملف BAM.
ضغط ملفات BAM للتعبير RNA الإنسان وحتمية تعيين الجينوم البشري بحيث تناسب جميع المسارات IGV على شاشة واحدة. الخطوة الحاسمة الأخيرة في القضاء على الضوضاء النسخية لتسلسلات L1 لا علاقة لها بـ L1 إعادة التحول الرجعية هي الإنشاء اليدوي لـ L1s كاملة الطول التي تم تحديدها على أنها قد رسمت خرائط لـ RNA للحصول على نسخ من النصوص. يتضمن المعالجة اليدوية تصور كل مكان L1 يعبر عنه في سياق بيئته الجينية المحيطة لتأكيد أن التعبير ينبع من المروج L1.
باستخدام إحداثيات من L1 loci المدرجة في صفحة جدول البيانات مجتمعة، تنظيم يدويا كل مكان L1 مع نسخ معينة بشكل فريد من خلال دراسة البيئة الجينوم المحيطة بها في IGV. قم بـتهيّئ مكان للإعراب عنه بشكل أصلي إذا لم يكن هناك قراءات في اتجاه L1 يصل إلى خمسة كيلوباسس. تسمية الصف الأخضر في اللون وملاحظة لماذا هو L1 أعرب عن أصيلة. يوجد استثناء لهذه القاعدة إذا كانت المنطقة upstream من L1 غير قابل للتعيّن.
إذا كانت هذه هي الحالة، فصنف الصف باللون الأحمر ولاحظ أنه لا يمكن تقييم التعبير عن المنطقة في المنبع لمروج L1 وبالتالي لا يمكن تحديد تعبير L1 بثقة. الخوري مكان لا يمكن التعبير عنها بشكل أصيل قبالة المروج الخاصة بها إذا كان هناك قراءات المنبع تصل إلى خمسة كيلوباسيس. تسمية الصف الأحمر في اللون وملاحظة لماذا هو ليس L1 أعرب عن أصيلة. ارعى مكانًا كـي كاذب إذا تم التعبير عنه داخل intron من جين مُعبّر عنه في نفس الاتجاه ، مع قراءة المنبع لـ L1 ، إذا كان مصبًا لجين مُعبَّر عنه في نفس الاتجاه مع قراءة المنبع لـ L1 ، أو لأنماط التعبير غير المشروحة مع القراءات المنبع لـ L1. يتم تطبيق استثناء لهذه القاعدة عند وجود الحد الأدنى من القراءات المتداخلة مباشرة موقع بدء المروج L1، ولكن قليلاً upstream من L1. إذا لم يكن هناك أي قراءة أخرى من المنبع من حالة L1 مثل هذا، النظر في هذا L1 أن يتم التعبير عنها بشكل أصلي.
تسمية الصف الأخضر وملاحظة لماذا هو L1 أعرب عن أصيلة. قم بـإصلاح مكان L1 كما هو المحتمل أن يكون زائفاً إذا لم يرتبط نمط القراءة المعينة إلى موضع الاستخدام بمناطق L1 المعينة الخاصة بالقابلية لإمكانية تعيينها. إذا كان L1 هو قابل للتمّين بشكل كبير، ولكن لديه فقط كومة من القراءات في منطقة مكثفة داخل L1، فمن غير المحتمل أن تكون مرتبطة بتعبير L1 قبالة المروج الخاص به ومن المرجح أن تكون من مصادر غير مشروحة مثل exons أو LTRs. في مثل هذه الحالات، تنظيم loci كما البرتقالي وملاحظة لماذا هو موضع مشبوه.
تحقق من مصادر التراكمات المشبوهة عن طريق التحقق من موقع L1 في متصفح الجينوم UCSC. 1- يحرس موضعاً لا يمكن التعبير عنه بشكل حقيقي إذا كان داخل بيئة جينومية في مناطق غير مشروحة بشكل متقطع. يمكن التعبير عن القراءة 10 كيلو بيس أعلى المصب من L1. ولكن كل 10 كيلوباسس أو نحو ذلك ، هناك قراءات معينة وبعض تلك القراءات تتماشى مع L1. ومن المرجح أن تكون هذه L1s قد تم تعيينها بسبب أنماط غير مشروحة للتعبير الجينومي.
في مثل هذه الحالات، تنظيم loci كما الحمراء وملاحظة لماذا هو موضع مشبوه. للمساعدة في تعيين كل L1 loci تحديد عدد من قراءات معين بشكل فريد L1 loci باستخدام برنامج bedtools، والتعليق FL-L1 والبيانات تسلسل الجينوم الانحياز. تعيين مكان L1 للحصول على قابلية تعيين التغطية الكاملة عند محاذاة 400 قراءة فريدة إليه.
تحديد العامل المطلوب لتوسيع نطاق أو خفض الحمض النووي الجينومي الانحياز يقرأ إلى 400 لكل L1 الفردية. للحصول على مقياس تحجيم للتعبير وفقا لL1 الفردية تعيين موضع، مضاعفة العامل بعدد من رنا نص يقرأ التي محاذاة إلى L1s الفردية أعرب عن أصيلة. يتم استخدام كل خطوة لتسليط الضوء على الاختلافات بين عناصر L1 التي تم التعبير عنها من المروج الخاصة بهم، وجميع الطرق التي يمكن تضمينها عناصر L1 في النصوص الأخرى التي لا علاقة لها بدورة حياة L1. يظهر هنا هي نص يقرأ أن خريطة فريدة من نوعها لجميع طول كامل L1s سليمة في الجينوم البشري أعرب عنها في خط خلية ورم البروستاتا DU145.
في الأسود هي loci محددة كما أعرب عن أصيلة بعد المعالجة اليدوية. وفي الأحمر هي loci محددة رفض كما يقرأ المعبر عنها بشكل أصيل بعد المعالجة اليدوية. في الرمادي هي loci مع أقل من 10 يقرأ التعيين إلى كل.
وبما أن هذه الوُرَب تمثل جزءاً صغيراً من قراءة النص، فإنها لم تكن منسقة يدوياً. تقريبا 4500 loci لا تظهر رسوميا، كما كان لديهم صفر القراءات المعينة. بعد المعالجة اليدوية، عدد القراءات التي خريطة فريد إلى أصيلة أعرب L1 loci محددة في DU145 تتراوح بين 175 يقرأ إلى الحد الأدنى المختار بشكل تعسفي من 10 يقرأ.
مرة واحدة تم ضبط القراءة لدرجات قابلية تعيين في كل موضع، زيادة كمية للتعبير عن معظم loci. عدد القراءات التي تم تعيينها بشكل فريد إلى L1 loci محددة مع تصحيحات قابلية التخطيط في DU145 تراوحت بين 612 إلى أربعة عمليات قراءة وكان هناك إعادة ترتيب من أعلى إلى أدنى loci التعبير. تلعب كل خطوة دورًا حاسمًا في تقليل المستوى العالي للضوضاء في الخلفية النسخية.
ومع ذلك ، فإن الخطوة الأكثر أهمية هي المعالجة اليدوية لكل مكان L1 لتأكيد نسخها من المروج الخاص بها. تم رفض ما يقرب من 50٪ من L1 loci التي تم تحديدها بيولوجيًا في خلايا DU145 كضوضاء خلفية L1 مصدرها مصادر نسخ أخرى ، مما يؤكد على الصرامة المطلوبة لتحقيق نتائج موثوقة. لتحديد أصغر من L1s، نقترح استخدام اختيار سباق خمسة رئيس من النصوص L1 وتسلسل التكنولوجيا مثل PacBio التي تستفيد من قراءات أطول ويسمح خرائط أكثر فريدة من نوعها.
مع هذا النهج، يمكننا تحديد بدقة وثقة وتحديد أنماط التعبير L1. وهذا يمهد الطريق نحو فهم أفضل لتنظيم L1 الفردية loci والأثر المحتمل.