JoVE Logo

Sign In

A subscription to JoVE is required to view this content. Sign in or start your free trial.

In This Article

  • Summary
  • Abstract
  • Introduction
  • Protocol
  • النتائج
  • Discussion
  • Disclosures
  • Acknowledgements
  • Materials
  • References
  • Reprints and Permissions

Summary

ترجمة الريبوسومات فك تشفير ثلاثة نيوكليوتيدات لكل كودون إلى الببتيدات. حركتها على طول الحمض النووي الريبوزي المرسال ، التي تم التقاطها بواسطة التنميط الريبوسومي ، تنتج آثار أقدام تظهر دورية ثلاثية مميزة. يصف هذا البروتوكول كيفية استخدام RiboCode لفك شفرة هذه الميزة البارزة من بيانات التنميط الريبوسومي لتحديد إطارات القراءة المفتوحة المترجمة بنشاط على مستوى النسخ الكامل.

Abstract

يعد تحديد إطارات القراءة المفتوحة (ORFs) ، وخاصة تلك التي تشفر الببتيدات الصغيرة ويتم ترجمتها بنشاط في سياقات فسيولوجية محددة ، أمرا بالغ الأهمية للتعليقات التوضيحية الشاملة للتراتيمات المعتمدة على السياق. يوفر التنميط الريبوسومي، وهو تقنية للكشف عن مواقع الارتباط وكثافات ترجمة الريبوسومات على الحمض النووي الريبوسومي، وسيلة لاكتشاف مكان حدوث الترجمة بسرعة على نطاق الجينوم الواسع. ومع ذلك ، فليست مهمة تافهة في المعلوماتية الحيوية تحديد ترجمة ORFs بكفاءة وشمولية لتنميط الريبوسوم. الموضح هنا هو حزمة سهلة الاستخدام ، تسمى RiboCode ، مصممة للبحث عن ترجمة نشطة ل ORFs من أي حجم من الإشارات المشوهة والغامضة في بيانات التنميط الريبوسومي. إذا أخذنا مجموعة البيانات المنشورة مسبقا كمثال، توفر هذه المقالة إرشادات خطوة بخطوة لخط أنابيب RiboCode بأكمله، بدءا من المعالجة المسبقة للبيانات الخام إلى تفسير ملفات نتائج الإخراج النهائي. وعلاوة على ذلك، ومن أجل تقييم معدلات ترجمة الموارد المفتوحة، يرد أيضا وصف مفصل لإجراءات تصور وتقدير كمي لكثافات الريبوسوم في كل إطار من أطر عمل الريبوسوم. باختصار ، هذه المقالة هي تعليمات مفيدة وفي الوقت المناسب لمجالات البحث المتعلقة بالترجمة ، و ORFs الصغيرة ، والببتيدات.

Introduction

في الآونة الأخيرة ، كشفت مجموعة متزايدة من الدراسات عن إنتاج واسع النطاق للببتيدات المترجمة من ORFs من جينات الترميز والجينات المشروحة سابقا على أنها غير مشفرة ، مثل الحمض النووي الريبي الطويل غير المشفر (lncRNAs) 1،2،3،4،5،6،7،8. يتم تنظيم أو تحفيز هذه ORFs المترجمة بواسطة الخلايا للاستجابة للتغيرات البيئية والإجهاد وتمايز الخلايا1،8،9،10،11،12،13. وقد ثبت أن منتجات الترجمة لبعض الموارد المالية المفتوحة تلعب أدوارا تنظيمية هامة في العمليات البيولوجية المتنوعة في التنمية وعلم وظائف الأعضاء. على سبيل المثال ، اكتشف Chng et al.14 هرمون الببتيد المسمى Elabela (Ela ، المعروف أيضا باسم Abela / Ende / Toddler) ، وهو أمر بالغ الأهمية لتطور القلب والأوعية الدموية. اقترح باولي وآخرون أن إيلا يعمل أيضا كميتوجين يعزز هجرة الخلايا في جنين الأسماك المبكر15. أبلغ Magny et al. عن اثنين من الببتيدات الدقيقة التي تحتوي على أقل من 30 حمضا أمينيا تنظم نقل الكالسيوم وتؤثر على تقلص العضلات المنتظم في قلب ذبابة الفاكهة 10.

ولا يزال من غير الواضح عدد هذه الببتيدات التي يشفرها الجينوم وما إذا كانت ذات صلة بيولوجية. لذلك ، فإن التحديد المنهجي لهذه ORFs التي يحتمل أن تكون مشفرة أمر مرغوب فيه للغاية. ومع ذلك ، فإن التحديد المباشر لمنتجات هذه ORFs (أي البروتين أو الببتيد) باستخدام النهج التقليدية مثل الحفظ التطوري 16،17 وقياس الطيف الكتلي 18،19 يمثل تحديا لأن كفاءة الكشف عن كلا النهجين تعتمد على طول ووفرة وتكوين الأحماض الأمينية للبروتينات أو الببتيدات المنتجة. وقد وفر ظهور تنميط الريبوسوم، وهو تقنية لتحديد شغل الريبوسوم على الحمض النووي الريبوزي المرسال بدقة النوكليوتيدات، طريقة دقيقة لتقييم إمكانات الترميز للنسخ المختلفة3،20،21، بغض النظر عن طولها وتكوينها. ميزة مهمة وشائعة الاستخدام لتحديد ترجمة ORFs بنشاط باستخدام تنميط الريبوسوم هي دورية النيوكليوتيدات الثلاثة (3-nt) لآثار أقدام الريبوسوم على mRNA من كودون البداية إلى كودون التوقف. ومع ذلك ، غالبا ما تواجه بيانات التنميط الريبوسومي العديد من المشكلات ، بما في ذلك قراءات التسلسل المنخفضة والمتناثرة على طول ORFs ، وضوضاء التسلسل العالية ، وتلوث الحمض النووي الريبوسومي (rRNA). وبالتالي ، فإن الإشارات المشوهة والغامضة الناتجة عن هذه البيانات تضعف أنماط الدورية 3-nt لآثار أقدام الريبوسومات على الحمض النووي الريبوزي المرسال ، مما يجعل في نهاية المطاف تحديد ORFs المترجمة عالية الثقة أمرا صعبا.

قامت حزمة تسمى "RiboCode" بتكييف اختبار الرتبة المعدل الموقع من Wilcoxon واستراتيجية تكامل القيمة P لفحص ما إذا كان ORF يحتوي على شظايا محمية بالريبوسوم داخل الإطار (RPFs) أكثر بكثير من RPFs22 خارج الإطار. وقد ثبت أنه عالي الكفاءة وحساس ودقيق للتعليق التوضيحي الجديد للترانسلاتوم في بيانات التنميط الريبوسومي المحاكية والحقيقية. وهنا، نصف كيفية استخدام هذه الأداة للكشف عن عمليات ORFs المحتملة للترجمة من مجموعات بيانات تسلسل توصيف الريبوسوم الخام التي تم إنشاؤها بواسطة الدراسة السابقة23. وقد استخدمت مجموعات البيانات هذه لاستكشاف وظيفة الوحدة الفرعية EIF3 "E" (EIF3E) في الترجمة من خلال مقارنة ملامح إشغال الريبوسوم لخلايا MCF-10A المنقولة مع التحكم (si-Ctrl) و EIF3E (si-eIF3e) الحمض النووي الريبي الصغير التداخل (siRNAs). من خلال تطبيق RiboCode على مجموعات البيانات النموذجية هذه ، اكتشفنا 5,633 ORFs جديدة يحتمل أن تشفر الببتيدات الصغيرة أو البروتينات. تم تصنيف هذه ORFs إلى أنواع مختلفة بناء على مواقعها بالنسبة لمناطق الترميز ، بما في ذلك ORFs المنبع (uORFs) ، و ORFs في المصب (dORFs) ، و ORFs المتداخلة ، و ORFs من جينات ترميز البروتين الجديدة (PCGs الجديدة) ، و ORFs من الجينات الجديدة غير المشفرة للبروتين (NonPCGs الجديدة). زادت كثافات قراءة RPF على uORFs بشكل كبير في الخلايا التي تعاني من نقص EIF3E مقارنة بخلايا التحكم ، والتي قد تكون ناجمة جزئيا على الأقل عن إثراء الريبوسومات التي تترجم بنشاط. وأشار تراكم الريبوسوم الموضعي في المنطقة من الكودون 25 إلى 75 من الخلايا الناقصة EIF3E إلى وجود انسداد في استطالة الترجمة في المرحلة المبكرة. يوضح هذا البروتوكول أيضا كيفية تصور كثافة RPF للمنطقة المطلوبة لفحص أنماط الدورية 3-nt لآثار أقدام الريبوسوم على ORFs المحددة. تظهر هذه التحليلات الدور القوي ل RiboCode في تحديد ترجمة ORFs ودراسة تنظيم الترجمة.

Protocol

1. إعداد البيئة وتثبيت RiboCode

  1. افتح نافذة محطة Linux الطرفية وقم بإنشاء بيئة conda:
    كوندا إنشاء -n ريبوكود بيثون = 3.8
  2. التبديل إلى البيئة التي تم إنشاؤها وتثبيت RiboCode والتبعيات:
    conda تنشيط RiboCode
    كوندا تثبيت -c بيوكوندا ريبوكود ريبومينر sra-tools fastx_toolkit cutadapt القوس نجمة samtools

2. إعداد البيانات

  1. احصل على ملفات مرجعية للجينوم.
    1. للحصول على التسلسل المرجعي، انتقل إلى موقع Ensemble على الويب في https://www.ensembl.org/index.html، وانقر فوق القائمة العلوية تنزيل والقائمة الموجودة على الجانب الأيسر FTP Download. في الجدول المعروض، انقر فوق FASTA في العمود DNA (FASTA) والصف الذي يكون فيه النوع إنسانا. في الصفحة المفتوحة ، انسخ رابط Homo_sapiens. GRCh38.dna.primary_assembly.fa.gz ، ثم قم بتنزيله وفك ضغطه في الجهاز الطرفي:
      wget -c \
      http://ftp.ensembl.org/pub/release-104/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz
      gzip -d Homo_sapiens. GRCh38.dna.primary_assembly.fa.gz
    2. للحصول على تعليق توضيحي مرجعي، انقر بزر الماوس الأيمن فوق GTF في العمود Gene sets في صفحة الويب التي تم فتحها آخر مرة. انسخ رابط Homo_sapiens. GRCh38.104.gtf.gz وقم بتنزيله باستخدام:
      wget -c \
      http://ftp.ensembl.org/pub/release-104/gtf/homo_sapiens/Homo_sapiens.GRCh38.104.gtf.gz
      gzip -d Homo_sapiens. GRCh38.104.gtf.gz

      ملاحظة: يوصى بالحصول على ملف GTF من موقع Ensemble على الويب لأنه يحتوي على تعليقات توضيحية للجينوم منظمة في تسلسل هرمي من ثلاثة مستويات ، أي أن كل جين يحتوي على نصوص تحتوي على exons وترجمات اختيارية (على سبيل المثال ، تسلسلات الترميز [CDS] ، موقع بدء الترجمة ، موقع نهاية الترجمة). عندما تكون التعليقات التوضيحية للجين أو النص مفقودة، على سبيل المثال، ملف GTF تم الحصول عليه من UCSC أو NCBI، استخدم GTFupdate لإنشاء GTF محدث مع تعليقات توضيحية كاملة للتسلسل الهرمي بين الوالدين والطفل: GTFupdate original.gtf > update.gtf. بالنسبة لملف التعليقات التوضيحية بتنسيق .gff، استخدم مجموعة أدوات AGAT24 أو أي أداة أخرى للتحويل إلى تنسيق .gtf.
  2. احصل على تسلسلات rRNA.
    1. افتح متصفح UCSC Genome في https://genome.ucsc.edu وانقر فوق أدوات | مستعرض الجدول في القائمة المنسدلة.
    2. في الصفحة المفتوحة، حدد الثدييات للكلاد، والإنسان للجينوم، وجميع الجداول للمجموعة، وrmask للجدول، والجينوم للمنطقة. بالنسبة للتصفية، انقر فوق إنشاء للانتقال إلى صفحة جديدة وتعيين repClass كما يتطابق مع rRNA.
    3. انقر فوق إرسال ثم قم بتعيين تنسيق الإخراج إلى تسلسل وإخراج اسم الملف ك hg38_rRNA.fa. أخيرا ، انقر فوق الحصول على | الإخراج احصل على تسلسل لاسترداد تسلسل rRNA.
  3. احصل على مجموعات بيانات التنميط الريبوسومي من أرشيف قراءة التسلسل (SRA).
    1. قم بتنزيل عينات النسخ المتماثل لمجموعة علاج si-eIF3e وإعادة تسميتها:
      فاست كيو تفريغ SRR9047190 SRR9047191 SRR9047192
      مف SRR9047190.fastq سي-eIF3e-1.fastq
      mv SRR9047191.fastq si-eIF3e-2.fastq
      mv SRR9047192.fastq si-eIF3e-3.fastq
    2. قم بتنزيل عينات النسخ المتماثل للمجموعة الضابطة وإعادة تسميتها:
      فاست كيو تفريغ SRR9047193 SRR9047194 SRR9047195
      mv SRR9047193.fastq si-Ctrl-1.fastq
      mv SRR9047194.fastq si-Ctrl-2.fastq
      mv SRR9047195.fastq si-Ctrl-3.fastq
      ملاحظة: تم الحصول على معرفات الانضمام إلى SRA لمجموعات البيانات النموذجية هذه من موقع التعبير الجيني الشامل (GEO)25 عن طريق البحث عن GSE131074.

3. تقليم المحولات وإزالة تلوث الحمض النووي الريبي الريبي

  1. (اختياري) قم بإزالة المحولات من بيانات التسلسل. تخطي هذه الخطوة إذا تم بالفعل قص تسلسلات المحول، كما في هذه الحالة. خلاف ذلك ، استخدم cutadapt لقص المحولات من القراءات.
    for i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    فعل
    cutadapt -m 15 --مباراة-قراءة-أحرف البدل -a CTGTAGGCACCATCAAT \
    -o ${i}_trimmed.fastq ${i}.fastq
    منجز
    ملاحظة: سيختلف تسلسل المحول بعد -a المعلمة اعتمادا على إعداد مكتبة cDNA. يتم تجاهل القراءات الأقصر من 15 (التي يعطيها -m) لأن الأجزاء المحمية من الريبوسوم عادة ما تكون أطول من هذا الحجم.
  2. قم بإزالة تلوث الحمض النووي الريبي الريبي باستخدام الخطوات التالية:
    1. تسلسلات مرجع rRNA للفهرس:
      ربطة عنق بناء -f hg38_rRNA.fa hg38_rRNA
    2. قم بمحاذاة القراءات إلى مرجع rRNA لاستبعاد القراءات الناشئة عن rRNA:
      for i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
      فعل
      ربطة عنق -n 0 -y -a --norc --best --strata -S -p 4 -l 15 \
      --un=./${i}_noncontam.fastq hg38_rRNA -q ${i}.fastq ${i}.aln
      منجز
      -p يحدد عدد مؤشرات الترابط لتشغيل المهام بالتوازي. وبالنظر إلى الحجم الصغير نسبيا لقراءات الإطار الإقليمي الموحد، ينبغي تحديد حجج أخرى (مثل -n و-y و-a و-norc و--best و--strata و-l) لضمان أن تكون التحالفات المبلغ عنها هي الأفضل. لمزيد من التفاصيل، يرجى الرجوع إلى موقع Bowtie الإلكتروني26.

4. محاذاة القراءات النظيفة مع الجينوم

  1. إنشاء فهرس الجينوم.
    مكدير STAR_hg38_genome
    STAR --runThreadN 8 --runMode genomeGenerate --genomeDir ./STAR_hg38_genome --genomeFastaFiles Homo_sapiens. GRCh38.dna.primary_assembly.fa --sjdbGTFملف Homo_sapiens. GRCh38.104.gtf
  2. قم بمحاذاة القراءات النظيفة (بدون تلوث rRNA) مع المرجع الذي تم إنشاؤه.
    for i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    فعل
    STAR --runThreadN 8 --outFilterType Normal --outWigType تذبذب --outWigStrand تقطعت بهم السبل --outWigNorm RPM --outFilterMismatchNmax 1 --outFilterMultimapNmax 1 --genomeDir STAR_hg38_genome --readFilesIn ${i}_noncontam.fastq --outFileNamePrefix ${i}. --outSAMtype BAM SortedByCoordinate --quantMode TranscriptomeSAM GeneCounts --outSAMattributes All
    منجز
    ملاحظة: كثيرا ما تتم إضافة نيوكليوتيد غير قالب إلى نهاية 5 'لكل قراءة بواسطة النسخ العكسي27 ، والذي سيتم قصه بكفاءة بواسطة STAR أثناء قيامه بإجراء القطع الناعم بشكل افتراضي. يتم وصف معلمات STAR في دليل STAR28.
  3. فرز ملفات محاذاة الفهرسة.
    for i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    فعل
    samtools فرز -T ${i}. Aligned.toTranscriptome.out.sorted \
    -o ${i}. Aligned.toTranscriptome.out.sorted.bam \
    ${i}. Aligned.toTranscriptome.out.bam
    مؤشر samtools ${i}. Aligned.toTranscriptome.out.sorted.bam
    مؤشر samtools ${i}. Aligned.sortedByCoord.out.bam
    منجز

5. اختيار حجم RPFs وتحديد مواقعها P

  1. إعداد التعليقات التوضيحية للنصوص.
    prepare_transcripts -g Homo_sapiens. GRCh38.104.gtf \
    -و Homo_sapiens. GRCh38.dna.primary_assembly.fa -o RiboCode_annot
    ملاحظة: يقوم هذا الأمر بتجميع المعلومات المطلوبة من نسخ mRNA من ملف GTF ويستخرج التسلسلات لكافة نسخ mRNA من ملف FASTA (يتم تجميع كل نسخة عن طريق دمج exons وفقا للهياكل المحددة في ملف GTF).
  2. حدد RPFs ذات الأطوال المحددة وحدد مواقعها في موقع P.
    for i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    فعل
    metaplots -a RiboCode_annot -r ${i}. Aligned.toTranscriptome.out.bam \
    -o ${i} -f0_percent 0.35 -pv1 0.001 -pv2 0.001
    منجز
    ملاحظة: يقوم هذا الأمر بتخطيط ملفات التعريف المجمعة لنهاية 5 'من القراءات المحاذاة لكل طول حول رموز بدء (أو إيقاف) الترجمة المشروحة. يمكن تحديد موقع P المعتمد على طول القراءة يدويا من خلال فحص مخططات التوزيع (على سبيل المثال ، الشكل 1B) لمسافات الإزاحة بين نهايات 5 أقدام من القراءات الرئيسية وكودون البدء. يقوم RiboCode أيضا بإنشاء ملف تكوين لكل عينة، حيث يتم تلقائيا تحديد مواضع موقع P للقراءات التي تعرض أنماط دورية 3-nt مهمة. تحدد المعلمات -f0_percent و -pv1 و -pv2 عتبة النسبة وتخفيضات القيمة p لتحديد قراءات RPF المخصبة في إطار القراءة. في هذا المثال، يتم تعريف النيوكليوتيدات +12 و+13 و+13 من نهاية 5 أقدام من قراءات 29 و30 و31 nt يدويا في كل ملف تكوين.
  3. تحرير ملفات التكوين لكل عينة ودمجها
    ملاحظة: لإنشاء مجموعة توافقية من ORFs الفريدة وضمان تغطية كافية للقراءات لإجراء تحليل لاحق، يتم دمج القراءات المحددة لجميع العينات في الخطوة السابقة. يتم استخدام قراءات الأطوال المحددة المحددة في ملف merged_config.txt (الملف التكميلي 1) ومعلومات موقع P الخاصة بها لتقييم إمكانات الترجمة ل ORFs في الخطوة التالية.

6. De novo التعليق التوضيحي ترجمة ORFs

  1. قم بتشغيل RiboCode.
    RiboCode -a RiboCode_annot -c merged_config.txt -l yes -g \
    -O RiboCode_ORFs_result -S ATG -M 5 -A CTG,GTG,TTG

    حيث تكون المعلمات الهامة لهذا الأمر كما يلي:
    -c ، ملف تكوين يحتوي على مسار ملفات الإدخال ومعلومات القراءات المحددة ومواقع P الخاصة بها.
    -l، بالنسبة للنصوص التي تحتوي على عدة كودونات بدء في المنبع من كودونات التوقف، ما إذا كانت أطول ORFs (المنطقة من كودون البدء الأكثر بعدا إلى كودون التوقف) تستخدم لتقييم إمكانات الترجمة الخاصة بها. إذا تم تعيينها إلى لا، تحديد كودونات البدء تلقائيا.
    -s، كودون (كودونات) البدء الأساسي المستخدم لتحديد ORFs.
    -A، (اختياريا) كودونات البدء غير القانونية (على سبيل المثال، CTG، GTG، وTTG للإنسان) المستخدمة لتحديد ORF، والتي قد تختلف في الميتوكوندريا أو نواة الأنواع الأخرى29.
    -m ، الحد الأدنى للطول (أي الأحماض الأمينية) ل ORFs.
    -o ، بادئة اسم ملف الإخراج التي تحتوي على تفاصيل ORFs المتوقعة (الملف التكميلي 2).
    -g و -b ، إخراج ORFs المتوقعة إلى GTF أو تنسيق السرير ، على التوالي.

7. (اختياري) ORF القياس الكمي والإحصاءات

  1. يقرأ عدد RPF في كل ORF.
    for i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    فعل
    ORFcount -g RiboCode_ORFs_result_collapsed.gtf \
    -r ${i}. Aligned.sortedByCoord.out.bam -f 15 -l 5 -m 25 -M 35 \
    -o ${i}_ORF.counts -s yes -c intersection-strict
    منجز
    ملاحظة: لاستبعاد الريبوسومات المتراكمة المحتملة حول بداية ونهاية ORFs، لا يتم احتساب عدد القراءات المخصصة في أول 15 (محددة بواسطة - f) وآخر 5 كودونات (محددة بواسطة -l). واختياريا، تقتصر أطوال ال RPFs المعدودة على النطاق من 25 إلى 35 nt (الأحجام الشائعة ل RPFs).
  2. حساب الإحصاءات الأساسية ل ORFs المكتشفة باستخدام RiboCode:
    RiboCode_utils Rscript. R
    ملاحظة: RiboCode_utils. يوفر R (الملف التكميلي 3) سلسلة من الإحصاءات لمخرجات RiboCode ، على سبيل المثال ، حساب عدد ORFs المحددة ، وعرض توزيع أطوال ORF ، وحساب كثافات RPF العادية (أي RPKM ، يقرأ لكل كيلوقاعدة لكل مليون قراءة خريطة).

8. تصور (اختياري) ل ORFs المتوقعة

  1. احصل على المواضع النسبية لكودونات البدء والتوقف ل ORF المطلوب (على سبيل المثال ، ENSG00000100902_35292349_35292552_67) على نسخته من RiboCode_ORFs_result_collapsed.txt (الملف التكميلي 3). ثم ، ارسم كثافة RPF يقرأ في ORF:
    plot_orf_density -a RiboCode_annot -c merged_config.txt -t ENST00000622405 \
    -s 33 -e 236 --start-codon ATG -o ENSG00000100902_35292349_35292552_67
    حيث يحدد - s و -e موضع بدء الترجمة وتوقفها لتخطيط ORF. --start-codon يحدد كودون البدء الخاص ب ORF ، والذي سيظهر في عنوان الشكل. -o يحدد بادئة اسم ملف الإخراج.

9. (اختياري) تحليل الميتاجين باستخدام RiboMiner

ملاحظة: قم بإجراء تحليل metagene لتقييم تأثير ضربة EIF3E القاضية على ترجمة ORFs المشروحة المحددة، باتباع الخطوات التالية:

  1. قم بإنشاء تعليقات توضيحية للنصوص ل RiboMiner ، والتي تستخرج أطول نسخة لكل جين استنادا إلى ملف التعليقات التوضيحية الذي تم إنشاؤه بواسطة RiboCode (الخطوة 5.1).
    OutputTranscriptInfo -c RiboCode_annot/transcripts_cds.txt \
    -ز Homo_sapiens. GRCh38.104.gtf -f RiboCode_annot/transcripts_sequence.fa \
    -o longest.transcripts.info.txt -o all.transcripts.info.txt
  2. قم بإعداد ملف التكوين ل RiboMiner. انسخ ملف التكوين الذي تم إنشاؤه بواسطة أمر metaplots الخاص ب RiboCode (الخطوة 5.4) وأعد تسميته "RiboMiner_config.txt". ثم قم بتعديله وفقا للتنسيق الموضح في الملف التكميلي 4.
  3. تحليلات الميتاجين باستخدام ريبومينر
    1. استخدم MetageneAnalysis لإنشاء ملف تعريف إجمالي ومتوسط لكثافات RPFs عبر النصوص.
      التحليل الفوقي -f RiboMiner_config.txt -c longest.transcripts.info.txt \
      -o MA_normed -U codon -M RPKM -u 100 -d 400 -l 100 -n 10 -m 1 -e 5 --norm yes \
      -y 100 --نوع UTR
      حيث تكون المعلمات المهمة هي: --type، تحليل إما CDS أو UTR المناطق؛ ---norm ، سواء تطبيع كثافة القراءة ؛ -y، عدد الكودونات المستخدمة لكل نسخة؛ -U ، كثافة RPF المؤامرة إما على مستوى الكودون أو مستوى nt ؛ -u و -d ، تحديد نطاق مناطق التحليل المتعلقة ببدء الكودون أو إيقاف الكودون ؛ -l، الحد الأدنى لطول (أي عدد المدونات) ل CDS؛ -M ، وضع تصفية النصوص ، إما العد أو RPKM ؛ -n الحد الأدنى من التهم أو RPKM في CDS للتحليل. -m الحد الأدنى من الأعداد أو RPKM من CDS في المنطقة العادية ؛ ، عدد الكودونات المستبعدة من المنطقة العادية.
    2. قم بإنشاء مجموعة من ملفات pdf لمقارنة الإشغالات الريبوسومية على mRNA في خلايا التحكم والخلايا الناقصة eIF3.
      PlotMetageneAnalysis -i MA_normed_dataframe.txt -o MA_normed \
      -ز سي-كرترل,سي-eIF3e -r سي-Ctrl-1,si-Ctrl-2,si-Ctrl-3__si-eIF3e-1,si-eIF3e-2,si-eIF3e-3 -u 100 -d 400 --mode mean
      ملاحظة: يقوم PlotMetageneAnalysis بإنشاء مجموعة من ملفات pdf. تتوفر تفاصيل حول استخدام MetageneAnalysis و PlotMetageneAnalysis على موقع RiboMiner على الويب30.

النتائج

وقد أودع مثال مجموعات بيانات التنميط الريبوسومي في قاعدة بيانات توقعات البيئة العالمية تحت رقم الانضمام GSE131074. تتوفر جميع الملفات والرموز المستخدمة في هذا البروتوكول من الملفات التكميلية 1-4. من خلال تطبيق RiboCode على مجموعة من مجموعات بيانات التنميط الريبوسومي

Discussion

يوفر تنميط الريبوسوم فرصة غير مسبوقة لدراسة عمل الريبوسومات في الخلايا على نطاق الجينوم. يمكن أن يوفر فك رموز المعلومات التي تحملها بيانات التنميط الريبوسومي بدقة نظرة ثاقبة حول مناطق الجينات أو النصوص التي تترجم بنشاط. يوفر هذا البروتوكول خطوة بخطوة إرشادات حول كيفية استخدام RiboCode لتحلي...

Disclosures

وليس لدى المؤلفين أي تضارب في المصالح للإفصاح عنه.

Acknowledgements

يود المؤلفون أن ينوه بالدعم المقدم من الموارد الحسابية التي توفرها منصة HPCC بجامعة شيان جياوتونغ. Z.X. بامتنان خطة دعم المواهب الشابة من الدرجة الأولى من جامعة شيان جياوتونغ.

Materials

NameCompanyCatalog NumberComments
A computer/server running LinuxAny--
Anaconda or MinicondaAnaconda-Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
RR Foundation-https://www.r-project.org/
RstudioRstudio-https://www.rstudio.com/

References

  1. Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
  2. Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
  3. Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
  4. Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
  5. Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
  6. Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663 (2016).
  7. Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076 (2021).
  8. Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5' UTRs. Nature. 559 (7712), 130-134 (2018).
  9. Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388 (2020).
  10. Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
  11. Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
  12. Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
  13. Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90 (2015).
  14. Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
  15. Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636 (2014).
  16. Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
  17. Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
  18. Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
  19. Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
  20. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , 1-19 (2013).
  21. Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
  22. Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61 (2018).
  23. Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
  24. . AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020)
  25. . Gene Expression Omnibus Available from: https://www.ncbi.nim.nih.gov/geo (2002)
  26. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
  27. . STAR manual Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022)
  28. . The genetic codes Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019)
  29. . RiboMiner Available from: https://github.com/xryanglab/RiboMiner (2020)
  30. Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698 (2018).
  31. Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
  32. Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
  33. Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
  34. . RiboCode Available from: https://github.com/xryanglab/RiboCode (2018)
  35. Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094 (2021).

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Explore More Articles

180 mRNA uORF dORF

This article has been published

Video Coming Soon

JoVE Logo

Privacy

Terms of Use

Policies

Research

Education

ABOUT JoVE

Copyright © 2025 MyJoVE Corporation. All rights reserved