Sign In

A subscription to JoVE is required to view this content. Sign in or start your free trial.

In This Article

  • Summary
  • Abstract
  • Introduction
  • Protocol
  • النتائج
  • Discussion
  • Disclosures
  • Acknowledgements
  • Materials
  • References
  • Reprints and Permissions

Summary

الغرض من هذا البروتوكول هو التحقيق في تطور والتعبير عن الجينات المرشحة باستخدام بيانات تسلسل الحمض النووي الريبي.

Abstract

غالبا ما يكون تقطير مجموعات البيانات الكبيرة والإبلاغ عنها، مثل الجينوم الكامل أو بيانات النسخ، مهمة شاقة. إحدى الطرق لكسر النتائج هي التركيز على عائلة جينية واحدة أو أكثر مهمة للكائن الحي والدراسة. في هذا البروتوكول، نحدد الخطوات المعلوماتية الحيوية لتوليد فيلوجيني وتحديد التعبير عن الجينات ذات الاهتمام. يمكن للأشجار النباتية إعطاء فكرة عن كيفية تطور الجينات داخل الأنواع وفيما بينها وكذلك الكشف عن علم الكائنات الحية. ويمكن تعزيز هذه النتائج باستخدام بيانات الحمض النووي الريبي-seq لمقارنة التعبير عن هذه الجينات في مختلف الأفراد أو الأنسجة. ويمكن أن تكشف دراسات التطور الجزيئي والتعبير عن أساليب التطور وحفظ وظيفة الجينات بين الأنواع. يمكن أن يكون توصيف عائلة الجينات بمثابة نقطة انطلاق للدراسات المستقبلية ويمكن أن يسلط الضوء على عائلة جينية مهمة في جينوم جديد أو ورقة نسخ.

Introduction

وقد سهل التقدم في تكنولوجيات التسلسل تسلسل الجينوم والنسخ من الكائنات الحية غير النموذجية. بالإضافة إلى زيادة جدوى تسلسل الحمض النووي والحمض النووي الريبي من العديد من الكائنات الحية ، وفرة من البيانات متاحة للجمهور لدراسة الجينات ذات الأهمية. الغرض من هذا البروتوكول هو توفير خطوات المعلوماتية الحيوية للتحقيق في التطور الجزيئي والتعبير عن الجينات التي قد تلعب دورا هاما في الكائن الحي ذات الاهتمام.

التحقيق في تطور الجينات أو الجينات الأسرة يمكن أن توفر نظرة ثاقبة في تطور النظم البيولوجية. عادة ما يتم تحديد أفراد عائلة الجينات من خلال تحديد الزخارف المحفوظة أو تسلسل الجينات المتجانسة. تم التحقيق في تطور عائلة الجينات سابقا باستخدام الجينوم من الكائنات الحية نموذج ذات الصلة البعيدة1. ويتمثل أحد القيود المفروضة على هذا النهج في أنه ليس من الواضح كيف تتطور هذه الأسر الجينية في الأنواع ذات الصلة الوثيقة ودور الضغوط البيئية الانتقائية المختلفة. في هذا البروتوكول، ونحن تشمل البحث عن homologs في الأنواع ذات الصلة الوثيقة. من خلال توليد فيلوجيني على مستوى الفيلوم، يمكننا أن نلاحظ الاتجاهات في تطور الأسرة الجينية مثل الجينات المحفوظة أو الازدواجية الخاصة بالنسب. على هذا المستوى، يمكننا أيضا التحقيق فيما إذا كانت الجينات هي تقويم العظام أو البارالوجات. في حين أن العديد من التجانسات تعمل على الأرجح بشكل مماثل لبعضها البعض ، إلا أن هذا ليس بالضرورة هو الحال2. دمج الأشجار النباتية في هذه الدراسات مهم لحل ما إذا كانت هذه الجينات المتجانسة هي تقويم العظام أم لا. في eukaryotes، العديد من تقويم العظام الاحتفاظ بوظائف مماثلة داخل الخلية كما يتضح من قدرة البروتينات الثدييات لاستعادة وظيفة تقويم العظام الخميرة3. ومع ذلك ، هناك حالات حيث يقوم جين غير تقويم العظام بوظيفة مميزة4.

تبدأ الأشجار النباتية في تحديد العلاقات بين الجينات والأنواع ، ومع ذلك لا يمكن تعيين الوظيفة فقط على أساس العلاقات الوراثية. توفر دراسات التعبير الجيني إلى جانب الشروح الوظيفية وتحليل الإثراء دعما قويا لوظيفة الجينات. الحالات التي يمكن فيها قياس التعبير الجيني ومقارنته عبر الأفراد أو أنواع الأنسجة يمكن أن تكون أكثر دلالة على الوظيفة المحتملة. يتبع البروتوكول التالي الأساليب المستخدمة في التحقيق في جينات الأوبسين في Hydra vulgaris7، ولكن يمكن تطبيقها على أي نوع وأي عائلة جينية. وتوفر نتائج هذه الدراسات أساسا لمزيد من التحقيق في وظائف الجينات وشبكات الجينات في الكائنات غير النموذجية. على سبيل المثال ، فإن التحقيق في فيلوجيني من opsins ، وهي البروتينات التي تبدأ سلسلة نقل ضوئي ، يعطي سياقا لتطور العينين والكشف عن الضوء8و9و10و11. في هذه الحالة ، يمكن للكائنات غير النموذجية وخاصة الأنواع الحيوانية القاعدية مثل cnidarians أو ctenophores توضيح الحفظ أو التغيرات في سلسلة النقل الضوئي والرؤية عبر clades12و13و14. وبالمثل، فإن تحديد البيلوجيني والتعبير وشبكات عائلات الجينات الأخرى سيخبرنا بالآليات الجزيئية الكامنة وراء التكيفات.

Protocol

يتبع هذا البروتوكول إرشادات رعاية الحيوانات في جامعة كاليفورنيا في إيرفين.

1. إعداد مكتبة RNA-seq

  1. عزل الجيش الملكي النيبالي باستخدام الطرق التالية.
    1. جمع العينات. إذا كان الجيش الملكي النيبالي هو أن يتم استخراجها في وقت لاحق، فلاش تجميد العينة أو مكان في حل تخزين الجيش الملكي النيبالي15 (جدول المواد).
    2. القتل الرحيم وتشريح الكائن الحي لفصل الأنسجة ذات الأهمية.
    3. استخراج إجمالي الحمض النووي الريبي باستخدام عدة استخراج وتنقية الجيش الملكي النيبالي باستخدام عدة تنقية الحمض النووي الريبي(جدول المواد)
      ملاحظة: هناك بروتوكولات ومجموعات التي قد تعمل بشكل أفضل لأنواع مختلفة من الأنسجة والأنواع16،17. لقد استخلصنا الحمض النووي الريبي من أنسجة الجسم المختلفة لفراشة18 وهيدراالجيلاتينية19 (انظر المناقشة).
    4. قياس تركيز وجودة الحمض النووي الريبي لكل عينة (جدول المواد). استخدم عينات مع أرقام تكامل الحمض النووي الريبي (RIN) أعلى من 8 ، وهو أقرب إلى 920 لإنشاء مكتبات cDNA.
  2. إنشاء مكتبة cDNA وتسلسلها كما يلي.
    1. بناء مكتبات cDNA وفقا لدليل التعليمات الإعدادية للمكتبة (انظر المناقشة).
    2. تحديد تركيز و جودة cDNA (جدول المواد).
    3. تعدد المكتبات وتسلسلها.

2. الوصول إلى نظام مجموعة كمبيوتر

ملاحظة: تحليل RNA-seq يتطلب التلاعب في الملفات الكبيرة ويتم أفضل على مجموعة الكمبيوتر(جدول المواد).

  1. تسجيل الدخول إلى حساب نظام المجموعة الكمبيوتر باستخدام الأمر username@clusterlocation ssh على محطة طرفية (ماك) أو PuTTY (ويندوز) إطار التطبيق.

3. الحصول على RNA-seq يقرأ

  1. الحصول على قراءات RNA-seq من مرفق التسلسل أو، للبيانات التي تم إنشاؤها في منشور، من مستودع البيانات حيث تم إيداعه (3.2 أو 3.3).
  2. لتنزيل البيانات من مستودعات مثل ArrayExpress قم بما يلي:
    1. ابحث في الموقع باستخدام رقم الانضمام.
    2. ابحث عن الرابط لتنزيل البيانات، ثم انقر بزر الماوس الأيسر وحدد نسخ الارتباط.
    3. على الإطار الطرفي اكتب wget وحدد لصق الارتباط لنسخ البيانات إلى الدليل للتحليل.
  3. لتنزيل بيانات أرشيف القراءة القصيرة NCBI (SRA) اتبع الخطوات البديلة التالية:
    1. على محطة تحميل مجموعة أدوات SRA v. 2.8.1 باستخدام wget.
      ملاحظة: تحميل وتثبيت البرامج إلى كتلة الكمبيوتر قد تتطلب الوصول الجذر اتصل بمسؤول نظام المجموعة الكمبيوتر إذا فشل التثبيت.
    2. الانتهاء من تثبيت البرنامج عن طريق كتابة القطران -xvf $TARGZFILE.
    3. البحث NCBI لرقم الانضمام SRA للعينات التي تريد تحميلها، يجب أن يكون تنسيق SRRXXXXXX.
    4. الحصول على البيانات RNA-seq بكتابة [موقع sratoolkit] / بن / الجلب المسبق SRRXXXXXXXX في نافذة المحطة الطرفية.
    5. لنوع الملفات ذات الطرفين [موقع sratoolkit] / بن / fastq تفريغ -- تقسيم الملفات SRRXXXXXX للحصول على اثنين من الملفات fastq (SRRXXXXXX_1.FASTQ و SRRXXXXXX_2.FASTQ).
      ملاحظة: للقيام بتجميع Trinity de novo استخدم الأمر [موقع sratoolkit]/bin/fastq-dump -defline-seq '@$sn[_$rn]/$ri' --ملفات الانقسام SRRXXXXXXXX

4. تقليم المحولات ومنخفضة الجودة يقرأ (اختياري)

  1. تثبيت أو تحميل Trimmomatic21 v. 0.35 على نظام المجموعة الحوسبة.
  2. في الدليل حيث توجد ملفات البيانات RNA-seq اكتب الأمر الذي يتضمن موقع ملف جرة trimmomatic ملفات FASTQ الإدخال ملفات FASTQ الإخراج والمعلمات الاختيارية مثل طول القراءة والجودة.
    ملاحظة: يختلف الأمر حسب جودة القراءة الخام والمطلوبة وطولها. لIllumina 43 bp يقرأ مع التمهيديات Nextera، استخدمنا: جافا -جرة / البيانات / تطبيقات / trimmomatic/0.35/trimmomatic-0.35.jar PE $READ 1. فاست كيو $READ 2. paired_READ1 فاست كيو. unpaired_READ1 فاست كيو. paired_READ2 فاست كيو. unpaired_READ2 فاست كيو. FASTQ ILLUMINACLIP:محولات.fa:2:30:10 الرائدة:20 زائدة:20 انزلاقWINDOW:4:17 مينلين:30.

5. الحصول على التجميع المرجعي

  1. البحث جوجل، EnsemblGenomes، وNBI الجينوم وNocleotide TSA (Transcriptome بندقية الجمعية) للحصول على الجينوم المرجعي أو transcriptome تجميعها للأنواع ذات الاهتمام (الشكل 1).
    ملاحظة: إذا لم يكن الجينوم المرجعي أو النسخ متوفرا أو منخفض الجودة، انتقل إلى STEP 6 لإنشاء تجميع de novo.
  2. إذا كان هناك جينوم مرجعي أو نسخة مجمعة، فقم بتنزيله كملف fasta إلى حيث سيتم إجراء التحليل باتباع الخطوات أدناه.
    1. العثور على الرابط لتحميل الجينوم، انقر على اليسار ونسخ الارتباط.
    2. على الإطار الطرفي اكتب wget ولصق عنوان الارتباط. إذا كان متوفرا، أيضا نسخ ملف GTF والبروتين FASTA ملف للجينوم المرجعي.

6. إنشاء تجميع دي نوفو (بديل الخطوة 5)

  1. الجمع بين RNA-seq READ1 و READ2 ملفات fastq لجميع العينات عن طريق كتابة القط * READ1. فاست كيو > $all_READ1. FASTQ والقط * READ2. > all_READ2 فاست كيو. FASTQ على نافذة المحطة الطرفية.
  2. تثبيت أو تحميل الثالوث22 v.2.8.5 على نظام المجموعة الحوسبة.
  3. إنشاء وتجميع عن طريق الكتابة على المحطة الطرفية: Trinity --seqType fq --max_memory 20G --اليسار $all_READ1. FASTQ --الحق $all_READ2. فاست كيو.

7. خريطة يقرأ إلى الجينوم (7.1) أو دي نوفو transcriptome (7.2)

  1. تقرأ الخريطة الجينوم المرجعي باستخدام STAR23 v. 2.6.0c و RSEM24 ضد 1.3.0.
    1. تثبيت أو تحميل STAR v. 2.6.0c. و RSEM v. 1.3.0 إلى كتلة الحوسبة.
    2. فهرسة الجينوم عن طريق كتابة rsem- إعداد المرجع -gtf $GENOME. GTF -- نجمة - ع 16 $GENOME. $OUTPUT فاستا.
    3. يقرأ الخريطة ويحسب التعبير لكل عينة بكتابة rsem-calculate-expression -p 16 --star --المقترنة-end $READ 1. فاست كيو $READ 2. $INDEX $OUTPUT فاست كيو.
    4. إعادة تسمية ملف النتائج إلى شيء وصفي باستخدام mv RSEM.genes.results $sample.genes.results.
    5. إنشاء مصفوفة من جميع التهم عن طريق كتابة rsem توليد البيانات مصفوفة * [الجينات / isoforms.results] > $OUTPUT.
  2. خريطة RNA-seq إلى جمعية ترينيتي دي نوفو باستخدام RSEM وbowtie.
    1. تثبيت أو تحميل الثالوث22 v.2.8.5، Bowtie25 ضد 1.0.0، و RSEM ضد 1.3.0.
    2. تقرأ الخريطة التعبير وتحسبه لكل عينة عن طريق كتابة [trinity_location]/align_and_estimate_abundance.pl -المرجع الإعدادي - النصوص $TRINITY. FASTA --seqType fq -- يسار $READ 1. FASTQ -- الحق $READ 2. فاست كيو -- est_method RSEM -- aln_method bowtie -- trinity_mode -- output_dir $OUTPUT.
    3. إعادة تسمية ملف النتائج إلى شيء وصفي باستخدام mv RSEM.genes.results $sample.genes.results.
    4. إنشاء مصفوفة من جميع التهم عن طريق كتابة [trinity_location]/abundance_estimates_to_matrix.pl --est_method RSEM *[الجينات / isoforms].results

8. تحديد الجينات ذات الاهتمام

ملاحظة: يمكن القيام بالخطوات التالية مع ملفات النيوكليوتيد أو البروتين FASTA ولكنها تعمل بشكل أفضل وأكثر مباشرة مع تسلسل البروتين. عمليات البحث BLAST باستخدام البروتين إلى البروتين هو أكثر عرضة لإعطاء نتائج عند البحث بين أنواع مختلفة.

  1. للحصول على جينوم مرجعي، استخدم ملف FASTA البروتيني من الخطوة 5.2.2 أو راجع المواد التكميلية لإنشاء ميزة جينية مخصصة GTF.
  2. للحصول على نسخة من دي نوفو، قم بإنشاء بروتين FASTA باستخدام TransDecoder.
    1. تثبيت أو تحميل TransDecoder v. 5.5.0 على الكمبيوتر cluser.
    2. العثور على أطول إطار القراءة المفتوحة وتسلسل الببتيد المتوقعة عن طريق كتابة [موقع Transdecoder]/TransDecoder.LongOrfs-t $TRINITY. فاستا، فاستا.
  3. ابحث NCBI Genbank عن التجانس في الأنواع ذات الصلة الوثيقة.
    1. افتح نافذة متصفح إنترنت واذهب إلى https://www.ncbi.nlm.nih.gov/genbank/.
    2. على شريط البحث اكتب اسم الجين من الفائدة واسم الأنواع ذات الصلة الوثيقة التي تم تسلسل أو جنس أو phylum. على يسار شريط البحث حدد البروتين ثم انقر فوق البحث.
    3. استخراج تسلسلات بالنقر فوق إرسال إلى ثم حدد ملف. ضمن تنسيق، حدد FASTA ثم انقر فوق إنشاء ملف.
    4. نقل FASTA ملف homologs إلى كتلة الكمبيوتر بكتابة scp $FASTA username@clusterlocation:/$DIR على إطار محطة طرفية محلية أو استخدام FileZilla لنقل الملفات من وإلى الكمبيوتر والكتلة.
  4. البحث عن الجينات المرشحة باستخدام BLAST +26.
    1. تثبيت أو تحميل BLAST + v. 2.8.1 على نظام المجموعة الكمبيوتر.
    2. على كتلة الكمبيوتر ، وجعل قاعدة بيانات BLAST من الجينوم أو transcriptome ترجمة البروتين FASTA عن طريق كتابة [BLAST + الموقع] / makeblastdb في $PEP. FASTA -dbtype بروت التدريجي $OUTPUT
    3. BLAST تسلسل الجينات متجانسة من NCBI إلى قاعدة بيانات الأنواع ذات الاهتمام عن طريق كتابة [BLAST + الموقع] / blastp -db $DATABASE -query $FASTA -evalue 1e-10 -outfmt 6 -max_target_seqs 1-out $OUTPUT.
    4. عرض ملف الإخراج باستخدام الأمر أكثر. نسخ معرفات جينية فريدة من نوع الاهتمام إلى ملف نصي جديد.
    5. استخراج تسلسل الجينات المرشحة عن طريق كتابة بيرل -ne 'إذا(/^>(\S+)/){$c=$i{$1}}$c?طباعة:chomp;$i{$_}=1 إذا @ARGV' $gene_id.txt $PEP. > $OUTPUT فاستا.
  5. تأكيد التعليقات التوضيحية الجينية باستخدام BLAST المتبادل.
    1. على متصفح الإنترنت انتقل إلى https://blast.ncbi.nlm.nih.gov/Blast.cgi.
    2. حدد tblastn، ثم الصق تسلسلات المرشحين، وحدد قاعدة بيانات تسلسل البروتين غير المتكررة وانقر فوق BLAST.
  6. تحديد جينات إضافية من خلال شرح جميع الجينات في الجينوم أو النسخ باستخدام مصطلحات علم الجينات (GO) (انظر المناقشة).
    1. نقل البروتين FASTA إلى الكمبيوتر المحلي.
    2. تحميل وتثبيت Blast2GO27،28،29 ضد 5.2 إلى الكمبيوتر المحلي.
    3. فتح Blast2GO، انقر فوق ملف، انتقل إلى تحميل، انتقل إلى تحميل تسلسلات، انقر فوق تحميل Fasta ملف (fasta). حدد الملف FASTA وانقر فوق تحميل.
    4. انقر على الانفجار، اختر NCBI انفجار،وانقر فوق التالي. تحرير المعلمات أو انقر فوق التالي، تحرير المعلمات وانقر فوق تشغيل للعثور على وصف الجينات الأكثر تشابها.
    5. انقر فوق تعيين ثم انقر فوق تشغيل للبحث في التعليقات التوضيحية علم الجينات عن البروتينات مماثلة.
    6. انقر فوق interproالتالي ، حدد EMBL-EBI InterPro، وانقر فوق التالي. تحرير المعلمات أو انقر فوق التالي، ثم انقر فوق تشغيل للبحث عن توقيعات من العائلات والمجالات الجينية المعروفة.
    7. تصدير التعليقات التوضيحية بالنقر فوق ملف، حدد تصدير، انقر فوق تصدير جدول. انقر فوق استعراض، واسم الملف ، انقر فوق حفظ، انقر فوق تصدير.
    8. ابحث في جدول التعليقات التوضيحية عن شروط GO المثيرة للاهتمام لتحديد جينات المرشح الإضافية. استخراج التسلسلات من الملف FASTA (الخطوة 8.4.5)

9. الأشجار النباتية

  1. تحميل وتثبيت MEGA30 v. 7.0.26 إلى الكمبيوتر المحلي.
  2. فتح MEGA، انقر على محاذاة،انقر فوق تحرير / بناء المحاذاة،حدد إنشاء محاذاة جديدة انقر فوق موافق،حدد البروتين.
  3. عندما تفتح نافذة المحاذاة، انقر فوق تحرير، انقر فوق إدراج تسلسلات من الملف وحدد FASTA مع تسلسل البروتين من الجينات المرشحة والتجانس المحتمل.
  4. حدد كافة التسلسلات. العثور على رمز الذراع وتحوم فوقه. وينبغي أن أقول محاذاة تسلسل باستخدام خوارزمية MUSCLE31. انقر على رمز الذراع ثم انقر فوق محاذاة البروتين لمحاذاة التسلسلات. تحرير المعلمات أو انقر فوق موافق لمحاذاة باستخدام المعلمات الافتراضية.
  5. فحص بصريا وإجراء أي تغييرات يدوية ثم حفظ وإغلاق إطار المحاذاة.
  6. في النافذة الرئيسية MEGA، انقر على نماذج،انقر فوق البحث عن أفضل نماذج الحمض النووي / البروتين (ML)،حدد ملف المحاذاة وحدد المعلمات المقابلة مثل: تحليل: اختيار النموذج (ML)، شجرة لاستخدام: التلقائي (الجار الانضمام شجرة)، الأسلوب الإحصائي: أقصى احتمال، نوع الاستبدال: الأحماض الأمينية، الفجوة / علاج البيانات في عداد المفقودين: استخدام جميع المواقع، تصفية موقع فرع: لا شيء.
  7. بمجرد تحديد أفضل طراز للبيانات، انتقل إلى النافذة الرئيسية MEGA. انقر فوق Phylogeny وانقر فوق Contruct / اختبار شجرة الاحتمال الأقصى ثم حدد المحاذاة، إذا لزم الأمر. حدد المعلمات المناسبة للشجرة: الطريقة الإحصائية: أقصى احتمال، اختبار Phylogeny: أسلوب Bootstrap مع 100 يكرر، نوع الاستبدال: الأحماض الأمينية، نموذج: LG مع Freqs. (+F)، المعدلات بين المواقع: جاما موزعة (G) مع 5 فئات غاما منفصلة، الفجوة / علاج البيانات المفقودة: استخدام جميع المواقع، ML أسلوب الاستدلال: أقرب الجار التبادل (NNI).

10. تصور التعبير الجيني باستخدام TPM

  1. بالنسبة الثالوث، على نظام المجموعة الكمبيوتر انتقل إلى الدليل حيث تم تشغيل abundance_estimates_to_matrix.pl وينبغي أن يكون أحد المخرجات مصفوفة. TPM.not_cross_norm نقل هذا الملف إلى الكمبيوتر المحلي.
    ملاحظة: راجع المواد التكميلية لتطبيع العينة المتقاطعة.
  2. بالنسبة ل TPMs من تحليل الجينوم اتبع الخطوات أدناه.
    1. على نظام مجموعة أجهزة الكمبيوتر، انتقل إلى موقع التثبيت RSEM. نسخ rsem-توليد-البيانات-مصفوفة بكتابة scp rsem-توليد-مصفوفة البيانات-rsem-توليد-TPM-مصفوفة. استخدام نانو لتحرير الملف الجديد وتغيير "بلدي $offsite = 4" من 4 إلى 5 لTPM ، فإنه ينبغي أن تقرأ الآن "بلدي $offsite = 5".
  3. انتقل إلى الدليل حيث ملفات الإخراج RSEM .genes.results هي والآن استخدام rsem-generate-TPM-matrix *[genes/isoforms.results] > $OUTPUT لإنشاء مصفوفة TPM. نقل النتائج إلى كمبيوتر محلي.
  4. تصور النتائج في ggplot2.
    1. تحميل R v. 4.0.0 و RStudio v. 1.2.1335 إلى كمبيوتر محلي.
    2. افتح RStudio على يمين الشاشة انتقل إلى علامة التبويب الحزم وانقر فوق تثبيت. اكتب ggplot2 وانقر فوق تثبيت.
    3. على إطار البرنامج النصي R قراءة في الجدول TPM بكتابة البيانات<-read.table("$tpm.txt"، رأس = T)
    4. بالنسبة للرسوم البيانية الشريطية المشابهة للرسم البياني الشكل 4 اكتب شيئا مشابها لما يلي: p<-ggplot() + geom_bar(aes (y=TPM، x=Symbol، fill=Tissue)، البيانات=البيانات، stat="identity")
      تعبئة<-c("#d7191c"،"#fdae61"، "#ffffbf"، "#abd9e9"، "#2c7bb6")
      p<-p+scale_fill_manual(القيم=التعبئة)
      p + السمة (axis.text.x = element_text(الزاوية = 90))

النتائج

تم تلخيص الطرق المذكورة أعلاه في الشكل 1 وتم تطبيقها على مجموعة بيانات من أنسجة هيدرا فولغاريس. H. vulgaris هو اللافقاريات المياه العذبة التي تنتمي إلى Cnidaria فيلوم الذي يشمل أيضا الشعاب المرجانية، قناديل البحر، شقائق النعمان البحر. H. vulgaris يمكن أن تتكاثر لا جن?...

Discussion

الغرض من هذا البروتوكول هو تقديم مخطط تفصيلي للخطوات اللازمة لوصف عائلة الجينات باستخدام بيانات الحمض النووي الريبي-seq. وقد ثبت أن هذه الأساليب تعمل لمجموعة متنوعة من الأنواع ومجموعات البيانات4و34و35. وقد تم تبسيط خط الأنابيب الذي أنشئ هنا...

Disclosures

وليس لدى صاحبي البلاغ ما يكشفان عنه.

Acknowledgements

نشكر أدريانا بريسكو وجيل سميث ورابي مراد وألين ج. رانجيل على المشورة والتوجيه في دمج بعض هذه الخطوات في سير العمل لدينا. كما أننا ممتنون لكاثرين ويليامز، وإليزابيث ريبواه، وناتاشا بيتشياني على تعليقاتهم على المخطوطة. وقد دعم هذا العمل جزئيا من قبل مؤسسة جورج هيويت لزمالة البحوث الطبية إلى A.M.M.

Materials

NameCompanyCatalog NumberComments
Bioanalyzer-DNA kitAgilent5067-4626wet lab materials
Bioanalyzer-RNA kitAgilent5067-1513wet lab materials
BLAST+ v. 2.8.1On computer cluster*
https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/
Blast2GO (on your PC)On local computer
https://www.blast2go.com/b2g-register-basic
boost v. 1.57.0On computer cluster
Bowtie v. 1.0.0On computer cluster
https://sourceforge.net/projects/bowtie-bio/files/bowtie/1.3.0/
Computing cluster (highly recommended)NOTE: Analyses of genomic data are best done on a high-performance computing cluster because files are very large.
Cufflinks v. 2.2.1On computer cluster
edgeR v. 3.26.8 (in R)In Rstudio
https://bioconductor.org/packages/release/bioc/html/edgeR.html
gcc v. 6.4.0On computer cluster
Java v. 11.0.2On computer cluster
MEGA7 (on your PC)On local computer
https://www.megasoftware.net
MEGAX v. 0.1On local computer
https://www.megasoftware.net
NucleoSpin RNA II kitMacherey-Nagel740955.5wet lab materials
perl 5.30.3On computer cluster
pythonOn computer cluster
Qubit 2.0 FluorometerThermoFisherQ32866wet lab materials
R v.4.0.0On computer cluster
https://cran.r-project.org/src/base/R-4/
RNAlaterThermoFisherAM7021wet lab materials
RNeasy kitQiagen74104wet lab materials
RSEM v. 1.3.0Computer software
https://deweylab.github.io/RSEM/
RStudio v. 1.2.1335On local computer
https://rstudio.com/products/rstudio/download/#download
Samtools v. 1.3Computer software
SRA Toolkit v. 2.8.1On computer cluster
https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit
STAR v. 2.6.0cOn computer cluster
https://github.com/alexdobin/STAR
StringTie v. 1.3.4dOn computer cluster
https://ccb.jhu.edu/software/stringtie/
Transdecoder v. 5.5.0On computer cluster
https://github.com/TransDecoder/TransDecoder/releases
Trimmomatic v. 0.35On computer cluster
http://www.usadellab.org/cms/?page=trimmomatic
Trinity v.2.8.5On computer cluster
https://github.com/trinityrnaseq/trinityrnaseq/releases
TRIzolThermoFisher15596018wet lab materials
TruSeq RNA Library Prep Kit v2IlluminaRS-122-2001wet lab materials
TURBO DNA-free KitThermoFisherAM1907wet lab materials
*Downloads and installation on the computer cluster may require root access. Contact your network administrator.

References

  1. Lespinet, O., Wolf, Y. I., Koonin, E. V., Aravind, L. The role of lineage-specific gene family expansion in the evolution of eukaryotes. Genome Research. 12 (7), 1048-1059 (2002).
  2. Gabaldón, T., Koonin, E. V. Functional and evolutionary implications of gene orthology. Nature Reviews Genetics. 14 (5), 360-366 (2013).
  3. Dolinski, K., Botstein, D. Orthology and Functional Conservation in Eukaryotes. Annual Review of Genetics. 41 (1), (2007).
  4. Macias-Muñoz, A., McCulloch, K. J., Briscoe, A. D. Copy number variation and expression analysis reveals a non-orthologous pinta gene family member involved in butterfly vision. Genome Biology and Evolution. 9 (12), 3398-3412 (2017).
  5. Cannon, S. B., Mitra, A., Baumgarten, A., Young, N. D., May, G. The roles of segmental and tandem gene duplication in the evolution of large gene families in Arabidopsis thaliana. BMC plant biology. 4, 10 (2004).
  6. Eastman, S. D., Chen, T. H. P., Falk, M. M., Mendelson, T. C., Iovine, M. K. Phylogenetic analysis of three complete gap junction gene families reveals lineage-specific duplications and highly supported gene classes. Genomics. 87 (2), 265-274 (2006).
  7. Macias-Munõz, A., Murad, R., Mortazavi, A. Molecular evolution and expression of opsin genes in Hydra vulgaris. BMC Genomics. 20 (1), 1-19 (2019).
  8. Hisatomi, O., Tokunaga, F. Molecular evolution of proteins involved in vertebrate phototransduction. Comparative Biochemistry and Physiology - B Biochemistry and Molecular Biology. 133 (4), 509-522 (2002).
  9. Arendt, D. Evolution of eyes and photoreceptor cell types. International Journal of Developmental Biology. 47, 563-571 (2003).
  10. Shichida, Y., Matsuyama, T. Evolution of opsins and phototransduction. Philosophical Transactions of the Royal Society B: Biological Sciences. 364 (1531), 2881-2895 (2009).
  11. Porter, M. L., et al. Shedding new light on opsin evolution. Proceedings of the Royal Society B: Biological Sciences. 279 (1726), 3-14 (2012).
  12. Plachetzki, D. C., Degnan, B. M., Oakley, T. H. The origins of novel protein interactions during animal opsin evolution. PLoS ONE. 2 (10), 1054 (2007).
  13. Ramirez, M. D., et al. The last common ancestor of most bilaterian animals possessed at least nine opsins. Genome Biology and Evolution. 8 (12), 3640-3652 (2016).
  14. Schnitzler, C. E., et al. Genomic organization, evolution, and expression of photoprotein and opsin genes in Mnemiopsis leidyi: a new view of ctenophore photocytes. BMC Biology. 10, 107 (2012).
  15. Pedersen, K. B., Williams, A., Watt, J., Ronis, M. J. Improved method for isolating high-quality RNA from mouse bone with RNAlater at room temperature. Bone Reports. 11, 100211 (2019).
  16. Ridgeway, J. A., Timm, A. E., Fallon, A. Comparison of RNA isolation methods from insect larvae. Journal of Insect Science. 14 (1), 4-8 (2014).
  17. Scholes, A. N., Lewis, J. A. Comparison of RNA isolation methods on RNA-Seq: Implications for differential expression and meta-Analyses. BMC Genomics. 21 (1), 1-9 (2020).
  18. Briscoe, A. D., et al. Female behaviour drives expression and evolution of gustatory receptors in butterflies. PLoS genetics. 9 (7), 1003620 (2013).
  19. Murad, R., Macias-Muñoz, A., Wong, A., Ma, X., Mortazavi, A. Integrative analysis of Hydra head regeneration reveals activation of distal enhancer-like elements. bioRxiv. , 544049 (2019).
  20. Gallego Romero, I., Pai, A. A., Tung, J., Gilad, Y. Impact of RNA degradation on measurements of gene expression. BMC Biology. 12, 42 (2014).
  21. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  22. Trinity. . RNA-Seq De novo Assembly Using Trinity. , 1-7 (2014).
  23. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29, 15-21 (2013).
  24. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC bioinformatics. 12, 323 (2011).
  25. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome biology. 10, 25 (2009).
  26. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10, 421 (2009).
  27. Conesa, A., Götz, S. Blast2GO: A comprehensive suite for functional analysis in plant genomics. International Journal of Plant Genomics. 619832, (2008).
  28. Conesa, A., et al. Blast2GO: A universal tool for annotation, visualization and analysis in functional genomics research. Bioinformatics. 21 (18), 3674-3676 (2005).
  29. Götz, S., et al. High-throughput functional annotation and data mining with the Blast2GO suite. Nucleic Acids Research. 36 (10), 3420-3435 (2008).
  30. Kumar, S., Stecher, G., Tamura, K. MEGA7: Molecular Evolutionary Genetics Analysis version 7.0 for bigger datasets. Molecular biology and evolution. 33 (7), 1870-1874 (2016).
  31. Edgar, R. C. MUSCLE: Multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  32. Taddei-Ferretti, C., Musio, C., Santillo, S., Cotugno, A. The photobiology of Hydra's periodic activity. Hydrobiologia. 530, 129-134 (2004).
  33. Chapman, J. A., et al. The dynamic genome of Hydra. Nature. 464 (7288), 592-596 (2010).
  34. Macias-Muñoz, A., Rangel Olguin, A. G., Briscoe, A. D. Evolution of phototransduction genes in Lepidoptera. Genome Biology and Evolution. 11 (8), 2107-2124 (2019).
  35. Macias-Munõz, A., Murad, R., Mortazavi, A. Molecular evolution and expression of opsin genes in Hydra vulgaris. BMC Genomics. 20 (1), (2019).
  36. Picelli, S., et al. Full-length RNA-seq from single cells using Smart-seq2. Nature Protocols. 9 (1), 171-181 (2014).
  37. Tavares, L., Alves, P. M., Ferreira, R. B., Santos, C. N. Comparison of different methods for DNA-free RNA isolation from SK-N-MC neuroblastoma. BMC research notes. 4, 3 (2011).
  38. Johnson, M. T. J., et al. Evaluating Methods for Isolating Total RNA and Predicting the Success of Sequencing Phylogenetically Diverse Plant Transcriptomes. PLoS ONE. 7 (11), (2012).
  39. Zhao, S., Zhang, Y., Gamini, R., Zhang, B., Von Schack, D. Evaluation of two main RNA-seq approaches for gene quantification in clinical RNA sequencing: PolyA+ selection versus rRNA depletion. Scientific Reports. 8 (1), 1-12 (2018).
  40. Zhao, S., et al. Comparison of stranded and non-stranded RNA-seq transcriptome profiling and investigation of gene overlap. BMC Genomics. 16 (1), 1-14 (2015).
  41. Corley, S. M., MacKenzie, K. L., Beverdam, A., Roddam, L. F., Wilkins, M. R. Differentially expressed genes from RNA-Seq and functional enrichment results are affected by the choice of single-end versus paired-end reads and stranded versus non-stranded protocols. BMC Genomics. 18 (1), 1-13 (2017).
  42. Haas, B. J., et al. De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis. Nature Protocols. 8 (8), 1494-1512 (2013).
  43. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature biotechnology. 33 (3), 290-295 (2015).
  44. Bray, N. L., Pimentel, H., Melsted, P., Pachter, L. Near-optimal probabilistic RNA-seq quantification. Nature Biotechnology. 34 (5), 525-527 (2016).
  45. Patro, R., Duggal, G., Love, M. I., Irizarry, R. A., Kingsford, C. Salmon provides fast and bias-aware quantification of transcript expression. Nature Methods. 14 (4), 417-419 (2017).
  46. Araujo, F. A., Barh, D., Silva, A., Guimarães, L., Thiago, R. . OPEN GO FEAT a rapid web-based functional annotation tool for genomic and transcriptomic data. , 8-11 (2018).
  47. Huerta-Cepas, J., et al. Fast genome-wide functional annotation through orthology assignment by eggNOG-mapper. Molecular Biology and Evolution. 34 (8), 2115-2122 (2017).
  48. Huerta-Cepas, J., et al. EggNOG 5.0: A hierarchical, functionally and phylogenetically annotated orthology resource based on 5090 organisms and 2502 viruses. Nucleic Acids Research. 47, 309-314 (2019).
  49. Törönen, P., Medlar, A., Holm, L. PANNZER2: A rapid functional annotation web server. Nucleic Acids Research. 46, 84-88 (2018).
  50. Robinson, M., Mccarthy, D., Chen, Y., Smyth, G. K. . edgeR differential expression analysis of digital gene expression data User's Guide. , (2013).
  51. Huang, D. W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  52. Huang, D. W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: Paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  53. Letunic, I., Bork, P. Interactive tree of life (iTOL) v3: an online tool for the display and annotation of phylogenetic and other trees. Nucleic acids research. 44, 242-245 (2016).

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Explore More Articles

171 BLAST MEGA

This article has been published

Video Coming Soon

JoVE Logo

Privacy

Terms of Use

Policies

Research

Education

ABOUT JoVE

Copyright © 2025 MyJoVE Corporation. All rights reserved