A subscription to JoVE is required to view this content. Sign in or start your free trial.
Method Article
يوفر البروتوكول الموضح هنا تعليمات مفصلة حول كيفية تحليل المناطق الجينومية ذات الأهمية لإمكانات ترميز البروتين الدقيق باستخدام PhyloCSF على متصفح UCSC Genome سهل الاستخدام. بالإضافة إلى ذلك ، يوصى بالعديد من الأدوات والموارد لمواصلة التحقيق في خصائص تسلسل البروتينات الدقيقة المحددة لاكتساب نظرة ثاقبة على وظائفها المفترضة.
دفع الجيل التالي من التسلسل (NGS) مجال علم الجينوم إلى الأمام وأنتج تسلسلات جينوم كاملة للعديد من الأنواع الحيوانية والكائنات الحية النموذجية. ومع ذلك ، على الرغم من هذه الثروة من معلومات التسلسل ، فقد أثبتت جهود التعليق التوضيحي الشامل للجينات أنها تمثل تحديا ، خاصة بالنسبة للبروتينات الصغيرة. والجدير بالذكر أن طرق التعليق التوضيحي التقليدية للبروتين تم تصميمها لاستبعاد البروتينات المفترضة المشفرة بواسطة إطارات قراءة مفتوحة قصيرة (sORFs) يقل طولها عن 300 نيوكليوتيدات لتصفية العدد الأكبر أضعافا مضاعفة من sORFs الزائفة غير المشفرة في جميع أنحاء الجينوم. ونتيجة لذلك ، تم تصنيف مئات البروتينات الصغيرة الوظيفية التي تسمى البروتينات الدقيقة (<100 حمض أميني في الطول) بشكل غير صحيح على أنها الحمض النووي الريبي غير المشفر أو تم تجاهلها تماما.
نقدم هنا بروتوكولا مفصلا للاستفادة من أدوات المعلوماتية الحيوية المجانية والمتاحة للجمهور للاستعلام عن المناطق الجينومية لإمكانات ترميز البروتين الدقيق بناء على الحفظ التطوري. على وجه التحديد ، نقدم إرشادات خطوة بخطوة حول كيفية فحص إمكانات حفظ التسلسل والترميز باستخدام ترددات استبدال الكودون الوراثي (PhyloCSF) على متصفح الجينوم بجامعة كاليفورنيا سانتا كروز (UCSC) سهل الاستخدام. بالإضافة إلى ذلك ، نقوم بتفصيل الخطوات اللازمة لتوليد محاذاة أنواع متعددة بكفاءة من تسلسلات البروتين الدقيق المحددة لتصور الحفاظ على تسلسل الأحماض الأمينية والتوصية بالموارد اللازمة لتحليل خصائص البروتين الدقيق ، بما في ذلك هياكل المجال المتوقعة. يمكن استخدام هذه الأدوات القوية للمساعدة في تحديد تسلسلات ترميز البروتين الدقيق المفترضة في المناطق الجينومية غير القانونية أو لاستبعاد وجود تسلسل ترميز محفوظ مع إمكانات انتقالية في نسخة غير مشفرة ذات أهمية.
كان تحديد المجموعة الكاملة من عناصر الترميز في الجينوم هدفا رئيسيا منذ بدء مشروع الجينوم البشري ، ولا يزال هدفا مركزيا نحو فهم النظم البيولوجية ومسببات الأمراض القائمة على الوراثة1،2،3،4. أدى التقدم في تقنيات NGS إلى إنتاج تسلسلات جينوم كاملة لعدد كبير من الكائنات الحية ، بما في ذلك الفقاريات واللافقاريات والخميرة والنباتات5. بالإضافة إلى ذلك ، كشفت طرق التسلسل النسخي عالية الإنتاجية عن تعقيد النسخ الخلوي ، وحددت الآلاف من جزيئات الحمض النووي الريبي الجديدة مع كل من وظائف ترميز البروتين وغير المشفرة 6,7. يعد فك تشفير هذا الكم الهائل من معلومات التسلسل عملية مستمرة ، ولا تزال هناك تحديات مع جهود التعليق التوضيحي الجيني الشاملة8.
وقد قدم التطور الأخير لأساليب التنميط الانتقالي، بما في ذلك التنميط الريبوسومي9,10 وتسلسل الريبوسوم المتعدد 11، أدلة تشير إلى أن المئات من أحداث الترجمة غير القانونية ترسم خريطة ل sORFs غير المشروحة حاليا في جميع أنحاء الجينوم، مع إمكانية توليد بروتينات صغيرة تسمى البروتينات الدقيقة أو الببتيدات الدقيقة12,13,14,15,16، 17. ظهرت البروتينات الدقيقة كفئة جديدة من البروتينات متعددة الاستخدامات التي تم تجاهلها سابقا بطرق التعليق التوضيحي الجيني القياسية بسبب صغر حجمها (<100 حمض أميني) وعدم وجود خصائص جينية كلاسيكية مشفرة للبروتين8،12،18،19،20. تم وصف البروتينات الدقيقة في جميع الكائنات الحية تقريبا ، بما في ذلك الخميرة 21،22 ، والذباب 17،23،24 ، والثدييات25،26،27،28 ، وقد ثبت أنها تلعب أدوارا حاسمة في عمليات متنوعة ، بما في ذلك التنمية والتمثيل الغذائي وإشارات الإجهاد19،20،29 ، 30,31,32,33,34. وبالتالي ، من الضروري الاستمرار في تعدين الجينوم لأعضاء إضافيين من هذه الفئة التي تم تجاهلها منذ فترة طويلة من البروتينات الصغيرة الوظيفية.
وعلى الرغم من الاعتراف الواسع النطاق بالأهمية البيولوجية للبروتينات الدقيقة، لا تزال هذه الفئة من الجينات ممثلة تمثيلا ناقصا إلى حد كبير في شروح الجينوم، ولا يزال تحديدها الدقيق يمثل تحديا مستمرا أعاق التقدم في هذا المجال. تم مؤخرا تطوير العديد من الأدوات الحسابية والأساليب التجريبية للتغلب على الصعوبات المرتبطة بتحديد تسلسلات ترميز البروتين الدقيق (نوقشت على نطاق واسع في العديد من المراجعات الشاملة8،35،36،37). اعتمدت العديد من دراسات تحديد البروتين الدقيق الحديثة 38,39,40,41,42,43,44,45,46,47 بشكل كبير على استخدام خوارزمية واحدة تسمى PhyloCSF 48,49 ، وهو نهج قوي في علم الجينوم المقارن يمكن الاستفادة منه للتمييز بين مناطق ترميز البروتين المحفوظة في الجينوم وتلك التي لا ترميزها.
يقارن PhyloCSF ترددات استبدال الكودون (CSF) باستخدام محاذاة النيوكليوتيدات متعددة الأنواع والنماذج الجينية للكشف عن البصمات التطورية للجينات المشفرة للبروتين. يعتمد هذا النهج التجريبي القائم على النموذج على فرضية أن البروتينات محفوظة في المقام الأول على مستوى الأحماض الأمينية بدلا من تسلسل النيوكليوتيدات. لذلك ، يتم تسجيل بدائل الكودون المترادفة ، التي تشفر نفس الحمض الأميني ، أو بدائل الكودون للأحماض الأمينية ذات الخصائص المحفوظة (أي الشحنة ، كره الماء ، القطبية) بشكل إيجابي ، في حين أن البدائل غير المترادفة ، بما في ذلك البدائل الخاطئة والهراء ، تسجل بشكل سلبي. تم تدريب PhyloCSF على بيانات الجينوم الكامل وأثبت فعاليته في تسجيل أجزاء قصيرة من تسلسل الترميز (CDS) بمعزل عن التسلسل الكامل ، وهو أمر ضروري عند تحليل البروتينات الدقيقة أو الإكسونات الفردية لجينات ترميز البروتين القياسية48,49.
ومن الجدير بالذكر أن التكامل الأخير لمحاور المسار PhyloCSF في متصفح الجينوم 49,50,51 بجامعة كاليفورنيا سانتا كروز (UCSC) يمكن الباحثين من جميع الخلفيات من الوصول بسهولة إلى واجهة سهلة الاستخدام للاستعلام عن المناطق الجينومية ذات الأهمية لإمكانات ترميز البروتين. يوفر البروتوكول الموضح أدناه تعليمات مفصلة حول كيفية تحميل محاور تتبع PhyloCSF على متصفح UCSC Genome Browser ومن ثم استجواب المناطق الجينومية ذات الأهمية للتحقيق في مناطق ترميز البروتين عالية الثقة (أو عدم وجودها). بالإضافة إلى ذلك ، في حالة ملاحظة درجة PhyloCSF إيجابية ، يتم تحديد الخطوات لمواصلة تحليل إمكانات ترميز البروتين الدقيق وتوليد محاذاة أنواع متعددة بكفاءة من تسلسل الأحماض الأمينية المحددة لتوضيح الحفاظ على تسلسل الأنواع المتقاطعة. وأخيرا، يتم إدخال العديد من الموارد والأدوات الإضافية المتاحة للجمهور في المناقشة لمسح خصائص البروتين الدقيق المحددة، بما في ذلك هياكل المجال المتوقعة والنظرة الثاقبة لوظيفة البروتين الدقيق المفترضة.
يوضح البروتوكول الموضح أدناه تفاصيل خطوات تحميل مسارات متصفح PhyloCSF والتنقل فيها على متصفح UCSC Genome Browser (الذي تم إنشاؤه بواسطة Mudge et al.49). للأسئلة العامة المتعلقة بمتصفح UCSC Genome ، يمكن العثور على دليل مستخدم متصفح الجينوم الشامل هنا: https://genome.ucsc.edu/goldenPath/help/hgTracksHelp.html.
1. تحميل مركز تتبع PhyloCSF إلى متصفح الجينوم UCSC
2. الانتقال إلى الجينات ذات الأهمية باستخدام معرفات الجينات
3. الانتقال إلى المناطق الجينومية ذات الأهمية باستخدام معلومات التسلسل
4. تحديد sORFs المحفوظة باستخدام بيانات تتبع PhyloCSF
5. عرض المناطق المتجانسة في الجينومات الأخرى
6. توليد محاذاة تسلسل متعددة الأنواع للبروتينات الدقيقة ذات الأهمية
هنا سنستخدم ميتوريغولين البروتين الدقيق الذي تم التحقق منه (Mtln) كمثال لتوضيح كيف سيولد sORF المحفوظ درجة PhyloCSF إيجابية يمكن تصورها وتحليلها بسهولة على متصفح UCSC Genome. تم شرح الميتوريجولين سابقا على أنه حمض نووي ريبي غير مشفر (معرف الجين البشري سابقا LINC00116 ومعرف جين الفأر 1500011K16Rik). لعبت...
يوفر البروتوكول المعروض هنا تعليمات مفصلة حول كيفية استجواب المناطق الجينومية ذات الأهمية لإمكانات ترميز البروتين الدقيق باستخدام PhyloCSF على متصفح UCSC Genome Browser 48,49,50,51 سهل الاستخدام. كما هو مفصل أعلاه ، PhyloCSF هي خوارزمية ج?...
ويعلن صاحبا البلاغ أنه ليس لديهما مصالح مالية منافسة.
تم دعم هذا العمل من خلال منح من المعاهد الوطنية للصحة (HL-141630 و HL-160569) ومؤسسة سينسيناتي لأبحاث الأطفال (جائزة الوصي).
Name | Company | Catalog Number | Comments |
Website | Website Address | Requirements | |
Clustal Omega Multiple Sequence Alignment Tool | https://www.ebi.ac.uk/Tools/msa/clustalo/ | Web browser | Multiple sequence alignment program for the efficient alignment of FASTA sequences (i.e. for cross-species comparison of identified microproteins) |
COXPRESSdb | https://coxpresdb.jp | Web browser | Provides co-regulated gene relationships to estimate gene functions |
EMBL-EBI Bioinformatics Tools FAQs | https://www.ebi.ac.uk/seqdb/confluence/display/JDSAT/Bioinformatics+Tools+FAQ | Web browser | Frequently Asked Questions (FAQs) for EMBL-EBI tools. Includes the color coding key for protein sequence alignments |
European Bioinformatics Institute (EMBL-EBI), Tools and Data Resources | https://www.ebi.ac.uk/services/all | Web browser | Comprehensive list of freely available websites, tools and data resources |
Expasy - Swiss Bioinformatics Resource Portal | https://www.expasy.org | Web browser | Suite of bioinformatic tools and resources for protein sequence analysis that is maintained by the Swiss Institute of Bioinformatics (SIB) |
National Center for Biotechnology Information (NCBI) Conserved Domain Search | https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi | Web browser | Search tool to identify conserved domains within protein or coding nucleotide sequences |
Pfam 35 | http://pfam.xfam.org | Web browser | Protein family (Pfam) database, provides alignments and classification of protein families and domains |
PhyloCSF Track Hub Description | https://genome.ucsc.edu/cgi-bin/hgTrackUi?hgsid=1267045267_TEc99h2oW5Q edaCd4ir8aZ65ryaD&db=mm10 &c=chr2&g=hub_109801_ PhyloCSF_smooth | Web browser | Detailed description of the Smoothed PhyloCSF tracks and PhyloCSF Track Hub |
SignalP 6.0 | https://services.healthtech.dtu.dk/service.php?SignalP-6.0 | Web browser | Predicts the presence of signal peptides and the location of their cleavage sites |
TMHMM - 2.0 | https://services.healthtech.dtu.dk/service.php?TMHMM-2.0 | Web browser | Prediction of transmembrane helices in proteins |
UCSC Genome Browser BLAT Search | https://genome.ucsc.edu/cgi-bin/hgBlat | Web browser | Tool used to find genomic regions using DNA or protein sequence information |
UCSC Genome Browser Gateway | https://genome.ucsc.edu/cgi-bin/hgGateway | Web browser | Direct link to the UCSC Genome Browser Gateway |
UCSC Genome Browser Home | https://genome.ucsc.edu/ | Web browser | Home website for the UCSC Genome Browser |
UCSC Genome Browser Track Data Hubs | https://genome.ucsc.edu/cgi-bin/hgHubConnect#publicHubs | Web browser | Direct link to Track Data Hubs/Public Hubs database to search for and load the PhyloCSF Tracks |
UCSC Genome Browser User Guide | https://genome.ucsc.edu/goldenPath/help/hgTracksHelp.html | Web browser | Comprehensive user guide detailing how to navigate the UCSC Genome Browser |
WoLF PSORT | https://wolfpsort.hgc.jp | Web browser | Protein subcellular localization prediction tool |
Request permission to reuse the text or figures of this JoVE article
Request PermissionThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. All rights reserved