Method Article
من خلال تشغيل أداة دراسة جمعية المسار (PAST) ، إما من خلال التطبيق اللامع أو من خلال وحدة التحكم R ، يمكن للباحثين اكتساب فهم أعمق للمعنى البيولوجي لنتائج دراسة الارتباط على نطاق الجينوم (GWAS) من خلال التحقيق في المسارات الأيضية المعنية.
في الآونة الأخيرة ، تم تطوير وتنفيذ جديد لطريقة موصوفة سابقا لتفسير بيانات دراسة الارتباط على نطاق الجينوم (GWAS) باستخدام تحليل المسار الأيضي والإفراج عنه. وقد وضعت أداة دراسة رابطة المسارات لمعالجة الشواغل المتعلقة بسهولة الاستخدام والتحليلات البطيئة. وقد تم الافراج عن هذه الأداة الجديدة سهلة الاستخدام على الموصل الحيوي وGithub. في الاختبار، أجرت PAST تحليلات في أقل من ساعة واحدة كانت تتطلب في السابق أربع وعشرين ساعة أو أكثر. في هذه المقالة، نقدم البروتوكول لاستخدام التطبيق Shiny أو وحدة التحكم R لتشغيل الماضي.
دراسات الارتباط على نطاق الجينوم (GWAS) هي طريقة شائعة لدراسة الصفات المعقدة والمناطق الجينومية المرتبطة بها1و2و3. في هذا النوع من الدراسة، يتم اختبار مئات الآلاف من علامات تعدد الأشكال النيوكليوتيدات واحدة (SNP) لارتباطها مع سمة، ويتم تقييم أهمية الجمعيات. يتم الاحتفاظ بارتباطات العلامات التي تفي بخطة معدل الاكتشاف الزائف (أو نوع آخر من عتبة الأهمية) للدراسة ، ولكن قد يتم تصفية الاقترانات الحقيقية. بالنسبة للسمات المعقدة المتعددة الجينات ، قد يكون تأثير كل جين صغيرا (وبالتالي يتم تصفيته) ، ويتم التعبير عن بعض الأليل فقط في ظروف محددة قد لا تكون موجودة فيالدراسة 3. وهكذا، في حين أنه قد يتم الاحتفاظ بالعديد من الشركات غير المناقلة على أنها مرتبطة بالسمة، فإن كل منها قد يكون له تأثير صغير جدا. وسوف يكون هناك الكثير من المكالمات SNP في عداد المفقودين، وتفسير المعنى البيولوجي والهندسة الوراثية للسمة قد تكون غير مكتملة ومربكة. تحليل المسار الأيضي يمكن أن يساعد على معالجة بعض هذه القضايا من خلال التركيز على الآثار المشتركة للجينات مجمعة وفقا لوظيفتها البيولوجية4،5،6.
تم الانتهاء من العديد من الدراسات باستخدام تطبيق سابق للطريقة الموصوفة في هذه المقالة. Aflatoxin تراكم7، الذرة earworm المقاومة8، والنفط biosynthesis9 ودرست جميع مع التنفيذ السابق. وفي حين كانت هذه التحليلات ناجحة، إلا أن عملية التحليل كانت معقدة وتستغرق وقتا طويلا ومرهقة، لأن أدوات التحليل كتبت في مزيج من R و Perl و Bash، ولم يكن خط الأنابيب آليا. وبسبب المعرفة المتخصصة المطلوبة لتعديل هذه الطريقة لكل تحليل، تم الآن تطوير طريقة جديدة يمكن مشاركتها مع باحثين آخرين.
وقد صممت أداة دراسة رابطة المسارات (PAST)10 لمعالجة أوجه القصور في الطريقة السابقة من خلال اشتراط معرفة أقل بلغات البرمجة وإجراء التحليلات في فترة أقصر. في حين تم اختبار هذه الطريقة مع الذرة، لا تقدم PAST أي افتراضات خاصة بالأنواع. يمكن تشغيل PAST من خلال وحدة التحكم R ، كطبيق لامع ، ومن المتوقع أن يتوفر إصدار عبر الإنترنت قريبا على MaizeGDB.
1. الإعداد
2. تخصيص تحليل لامعة (اختياري)
الشكل 1. الرجاء الضغط هنا لعرض نسخة أكبر من هذا الرقم.
3. تحميل بيانات GWAS
ملاحظة: تحقق من أن يتم تحديد علامة التبويب بيانات GWAS. تأكد من أن ملف الاقتران يحتوي على الأعمدة التالية: سمة، اسم علامة، الموضع أو الكروموسوم، الموقف على الكروموسوم، قيمة p، و R2 قيمة لعلامة. تأكد من أن ملف التأثيرات يحتوي على الأعمدة التالية: سمة، اسم علامة، مكان أو كروموسوم، موقف على الكروموسوم، وتأثير. ترتيب هذه الأعمدة غير مهم، حيث يمكن للمستخدم تحديد أسماء الأعمدة عند تحميل البيانات. يتم تجاهل أي أعمدة إضافية. يمكن استخدام TASSEL13 لإنتاج هذه الملفات.
الشكل 2. الرجاء الضغط هنا لعرض نسخة أكبر من هذا الرقم.
4. بيانات اختلال موازنة الربط التحميل (LD)
ملاحظة: تحقق من أن بيانات عدم التوازن (LD) الارتباط هو علامة التبويب محدد ويحتوي على الأنواع التالية من البيانات: الموضع، Position1، Site1 Position2، Site2، المسافة في أزواج أساسية بين Position1 و Position2، وقيمة R2.
الشكل 3. الرجاء الضغط هنا لعرض نسخة أكبر من هذا الرقم.
5. تعيين SNPs للجينات
ملاحظة: تحميل أو تحديد موقع التعليقات التوضيحية في تنسيق GFF. ويمكن العثور على هذه الشروح في كثير من الأحيان في قواعد البيانات على الانترنت لكائنات محددة. كن حذرا بشأن التعليقات التوضيحية منخفضة الجودة ، حيث ستؤثر جودة بيانات التعليقات التوضيحية على جودة تحليل المسار. تأكد من أن العمود الأول من هذه التعليقات التوضيحية (الكروموسوم) يطابق شكل الموضع / الكروموسوم في الارتباط والآثار وبيانات LD. على سبيل المثال، يجب أن لا تسمى التعليقات التوضيحية الكروموسوم الأول "chr1" إذا كانت ملفات بيانات GWAS و LD تسمي الكروموسوم الأول "1".
الشكل 4. الرجاء الضغط هنا لعرض نسخة أكبر من هذا الرقم.
6. اكتشاف مسارات هامة
ملاحظة: تحقق من أن ملف المسارات يحتوي على البيانات التالية في تنسيق محدد علامة التبويب مع سطر واحد لكل جين في كل مسار: معرف المسار - معرف مثل "PWY-6475-1"; وصف المسار - وصف أطول لما تفعله المسارات مثل "التمثيل الحيوي عبر الليكوبين"؛ جين - جين في المسار، والتي ينبغي أن تتطابق مع الأسماء الواردة في الشروح. يمكن العثور على معلومات المسار على الأرجح في قواعد البيانات عبر الإنترنت لكائنات حية محددة، مثل MaizeGDB. الخيار الثاني المحدد من قبل المستخدم هو الوضع. تشير "الزيادة" إلى الأنماط الظاهرية التي تعكس عندما تكون القيمة المتزايدة للسمة المقاسة مرغوبة ، مثل العائد ، في حين يشير "التناقص" إلى سمة يكون فيها انخفاض القيم المقاسة مفيدا ، مثل تقييمات تلف الحشرات. يتم اختبار أهمية المسارات باستخدام الطرق الموصوفة سابقا4و6و14.
الشكل 5. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.
ملاحظة: يتم استخدام عدد النوى ووضع تعيين في بداية التحليل PAST Shiny (الخطوة 2.2) في هذه الخطوة. يتم تعيين العدد الافتراضي للجينات حاليا في 5 جينات، لذلك سيتم إزالة المسارات مع عدد أقل من الجينات المعروفة. يمكن للمستخدم خفض هذه القيمة إلى 4 أو 3 ، لتشمل مسارات أقصر ، ولكن القيام بذلك سيخاطر بنتائج إيجابية خاطئة. زيادة هذه القيمة يمكن أن تزيد من قوة التحليل ولكن سوف يزيل المزيد من المسارات من التحليل. تغيير عدد التباديل المستخدمة يزيد ويقلل من قوة الاختبار.
7. عرض Rugplots
الشكل 6. الرجاء الضغط هنا لعرض نسخة أكبر من هذا الرقم.
الشكل 7. الرجاء الضغط هنا لعرض نسخة أكبر من هذا الرقم.
إذا لم يتم إنتاج النتائج بعد تشغيل أداة البرامج PAST تحقق للتأكد من أن كافة ملفات الإدخال منسقة بشكل صحيح. يظهر في الشكل 8تشغيل ناجح باستخدام بيانات المثال في حزمة PAST، والتي تستند إلى GWAS الذرة من لون الحبوب. يمكن تنزيل هذا الجدول والصورة الناتجة باستخدام الزر تنزيل النتائج. يظهر مثال للصورة التي تم تنزيلها في الشكل 210. قد تؤدي الإعدادات غير الصحيحة إلى نتائج لا معنى لها بيولوجيا ، ولكن تحديد عدم الصحة يجب أن يكون متروكا للباحث ، الذي يجب أن يتحقق مرتين من صحة الإعدادات المختارة والنظر في جميع الأدلة المعروفة المتعلقة بسمة الاهتمام.
ويبين الشكل 910 السجادة الناتجة عن تحليل المسار لنتائج ال GWAS التي تم إنشاؤها باستخدام لوحة ذرة مكونة من 288 خطا أصيلا تم كتابتها بشكل الظاهري للون الحبوب. هذا المثال التبسيطي، حيث كانت الأنماط الظاهرية إما "بيضاء" أو "صفراء"، تم استخدامه لأن المسار المسؤول عن إنشاء أصباغ الكاروتينويد الصفراء الزاهية معروف ويجب أن يكون مسؤولا عن معظم النمط الظاهري. وهكذا، كنا نتوقع أن نرى مسار التمثيل الحيوي عبر الليكوبين (التي تنتج الكاروتينات) أن تكون مرتبطة بشكل كبير مع لون الحبوب، وهو عليه. يتم سرد معرف المسار والاسم في أعلى الرسم البياني. يصنف المحور الأفقي للرسم البياني جميع الجينات التي تم تضمينها في التحليل ، مرتبة من اليسار إلى اليمين من أجل التأثير الأكبر على السمة إلى الأصغر. ومع ذلك ، يتم وضع علامة فقط على الجينات في مسار التمثيل الحيوي عبر الليكوبين (في الجزء العلوي من الرسم البياني ، كعلامات فقس ، تظهر في رتبة الجينات لتأثيرها مقارنة بجميع الجينات الأخرى في التحليل). هناك 7 جينات في هذا المسار. يتم رسم درجة الإثراء قيد التشغيل (ES) على طول المحور الرأسي. يتم إضافة ES لكل جين في المجموع الجاري حسب التأثير ويتم تعديل المجموع إلى عدد الجينات التي تم تحليلها. وهكذا، تتغير النتيجة مع تحرك المرء مباشرة على طول المحور الأفقي ويميل إلى الزيادة مع تضمين جينات التأثير الأكبر، ولكن في مرحلة ما، تكون الزيادة في التأثير أصغر من التعديل ستضاف جين آخر، وتبدأ النتيجة بأكملها في الانخفاض. يتم وضع علامة على قمة خط ES قيد التشغيل بخط عمودي منقط؛ هذا هو ES للمسار بأكمله ويستخدم من قبل البرنامج لتحديد ما إذا كان يتم اختيار المسار وتقديمه على أنه سجادة.
الشكل 8: الانتهاء من تشغيل الماضي لامعة. الرجاء انقر هنا لعرض نسخة أكبر من هذا الرقم.
الشكل 9: صورة المسار من تشغيل الانتهاء من الماضي (أو تحميلها من لامعة). وقد استشهد بهذا الرقم من Thrashوآخرون. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.
ويتمثل الهدف الرئيسي من "PAST" في تقديم تحليلات المسار الأيضي لبيانات GWAS إلى جمهور أوسع، وخاصة بالنسبة للكائنات غير البشرية وغير الحيوانية. غالبا ما تكون الطرق البديلة ل PAST هي برامج سطر الأوامر التي تركز على البشر أو الحيوانات. وكان سهولة الاستخدام هدفا أساسيا في تطوير الماضي، سواء في اختيار لتطوير تطبيق لامعة وفي اختيار استخدام R و Bioconduductor للافراج عن التطبيق. المستخدمين لا تحتاج إلى معرفة كيفية ترجمة البرامج من أجل استخدام الماضي.
وكما هو الحال مع معظم أنواع برامج التحليل، فإن نتائج برنامج PAST لا تكون جيدة إلا بقدر ما تكون بيانات الإدخال؛ إذا كان لدى بيانات الإدخال أخطاء أو تنسيقها بشكل غير صحيح، سوف تفشل PAST في تشغيل أو إنتاج نتائج غير مفيدة. التأكد من أن يتم تنسيق البيانات GWAS والبيانات LD والتعليقات التوضيحية وملفات المسارات بشكل صحيح أمر بالغ الأهمية لتلقي الإخراج الصحيح من الماضي. الماضي يحلل علامات ثنائية allelic فقط ، ويمكن تشغيل سمة واحدة فقط لكل مجموعة من البيانات الإدخال. وبالإضافة إلى ذلك، فإن بيانات GWAS الناتجة عن سوء الكتابة الجينية أو الفينوتيبينج غير الصحيح أو غير الدقيق من غير المرجح أن تسفر عن نتائج واضحة أو قابلة للتكرار أيضا. يمكن أن تساعد PAST في التفسير البيولوجي لنتائج GWAS ولكن من غير المرجح أن توضح مجموعات البيانات الفوضوية إذا لم يتم حساب الاختلاف البيئي أو الخطأ التجريبي أو الهيكل السكاني بشكل صحيح.
يمكن للمستخدمين اختيار تغيير بعض معلمات التحليل، سواء في التطبيق لامعة وتمرير تلك المعلمات إلى وظائف الماضي في وحدة التحكم R. يمكن تغيير هذه المعلمات النتائج التي تم الإبلاغ عنها بواسطة PAST و يجب على المستخدمين توخي الحذر عند تعديل هذه من الإعدادات الافتراضية. لأن LD يتم قياسها بواسطة المستخدمين، عادة باستخدام نفس مجموعة بيانات العلامة التي تم استخدامها أيضا في GWAS، قياسات LD محددة للسكان. وبالنسبة لجميع الدراسات، وخاصة بالنسبة لأنواع أخرى غير الذرة ، (وخاصة التلقيح الذاتي ، أو الأنواع متعددة الأضلاع ، أو غير المتجانسة للغاية) ، قد يكون هناك ما يبرر حدوث تغييرات في حالات التخلف عن السداد.
وليس لدى صاحبي البلاغ ما يكشفان عنه.
اي.
Name | Company | Catalog Number | Comments |
Computer | NA | NA | Any computer with 8GB RAM should be sufficient |
R | R Project | NA | R 4.0 or greater is required to install from Bioconductor 3.11 |
An erratum was issued for: A Pathway Association Study Tool for GWAS Analyses of Metabolic Pathway Information. One of the affiliations was updated.
The second affiliation was updated from:
USDA-ARS Corn Host Plant Resistance Research Unit, Mississippi State University
to:
Corn Host Plant Resistance Research Unit, USDA-ARS
Request permission to reuse the text or figures of this JoVE article
Request PermissionThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. All rights reserved