Method Article
تجميع تسلسل الحمض النووي هو استراتيجية سريعة وفعالة من حيث التكلفة للكشف عن بدائل نادر المرتبطة الظواهر المعقدة في أفواج كبيرة. نحن هنا وصف التحليل الحسابي من تجميع التسلسل من الجيل التالي، من الجينات المتصلة بالسرطان 32 باستخدام حزمة البرامج منشقة. هذه الطريقة هي قابلة للتطوير، والتي تنطبق على أي النمط الظاهري في المصالح.
كما تسلسل الحمض النووي التكنولوجيا قد تقدمت بشكل ملحوظ في السنوات الأخيرة 2، فقد أصبح من الواضح بشكل متزايد أن كمية الاختلاف الجيني بين أي الشخصين أكبر مما كان يعتقد سابقا 3. في المقابل، فشلت مجموعة القائمة على التنميط الجيني لتحديد مساهمة كبيرة من المتغيرات تسلسل المشتركة بين تقلب المظهري من الأمراض الشائعة 4،5. أخذت معا، وقد أدت هذه الملاحظات إلى تطور مرض شائع / نادر فرضية البديل مما يدل على أن الغالبية العظمى من "التوريث المفقودة" في الظواهر الشائعة والمعقدة بدلا من ذلك بسبب الملف الفرد الشخصية من متغيرات الحمض النووي نادرة أو خاصة 6-8 . ومع ذلك، واصفا كيف يؤثر اختلاف نادر الظواهر المعقدة يتطلب تحليل العديد من الأفراد المصابين في مواضع كثيرة الجينومية، وتتم مقارنة مثالي لاستطلاع مماثل في الفوج غير متأثر. على الرغم من قوة التسلسل التي توفرها منصات اليوم، وهيالمرتكزة على السكان من مسح الجينوم مواضع كثيرة، وتحليل لاحق الحسابية المطلوبة لا تزال باهظة بالنسبة للمحققين كثير.
لتلبية هذه الحاجة، قمنا بتطوير نهج التسلسل المجمعة 1،9 ومجموعة من البرامج الجديدة 1 للدقيقة للغاية اكتشاف البديل نادرة من البيانات الناتجة. القدرة على الجينوم تجمع من جميع السكان المتضررين من الأفراد ومسح على درجة من الاختلاف الجيني في العديد من المناطق المستهدفة في مكتبة تسلسل واحد يوفر ممتازة التكلفة والوقت وفورات إلى التقليدية منهجية التسلسل عينة واحدة. مع تغطية تسلسل يعني في أليل من أمثالها-25، خوارزمية عادتنا، تشظ، يستخدم استراتيجية داخلية البديل سيطرة يدعو إلى استدعاء الإدراج والحذف واستبدال ما يصل إلى 4 أزواج قاعدة في طول مع حساسية عالية وخصوصية من برك من يصل إلى 1 متحولة أليل في 500 شخص. نحن هنا وصف طريقة لإعداد الصورة المجمعةequencing مكتبة تليها خطوة بخطوة على تعليمات حول كيفية استخدام حزمة سبلينتر لتحليل تسلسل المجمعة ( http://www.ibridgenetwork.org/wustl/splinter ). نعرض مقارنة بين تسلسل المجمعة من 947 أشخاص، وجميعهم خضعوا أيضا الجينوم على نطاق الصفيف، في أكثر من 20kb من تسلسل للشخص الواحد. وكان التوافق بين التنميط الجيني من المفتاحية ومتغيرات جديدة ودعا في العينة المجمعة ممتازة. ويمكن هذا الأسلوب بسهولة تحجيم تصل إلى أي عدد من مواضع الجينومية وأي عدد من الأفراد. من خلال دمج الضوابط الداخلية amplicon الإيجابية والسلبية في النسب التي تحاكي السكان دون سن الدراسة، يمكن معايرة خوارزمية لتحقيق الأداء الأمثل. ويمكن أيضا أن هذه الاستراتيجية يمكن تعديلها للاستخدام مع القبض على تهجين أو الباركود فرد على حدة، ويمكن تطبيقها على التسلسل من عينات غير متجانسة بشكل طبيعي، مثل الحمض النووي للورم.
وقد استخدم هذا الأسلوب في البحث عنها في وآخرون Vallania FML آل بحوث الجينوم. عام 2010.
1. عينة تجمع وPCR لقطة من الامكنه الجينوم المستهدفة
2. المجمعة تحضير مكتبة PCR وتسلسلها
3. تسلسل القراءات محاذاة وتحليل
4. كشف نادر عن طريق البديل سبلينتر
5. ممثل النتائج
نحن تجميع عدد سكانها من 947 أفراد واستهدفت أكثر من 20 كيلو بايت لتسلسل. طبقنا سبلينتر للكشف عن المتغيرات النادرة بعد بروتوكول لدينا معيار. وقد سبق لكل فرد قد التنميط الجيني التي يؤديها الجينوم على نطاق التنميط الجيني للمجموعة. وكان التوافق بين التنميط الجيني من المفتاحية ومتغيرات جديدة ودعا في العينة المجمعة ممتاز (الشكل 6). تم استدعاء ثلاثة متغيرات، اثنان منها (rs3822343 وrs3776110) كانت نادرة في عدد السكان، من جديد من نتائج التسلسل وتم التصديق عليها من قبل pyrosequencing الفردية. وكانت ترددات الأليل قاصر (MAF) في تجمع مماثل لشركة ماجد الفطيم وذكرت في 129 بناء dbSNP. وكان التوافق بين ماجد الفطيم pyrosequencing والتسلسل المجمعة ممتاز (الجدول 3).
جدول قليل النوكليوتيد الحمض النووي 1. متواليات لمراقبة إيجابية. كل تسلسل يتكون من قطعة الحمض النووي يختلف عن مرجع نوع البرية بواسطة استبدال 2 أو أحد الإدراج والحذف واحد. اضغط هنا لمشاهدتها بشكل اكبر .
الجدول 2. مثال للناتج منشقة. أول صفين تمثل الناتج سبلينتر القياسي لاستبدال أو الحذف (رأس أزرق). في الصف الأخير يمثل الناتج سبلينتر القياسية لإدراج (رأس الأرجواني).rget = "_blank"> اضغط هنا لمشاهدتها بشكل اكبر.
الجدول 3. خمسة معروفة وحددت المتغيرات رواية ثلاثة من عدد كبير من السكان والتصديق عليها من قبل التنميط الجيني للفرد. تم إجراء التحقق من صحة الفردية pyrosequencing (الصفوف 1-3)، TaqMan فحص (الصفوف 4-6) أو سانغر التسلسل (صفوف 7،8). لمجموعة واسعة من الترددات أليل وبما في ذلك خمس وظائف مع شركة ماف <1٪، وكان التوافق بين تجميع التسلسل أليل تقدير وتيرة والتنميط الجيني للفرد قوي. يتم تكييفها المواقف التي تحمل علامة النجمة (*) من بيانات أبلغ عنها سابقا 9.
الشكل 1. مجمع-تسلسل الحمض النووي وتحليل سبلينتر نظرة عامة. يتم تجميع الحمض النووي المريضوتضخمت في مواضع مختارة. ويتم تجميع المنتجات النهائية PCR جنبا إلى جنب مع سيطرة الإيجابية والسلبية في النسب متساوي المولية. والتسلسل ثم المزيج المجمعة ويتم تعيينها من قراءة الناتج العودة إلى مرجع لهم. وتستخدم خرائط سلبي قراءة مراقبة لتوليد نموذج خطأ المدى محددة. ويمكن بعد ذلك سبلينتر أن تستخدم لكشف تعدد الأشكال النادرة وindels من خلال دمج المعلومات من النموذج الخطأ ومراقبة إيجابية. [بتصرف من FLM Vallania وآخرون، بحوث الجينوم 2010] اضغط هنا لمشاهدتها بشكل اكبر .
الشكل 2. amplicon PCR مجمع ربط وصوتنة. كدليل للربط والخطوات تجزئة عشوائية في المكتبة بروتوكول الإعداد، وهضم إنزيمي pUC19 متجه إلى شظايا هو مبين في ممر 2. وكانت هذه الشظايا نورماlized من قبل عدد جزيء، جنبا إلى جنب وligated عشوائيا وفقا لزيادة 1.7 أعلاه. وسيتم عرض concatamers الناجمة كبير في حارة 3. كانت concatamers ligated تساوت وتعرض لصوتنة كما هو موضح في الخطوة 1.8 أعلاه. وتظهر مسحة الناتجة من شظايا من الحمض النووي لكل تكرار التقنية في الممرات 4 و 5. قوس يسلط الضوء على مدى حجم المستخدمة لاستخراج جل وتسلسل إنشاء مكتبة.
الشكل 3. الدقة بوصفها وظيفة من تغطية لأليل واحد في عينة مجمعة. وتشير التقديرات إلى دقة مثل المنطقة تحت المنحنى (AUC) لاستقبال المشغل المنحنى (ROC)، الذي يتراوح بين 0.5 (عشوائي) إلى 1.0 (دقة كاملة). يتم رسم AUC بوصفها وظيفة من تغطية لكل أليل للكشف عن الأليلات الطافرة واحد في برك من الأليلات 200، 500 و 1000 (A). يتم رسم AUC بوصفها وظيفة التغطية الكاملة لعمليات الإدراج، واستبدال دeletions (B). [بتصرف من FLM Vallania وآخرون، بحوث الجينوم 2010].
4 الشكل. مؤامرة خطأ يدل على احتمال دمج قاعدة خاطئ في موقف معين. ملف خطأ يظهر معدلات خطأ منخفضة مع وجود اتجاه متزايد نحو نهاية 3 'للقراءة التسلسل. والجدير بالذكر أن النيوكليوتيدات مرجعية مختلفة عرض الاحتمالات خطأ مختلفة (انظر على سبيل المثال احتمال دمج C يعطى G كمرجع). [بتصرف من FLM Vallania وآخرون، بحوث الجينوم 2010].
الشكل 5. الدقة من التشرذم في تقدير تواتر الأليل للمناصب التي كانت أكبر من تغطية أضعاف نسبة 25 في أليل. استنادا إلى النتائج في لوحة، الشكل (3) تظهر حساسية الأمثل للكشف عن متغير واحد مع تغطية 25 أضعاف ≥، وهومقارنة بين الترددات أليل تجميع الحمض النووي التي تقدرها منشقة عنه والتهم أليل تقاس النتائج GWAS في ارتباط عالية جدا (R = 0.999). [بتصرف من FLM Vallania وآخرون، بحوث الجينوم 2010].
الشكل 6. مقارنة بين الترددات أليل يقاس مقارنة مع تقديرات GWAS منشقة عن التسلسل المجمعة من 974 فردا. كانت هناك 19 وظيفة مشتركة بين مواضع مرمزة والمناطق تسلسل للمقارنة. العلاقة الناتجة عالية جدا (R = 0.99538). انقر هنا لعرض أكبر شخصية .
هناك أدلة متزايدة على أنه يجوز خاضعة للإشراف من حدوث والاستجابة العلاجية من الظواهر، والأمراض الشائعة معقدة مثل السمنة 8، 4 ارتفاع الكولسترول وارتفاع ضغط الدم (7) وغيرها من ملامح الشخصية من اختلاف نادر. ويمكن التعرف على الجينات والممرات حيث مجموع هذه المتغيرات في السكان المتضررين سيكون لها آثار عميقة في التشخيص والعلاج، ولكن تحليل الأفراد المتضررين على حدة أن يكون الوقت والتكلفة الباهظة. سكان التحليل القائم على توفر وسيلة أكثر كفاءة لاستقصاء الاختلاف الجيني في مواضع متعددة.
نقدم رواية تجميع الحمض النووي تسلسل بروتوكول يقترن شظية مجموعة من البرامج المصممة للتعرف على هذا النوع من الاختلاف الجيني عبر السكان. نبين مدى دقة هذه الطريقة في تحديد وقياس الأليلات طفيفة في عدد كبير من السكان المجمعة من 947 شخصا، من بينهم المتغيرات النادرة التي كانتودعا من جديد من التسلسل المجمعة والتصديق عليها من قبل pyrosequencing الفردية. استراتيجيتنا تختلف أساسا عن غيرها من البروتوكولات التي إدماج الإيجابية والسلبية لمراقبة داخل كل تجربة. وهذا يسمح سبلينتر لتحقيق دقة أعلى من ذلك بكثير والطاقة بالمقارنة مع المناهج الأخرى 1. يتم إصلاح التغطية الأمثل لأضعاف نسبة 25 في أليل بصرف النظر عن حجم تجمع، مما يجعل تحليل كميات ضخمة بقدر الإمكان هذا الشرط موازين فقط خطيا مع حجم حوض السباحة. نهجنا مرنة جدا ويمكن تطبيقها على أي النمط الظاهري في المصالح ولكن أيضا لعينات التي هي غير متجانسة بشكل طبيعي، مثل السكان الخلية المختلطة والخزعات ورم. نظرا للاهتمام المتزايد في التسلسل المجمعة من المناطق المستهدفة الكبيرة مثل exome أو الجينوم، الإعدادية لدينا مكتبة والتحليل سبلينتر متوافق مع التقاط-العرف وتسلسل كامل exome، ولكن لم يتم تصميم الأداة المساعدة التوافق في حزمة سبلينتر لل كبيرمراجع متواليات. ولذلك، نحن استخدمت بنجاح اليجنر البرمجة الديناميكية، Novoalign، عن الجينوم على نطاق الاصطفافات تليها البديل استدعاء من العينة المجمعة (راموس وآخرون، المقدمة). وبالتالي، يمكن أن استراتيجيتنا التسلسل المجمعة بنجاح لتوسيع نطاق أكبر مجمعات مع كميات متزايدة من تسلسل الهدف.
الإعلان عن أي تضارب في المصالح.
وأيد هذا العمل من قبل معهد الطفل منحة ديسكفري MC-II-2006-1 (RDM وتيد)، وعلم التخلق المعاهد الوطنية للصحة خارطة الطريق منحة [1R01DA025744-01 و3R01DA025744 02S1-] (RDM وFLMV)، U01AG023746 (SC)، والصائغ مؤسسة (FLMV وتيد)، 1K08CA140720-01A1 وشراب الليمون اليكس الجناح "أ" دعم جائزة (تيد). ونحن نشكر وصول مركز تكنولوجيا الجينوم في قسم علم الوراثة في جامعة واشنطن في كلية الطب للمساعدة في التحليل الجيني. ويدعم بشكل جزئي من قبل مركز سرطان NCI دعم منح مركز # P30 CA91842 لمركز سرطان Siteman وتكنولوجيا المعلومات والاتصالات / CTSA جرانت # UL1RR024992 من NationalCenter لبحوث الموارد (NCRR)، وهو مكون من المعاهد الوطنية للصحة (NIH)، و المعاهد الوطنية للصحة خارطة الطريق للبحوث الطبية. هذا المنشور هو فقط من مسؤولية الكتاب ولا تمثل بالضرورة وجهة النظر الرسمية من NCRR أو المعاهد الوطنية للصحة.
Name | Company | Catalog Number | Comments |
اسم كاشف | شركة | فهرس العدد | مقطع |
PfuUltra عالية الدقة | اجيلنت | 600384 | 1.4 |
البيتين | SIGMA | B2629 | 1.4 |
M13mp18 ssDNA ناقلات | NEB | N4040S | 1.5 |
pGEM-T سهل | Promega | A1360 | 1.5 |
T4 عديد النوكليوتيد كيناز | NEB | M0201S | 2.2 |
T4 يغاز | NEB | M0202S | 2.2 |
البولي ايثيلين جلايكول 8000 ميغاواط | SIGMA | P5413 | 2.2 |
Bioruptor sonicator | Diagenode | UCD-200-TS | 2.3 |
Request permission to reuse the text or figures of this JoVE article
Request PermissionThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. All rights reserved