Method Article
Gezielte Sequenzierung der nächsten Generation ist eine Zeit- und kosteneffiziente Ansatz, der in der Erforschung von Krankheiten und der klinischen Diagnostik immer beliebter wird. Das hier beschriebene Protokoll stellt die komplexen Workflow für die Sequenzierung erforderlich und der Bioinformatik-Prozess verwendet, um Genvarianten identifizieren, die zur Krankheit beitragen.
Next Generation Sequencing (NGS) revolutioniert schnell wie die Erforschung der genetischen Determinanten der konstitutionelle Krankheit durchgeführt wird. Die Technik ist hocheffizient mit Millionen von Sequenzierung liest in kurzer Zeit und relativ kostengünstig produziert. Insbesondere kann gezielte NGS Fokus Untersuchungen zur genomischen Regionen von besonderem Interesse auf die Krankheit der Studie basiert. Nicht nur ist dies weiter senken Kosten und erhöhen die Geschwindigkeit des Prozesses, aber es mindert die rechnerische Belastung, die oft NGS begleitet. Zwar gezielte NGS beschränkt sich auf bestimmte Regionen des Genoms, verhindern, dass Identifikation von potenziellen Roman Loci von Interesse, sein es eine hervorragende Technik konfrontiert mit einer phänotypisch und genetisch heterogene Erkrankung, dafür gibt es bisher bekannte genetische Assoziationen. Aufgrund der Komplexität der Sequenzierung Technik ist es wichtig, eng, Protokolle und Methoden einzuhalten um Sequenzierung liest der hohen Reichweite und Qualität zu erreichen. Weiter, das gewonnene Sequenzierung liest sind ein ausgeklügelte Bioinformatik-Workflow wird genutzt, um ein Referenz-Genom, Varianten zu nennen, und um sicherzustellen, dass die Varianten Qualitätsmetriken pass genau liest zuordnen. Varianten müssen auch kommentiert und kuratiert basierend auf ihre klinische Bedeutung, die durch die Anwendung der amerikanischen College für medizinische Genetik und Genomik Pathogenität Leitlinien standardisiert werden kann. Hierin vorgestellten Methoden zeigt die einzelnen Schritte beim erzeugen und analysieren von NGS Daten eine gezielte Sequenzierung-Panels im Bedienfeld ONDRISeq Neurodegenerative Krankheit als Modell, um Varianten zu identifizieren, die von klinischer Bedeutung sein können.
Als Definition der genetischen Determinants von verschiedenen Bedingungen nimmt einen höheren Stellenwert in Forschung und in der Klinik, Next Generation Sequencing (NGS) erweist sich ein hoher Durchsatz und kostengünstiges Werkzeug für die Erreichung dieser Ziele1,2 ,3. Seit fast 40 Jahren, Sanger Sequenzierung wurde der Goldstandard zur Identifizierung von genetischen Varianten4; Allerdings müssen bei Erkrankungen mit genetischen Heterogenität oder unbekannte genetische Ätiologie, viele mögliche Kandidatengene, oft gleichzeitig ausgewertet werden. In diesem Zusammenhang Sanger Sequenzierung wird teuer und zeitaufwendig. NGS beinhaltet jedoch massive parallele Sequenzierung von Millionen von DNA-Fragmenten, so dass für eine Kosten- und effiziente Technik, um gleichzeitig eine Vielzahl von genetischen Variation in verschiedenen Regionen des Genoms zu erkennen.
Es gibt drei Arten von NGS für die DNA-Sequenzierung: (1) ganze Genomsequenzierung (WGS), (2) ganze Exome Sequenzierung (WES) und (3) gezielte Sequenzierung5. WGS wertet den gesamten genomischen Inhalt des Individuums, während WES beinhaltet nur die Protein-kodierenden Bereiche des Genoms6-Sequenzierung. Gezielte Sequenzierung, im Gegensatz dazu konzentriert sich auf bestimmte Regionen des Genoms basierend auf relativ wenige spezifische Gene verbunden durch gemeinsame pathologische Mechanismen oder bekannt klinische Phänotyp. Die Exons oder Introns oder irgendwelche intergenetischer Regionen eines Gens oder einer spezifischen Gruppe von Genen können auf diese Weise angegeben werden. Daher kann gezielte Sequenzierung ein hervorragender Ansatz sein, wenn es bereits eine Stiftung von Kandidatengenen bekannt ist, verbunden mit der Krankheit von Interesse sein. Ausrichtung auf bestimmte Regionen des Genoms ermöglicht die Beseitigung von überflüssig und irrelevant genetische Variation, der cloud oder klinische Interpretation ablenken kann. Während WGS und WES eine große Menge von qualitativ hochwertigen Daten erzeugen, kann die Datenmenge überwältigend sein. Nicht nur diese große Menge an Daten erfordert rechenintensive Bioinformatik Analyse, sondern Datenspeicherung kann häufig Probleme7präsentieren. Diese Herausforderung der Datenspeicherung fügt auch zusätzliche Kosten auf WGS und WES, die zunächst oft nicht gilt, bei der Berechnung der Kosten der Sequenzierung. Weiter, obwohl es zurückgeht, die Kosten für WGS und WES relativ hoch bleiben. Gezielte Sequenzierung kann eine kostengünstigere Option sein, insbesondere bei einer großen Anzahl von Personen erforderlich ist.
Die Ontario Neurodegenerative Disease Research Initiative (ONDRI) ist eine Multi-Plattform, Provinz-breit, Beobachtungsdaten Kohortenstudie, die Charakterisierung von fünf neurodegenerativen Krankheiten, einschließlich: (1) der Alzheimer-Krankheit und leichten kognitiven Beeinträchtigung, 2). Amyotrophe Lateralsklerose, 3) frontotemporale Demenz, 4) der Parkinson-Krankheit und 5) vaskuläre kognitive Beeinträchtigung8. Teilkonzerns ONDRI Genomik ist bestrebt, im Rahmen der Grundlinie Charakterisierung dieser Kohorte die oft reduzierten, aber äußerst wichtige genetische Landschaft dieser phänotypisch und genetisch heterogene Erkrankungen aufzuklären. Neurodegenerative Erkrankungen sind daher geeignete Kandidaten für NGS Methoden und für gezielte Sequenzierung im besonderen.
Wir haben maßgeschneiderte eine gezielte NGS-Panel, ONDRISeq, 528 beteiligten ONDRI für die Protein-kodierenden Bereiche 80 Gene sequenziert, die zuvor verknüpft mit den fünf Krankheiten von Interesse gewesen. Mit dieser Methode sind wir in der Lage, qualitativ hochwertige NGS Daten in gewissem Sinne zielgerichtet und effizient nutzbar zu machen. Das Design und die Validierung des ONDRISeq Panels mit mehreren Konkordanz Studien wurde zuvor beschrieben, für die das ONDRISeq-Panel Roman, seltene Varianten der mögliche klinische Bedeutung bei 72,2 % der 216 Fälle für Panel-Validierung verwendet identifizieren konnte 9. Obwohl NGS Technologie rasant fortgeschritten und bemerkenswert in den letzten Jahren viele Forscher eine Herausforderung bei der Verarbeitung von raw-Daten in eine Liste der verwendbaren, kommentierte Varianten10. Darüber hinaus kann Auslegung der Varianten komplex sein, besonders wenn Sie mit vielen konfrontiert, die selten oder neuartige11sind.
Hier beschreiben wir Schritt für Schritt, die Methodik der gezielte NGS und der damit verbundenen Bioinformatik Workflow erforderlich für Resequenzierung Variante aufrufen und variant Anmerkung unter Verwendung der ONDRISeq als Beispiel zu studieren. Nach der Generierung der NGS Daten müssen roh Sequenzierung Dateien menschlichen Bezug Genom ausgerichtet sein um genau Varianten nennen. Varianten müssen dann beschriftet werden, um spätere Variante Kuration durchzuführen. Wir erklären Ihnen auch unsere Umsetzung des American College of medizinische Genetik Normen und Richtlinien, variant Pathogenität genau zu klassifizieren.
Für die Zwecke der ONDRI Ethik Protokolle und informierte Zustimmung erhielten basierend auf der Forschung Ethik Boards im Baycrest Centre for Geriatric Care (Toronto, Ontario, Kanada); Centre for Addiction and Mental Health (Toronto, Ontario, Kanada); Elizabeth Bruyère Krankenhaus (Ottawa, Ontario, Kanada); Hamilton AKH (Hamilton, Ontario, Kanada); London Health Sciences Centre (London, Ontario, Kanada); McMaster (Hamilton, Ontario, Kanada); Die Ottawa Hospital (Ottawa, Ontario, Kanada); Parkwood Hospital (London, Ontario, Kanada); St. Michael Krankenhaus (Toronto, Ontario, Kanada); Sunnybrook Health Sciences Centre (Toronto, Ontario, Kanada); und University Health Network-Toronto Western Hospital (Toronto, Ontario, Kanada).
1. DNA-Isolierung aus menschlichen Blutproben
(2) Sequenzierung Bibliothek Vorbereitung
(3) Next Generation Sequencing
Abbildung 1: Screenshot von der NGS Technologie Software (Table of Materials) Probe Blatt Schöpfer Anwendungsoptionen. Für die Zwecke der ONDRISeq ist die einzige Anwendung von FASTQ verwendet. Jedoch möchten die Benutzer andere Dateien produziert, wie z. B. VCF-Dateien wird empfohlen, dass eine Anwendung im Rahmen der gezielten resequencing Kategorie verwendet wird. Bitte klicken Sie hier für eine größere Version dieser Figur.
4. Neuanordnung und Variante aufrufen
Abbildung 2: Workflow für die Neuanordnung und Variante Aufrufen von FASTQ Dateien innerhalb der Daten Pre-processing-Software (Table of Materials) angepasst für die Zwecke der ONDRISeq. Die Schritte im Workflow können auch auf andere NGS Neuanordnung und variant aufrufenden Software basierend auf den Anforderungen des Forschers. Bitte klicken Sie hier für eine größere Version dieser Figur.
5. Variante Annotation
Die hier beschriebenen Methoden wurden auf 528 Teilnehmer DNA-Proben von Personen angewendet, die in ONDRI registriert wurden. Proben wurden auf das ONDRISeq-Panel in 22 läuft 24 Proben pro Durchlauf ausgeführt. Insgesamt Sequenzierungsdaten waren fest entschlossen, mit einer mittleren Beispiel Abdeckung von 78 ± 13 X von hoher Qualität sein und aller einzelnen Durchläufe ausgedrückt eine mittlere Probe Abdeckung > 30 X. Weitere, im Durchschnitt waren 94 % aller Zielregionen bedeckt mindestens 20 x (Tabelle 1).
95,6 % Lesevorgänge die Referenzsequenz und alle ONDRISeq kartiert wurden Mittel läuft hatte > 90 % der Lesevorgänge zugeordnet (Tabelle 1). Der zugeordneten lautet 92,0 % hatten eine Phred Highscore ≥Q30, mit nur einer Ausführung mit < 80 % des zugeordneten lautet dieser Qualitätsmetrik treffen. Doch dieser Lauf noch eine mittlere Abdeckung von 79 X angezeigt und 93 % des Ziels waren Regionen abgedeckt mindestens 20 X.
Parameter | Mittelwert (±sd) | Beste Leistung | Ärmsten Leistung |
Cluster-Dichte (x 103Portabelstationen2) | 1424 (±269) | 1347 | 1835 |
Insgesamt liest (106) | 43,1 (±6.0) | 48,7 | 47,4 |
Lesevorgänge zugeordnet (106) | 40.1 (±6.0) | 47,1 | 25.7 |
Zugeordneten liest (%) | 95,6 (±1.3) | 96,8 | 92,6 |
Phred Qualität Score ≥Q30 (%) | 92,0 (±6.0) | 92 | 68,3 |
Probe-Abdeckung (X) | 78 (±13) | 99 | 51 |
Tabelle 1: Sequenzierung Qualitätsmetriken für 22 läuft auf ONDRISeq.
Case Study: Identifizierung von seltenen Varianten bei einem PD-Patienten.
Um das Dienstprogramm von unseren gezielten NGS-Workflow zu demonstrieren, präsentieren wir das Beispiel eines 68 Jahre, Männlich, Krankheit Parkinson-Patienten. Die DNA-Probe wurde am NGS Desktop-Gerät (Table of Materials) über das ONDRISeq-Panel neben 23 anderen ONDRI Proben laufen. Der Run angezeigt eine Cluster-Dichte von 1.555 x 103Portabelstationen2. Der Patient besondere Probe angezeigt eine mittlere Abdeckung von 76 X, mit 93,9 % des Ziels Regionen abgedeckt mindestens 20 X.
Nach der Durchführung Variante Berufung und Annotation mit dem benutzerdefinierten Bioinformatik-Workflow, der Patient erwies sich als Hafen 1351 Varianten innerhalb der Exons und umliegenden 250 bp 80 Gene enthalten im Bereich ONDRISeq. Die ANNOVAR-Pipeline war jedoch in der Lage, die Anzahl der Varianten zu reduzieren indem Sie Variante Sequenz Ontologie und MAF, wie oben beschrieben. Dies erzeugt eine Liste mit sieben Varianten, die manuelle Kuration (Abbildung 3) unterzogen. Von diesen sieben Varianten wurden zwei mögliche klinische Bedeutung. Dieser Prozess ist speziell auf die Bedürfnisse von ONDRI und erfolgte durch die Identifizierung sind nonsynonymous in Ontologie, wodurch es eine Änderung im Protein, sind relativ selten in der allgemeinen Bevölkerung. Ob die Variante mit Krankheit zuvor gebracht hatte, wurden auch die in Silico Vorhersagen der Verderblichkeit, das Protein und die ACMG Pathogenität Klassifizierung der Varianten in diesem Prozess eingesetzt.
Die erste durch die reduzierte Liste identifiziert war eine heterozygote Variante, nämlich LRRK2: c.T3939A, was in der Variante p.C1313* Unsinn. LRRK2 kodiert Protein reich an Leucin wiederholen Kinase 2, das GTPase und Kinase-Aktivität42besitzt. Darüber hinaus sind Mutationen in diesem Gen bekannt, zu den wichtigsten Ursachen der familiären Parkinson-Krankheit43. Diese Variante stellt ein vorzeitiges Stopcodon im LRRK2, dadurch verlieren Aminosäure Rückstände 1.314 – 2, 527. Dies verhindert, dass die Übersetzung der das Protein Ras von komplexen Proteinen (Roc), C-terminalen des Roc (ADR) und Protein Kinase Domains, die funktionieren als atypische Rho-GTPase, GTP-bindendes Protein und Proteinkinase bzw. beteiligt sind, und wurde vorhergesagt durch die Analyse in Silico erzeugte CADD schädlich (CADD Phred = 36). Diese Variante ist auch jeweils mit einem MAF 0,004 % und 0,01 % in ExAC und ESP, selten und fehlt aus der 1000G-Datenbank. Darüber hinaus ist dies der einzige Patient aus allen 528 sequenziert, dieser Variante trägt die Roman ist, da es zuvor nicht in Krankheit Mutation Datenbanken (Table of Materials) beschrieben worden. Das Vertrauen des Aufrufs Variante wurde durch seine Tiefe Abdeckung von 109 X bestätigt. Zu guter Letzt die Variante wurde mit der AMCG Standards und Leitlinien für die Pathogenität bewertet und wurde als Pathogene eingestuft.
Der Patient trug auch eine zweite heterozygote Variante, NR4A2: c.C755A, wodurch die Missense Veränderung p.P252Q. Das Protein kodiert, indem NR4A2, nukleare Rezeptor Unterfamilie 4 Gruppe A Mitglied 2, ist ein Transkriptionsfaktor, der in der Generation der dopaminergen Neuronen44 und Mutationen in diesem Gen wurden zuvor mit Parkinson Krankheit-45. Die Substitution von unpolaren Prolin, die polare Glutamin wurde vorausgesagt, um durch die in Silico Vorhersage-Analyse von CADD generiert schädlich sein (CADD Phred = 21,1), aber nicht durch die Analyse von SIFT oder PolyPhen-2 erzeugt. Die Variante ist selten mit einer MAF von 0,004 % ExAC und das Fehlen von ESP und 1000G. Die Variante wurde auch in einem ONDRI Teilnehmer diagnostiziert vaskuläre kognitive Beeinträchtigung identifiziert, aber nicht vorher in Krankheit Mutation Datenbanken beschrieben. Diese Variante hatte Abdeckung von nur 18 X, aber Sanger-Sequenzierung durchgeführt werden, wird um seine Gültigkeit innerhalb der Sequenz zu gewährleisten. Schließlich wollte die Variante der unsicheren Bedeutung bei der Pathogenität der ACMG Normen und Richtlinien geprüft werden.
Die ONDRISeq-Panel und Bioinformatik-Pipeline kann auch APOE Genotyp jeder Probe zu bestimmen. Dieser Patient war entschlossen, das APOE Genotyp E3/E3.
Abbildung 3: Beispiel für eine reduzierte Ausgabe ANNOVAR Anzeige manuell kuratierte, kommentiert Varianten. Die reduzierte ANNOVAR Ausgabe aus der Fallstudie eines 68 Jahre alt, Männlich, Patienten mit der Parkinson-Krankheit. Kommentierte Varianten sind kuratiert, um diejenigen zu identifizieren, die am ehesten von klinischer Bedeutung, wie durch die roten Kästchen gekennzeichnet. Bitte klicken Sie hier für eine größere Version dieser Figur.
Auf dem Weg von DNA-Probe Extraktion zur Identifizierung von Varianten, die von Interesse sein könnten, wenn ein Patient Diagnose, Krankheitsverlauf und mögliche Therapieoptionen in Betracht, ist es wichtig zu erkennen, die vielfältige Natur der Methodik erforderlich für die Sequenzierung und ordnungsgemäße Datenverarbeitung. Die hierin beschriebene Protokoll ist ein Beispiel für die Nutzung der gezielte NGS und anschließende bioinformatische Analyse wesentlicher seltene Varianten der potenzielle klinische Bedeutung zu identifizieren. Insbesondere stellen wir den Ansatz Teilkonzerns ONDRI Genomik bei Verwendung der ONDRISeq speziell angefertigte NGS Panel.
Es ist anerkannt, dass diese Methoden basierend auf einer bestimmten NGS-Plattform entwickelt wurden, gibt es andere Sequenzierung Plattformen und Ziel-Anreicherung-Kits, die verwendet werden können. Jedoch wurde NGS-Plattform und Desktop-Instrument (Table of Materials) basierend auf seinen frühen amerikanischen Food and Drug Administration (FDA) Zulassung46gewählt. Diese Ermächtigung spiegelt die qualitativ hochwertige Sequenzierung, die ausgeführt werden kann, mit der NGS-Protokolle und die Zuverlässigkeit, die auf der Sequenzierung liest platziert werden können.
Obwohl genaue Sequenzierung Lesevorgänge durch die Tiefe der Abdeckung zu erhalten sehr wichtig ist, kann die Bioinformatik-Verarbeitung für seltene Variante letztlich erforderlich ist von entscheidender Bedeutung und rechenintensive. Aufgrund der vielen Fehlerquellen, die innerhalb der Sequenzierungsprozess auftreten können, muss eine robuste Bioinformatik-Pipeline für die verschiedenen Ungenauigkeiten korrigieren, die eingeführt werden können. Sie entstehen von Fehlstellungen in der Zuordnungsprozess Verstärkung Bias durch PCR-Amplifikation in der Bibliothek-Vorbereitung und Herstellung Sequenzierung Artefakte47Technologie eingeführt. Unabhängig von der Software verwendet, um lesen Sie Mapping und variant Berufung durchzuführen gibt es Möglichkeiten, um diese Fehler einschließlich lokalen Neuausrichtung, entfernen von doppelten zugeordneten liest, und richtige Parametereinstellung für die Qualitätskontrolle beim Aufrufen von Varianten zu reduzieren. Darüber hinaus können die Parameter gewählt, während Variante Berufung variieren je nach was für das Studium an Hand11am besten geeignet ist. Die Mindestdeckung und Qualität der Gäste eine Variante und den umliegenden Nukleotiden, die hierin angewendet wurden wurden ausgewählt, eine Balance zwischen entsprechenden Spezifität und Sensitivität zu schaffen. Diese Parameter sind für das ONDRISeq-Panel basierend auf variant aufrufenden Konkordanz mit drei separaten genetische Techniken, wie vorher beschrieben, einschließlich bestätigt worden: 1) Chip-basierten Genotypisierung; (2) allelische Diskriminierung Assay; und 3) Sanger-Sequenzierung-9.
Nach genaue Variante aufrufen, um die potenzielle klinische Bedeutung zu bestimmen sind Annotation und Kuration notwendig. Aufgrund seiner open-Access-Plattform ist ANNOVAR ein ausgezeichnetes Werkzeug für beide Annotation und variant Vorauswahl oder Beseitigung. Nicht nur bequem, ANNOVAR kann auf jede VCF-Datei, egal welche Plattform Sequenzierung verwendet wird, angewendet werden und anpassbare basiert auf die Bedürfnisse der Forschung26.
Nach Annotation müssen Varianten ausgewertet werden, um festzustellen, ob sie betrachtet werden sollten, von klinischer Bedeutung sein. Nicht nur diesen Prozess komplizierter werden, aber es ist oft anfällig für Subjektivität und menschliches Versagen. Aus diesem Grund hat die ACMG Richtlinien zu beurteilen, die Beweise für die Pathogenität von irgendeiner Variante gesetzt. Wir verwenden einen nicht gleichbedeutend, seltene Variante-basierte manuelle Kuration Ansatz, das aufgebaut ist auf der Grundlage dieser Leitlinien und geschützt durch individuell bewerten jede Variante, die durch die Pipeline mit einem maßgeschneiderten passieren kann Python-Skript, das die Varianten basierend auf den Richtlinien klassifiziert. Auf diese Weise erhält jede Variante eine Ranking der pathogenen, wahrscheinlich pathogenen, unsichere Bedeutung, wahrscheinlich bösartig oder gutartig, und wir sind in der Lage die Variante Kuration Prozess Standardisierung und Transparenz hinzu. Es ist wichtig zu erkennen, dass die Besonderheiten der variant Kuration, jenseits der Bioinformatik-Pipeline werden basierend auf den Anforderungen der Forschung individualisiert werden und war daher über den Anwendungsbereich der Methoden vorgestellt.
Obwohl die hier vorgestellten Methoden für ONDRI spezifisch sind, können die beschriebenen Schritte übersetzt werden, wenn eine große Anzahl von verfassungsmäßigen Krankheiten von Interesse in Betracht. Da die Zahl der gen-Verbände für viele Phänotypen ermöglicht gezielte NGS eine Hypothese Ansatz, die auf der bisherigen Forschung zu nutzen, die auf dem Gebiet geleistet hat. Allerdings gibt es Einschränkungen für gezielte NGS und die Methodik vorgestellt. Indem Sie nur auf bestimmte Regionen des Genoms, sind die Bereiche der Entdeckung beschränkt sich auf neuartige Allele von Interesse. Daher, neue Gene oder anderen genomic Loci hinausgehen abgedeckt durch die Ziele, Sequenzierung, die aufgedeckt werden könnte mit WGS oder WES Ansätze, nicht identifiziert werden. Es gibt auch Regionen im Genom, das schwierig, genau Sequenz mit NGS Ansätze sein kann, darunter diejenigen mit einem hohen Maß an wiederholten Sequenzen48 oder diejenigen, die reich an GC Inhalt49. Glücklicherweise bei der gezielten NGS Verwendung, es ist a Priori ein hohes Maß an Vertrautheit mit den genomischen Regionen sequenziert werden, und ob diese technische Herausforderungen darstellen könnte. Schließlich ist die Erkennung der Kopie Zahl Varianten von NGS Daten derzeit nicht standardisierte50. Jedoch möglicherweise die Bioinformatik Lösungen für diese Probleme am Horizont; neue Berechnungswerkzeuge können helfen, um diese zusätzliche Formen der Variation in ONDRI Patienten zu analysieren.
Trotz ihrer Grenzen ist gezielte NGS in der Lage qualitativ hochwertige Daten innerhalb einer Hypothese-Top-Down-Ansatz zu erhalten, während die übrigen weniger teuer als die WGS und WES Pendants. Diese Methode ist nicht nur geeignet für effiziente und gezielte Forschung, die klinische Umsetzung von gezielten NGS exponentiell wächst. Diese Technologie wird eingesetzt, um viele verschiedene Fragen über die molekulare Wege von verschiedenen Krankheiten zu beantworten. Es wird auch in eine genaue Diagnose-Tool zu relativ geringen Kosten wenn gegen WES und WGS entwickelt. Auch im Vergleich zu den Gold-Standard Sanger-Sequenzierung, gezielte können NGS in seiner Zeit und Wirtschaftlichkeit überzeugt. Aus diesen Gründen ist es wichtig, dass ein Wissenschaftler oder Arzt, empfängt und verwendet NGS Daten, zum Beispiel als Text in einem Labor oder klinischen Bericht geliefert um zu verstehen, den Komplex "Black Box", die die Ergebnisse zugrunde liegt. Die hier vorgestellten Methoden sollen Benutzer verstehen, den Prozess der Generierung und Interpretation der NGS Daten zugrunde.
Die Autoren haben nichts preisgeben.
Wir möchten danken allen ONDRI Teilnehmern für ihre Zustimmung und die Zusammenarbeit mit unserer Studie. Vielen Dank an die ONDRI Ermittler (Www.) ONDRI.ca/people), einschließlich unserer Studienleiter (MJS) und die ONDRI EZB Ausschüsse: Präsidium, Lenkungsausschuss, Publikation Ausschuss, recruiting Ausschuss, Bewertung Plattformen und Projektmanagement-Team. Wir danken auch London Regional Genomics Centre für ihr technisches Know-how. AAD wird von der Alzheimer-Gesellschaft von London und Middlesex Meister Graduate Research Scholarship unterstützt. SMKF wird durch die ALS Kanada Tim E. Noël Postdoctoral Fellowship unterstützt.
Name | Company | Catalog Number | Comments |
4 mL EDTA K2 tubes | Fisher Scientific | 02-689-4 | |
1 M Tris Buffer | Bio Basic Canada Inc. | SD8141 | |
Gentra Puregene Blood Kit | Qiagen | 158389 | 1,000 mL Kit. This is the blood extraction kit, referred to in step 1.3. |
NanoDrop-1000 Spectrophotometer | Thermo Fisher Scientific | ND-2000 | Replaced by the NanoDrop-2000 Spectrophotometer. This is the full-spectrum spectrophotometer, referred to in steps 1.4 and 2.1.2. |
Qubit 2.0 fluorometer | Invitrogen | Q32866 | This is a fluorometer appropriate for the quantification of DNA, referred to in steps 2.1.4, 2.1.6, 2.2.3, and 3.1.3. |
Nextera Rapid Custom Capture Enrichment Kit | Illumina, Inc. | FC-140-1009 | Specifically designed for the ONDRISeq panel, sequencing the exons of 80 genes, resulting in 971,388 base pairs of sequence in paired-end reads of 150 bases in length; 288 samples per kit. This is the target enrichment kit, referred to in steps 2.2, 2.2.2, 2.2.3, 3.1.5, 3.1.6, 3.4.1, and the Discussion. |
2100 BioAnalyzer | Agilent Technologies | G2939BA | This is a automated electrophoresis system, referred to in step 3.1.4. |
High Sensitivity DNA Reagent Kit | Agilent Technologies | 5067-4626 | 110 Samples per kit; This is a DNA quality analysis kit, referred to in step 3.1.4. |
MiSeq Reagent Kit v3 | Illumina, Inc. | MS-102-3003 | 600 Cycle Kit; This is the NGS desktop instrument reagent kit, referred to in step 3.1. |
MiSeq Personal Genome Sequencer | Illumina, Inc. | SY-410-1003 | This is a NGS desktop instrument, referred to in steps 2.2.1, 3.1, 3.1.1, 3.1.2, 3.1.8, 3.2, 4.2.6, the Representative Results, and the Discussion. |
Experiment Manager | Illumina, Inc. | This is NGS technology software, referred to in step 3.1.1 and Figure 1. https://support.illumina.com/sequencing/sequencing_software/experiment_manager/downloads.html | |
BaseSpace | Illumina, Inc. | SW-410-1000 | This is a cloud-based computing environment, referred to in steps 3.1.2, 3.2, 3.3, 3.3.1, 3.3.2, 3.4, 3.4.1, 3.4.2 and 3.4.3. https://basespace.illumina.com/ |
CLC Genomics Workbench 10.1.1 | Qiagen | 832000 | Open source options for data pre-processing are also available that can model the workflow used in this protocol. This is the software used for data pre-processing, referred to throughout step 4 and in Figure 2. |
Annotate Variation | http://annovar.openbioinformatics.org/en/latest/user-guide/download/ | ||
RefSeq | National Center for Biotechnology Information | https://www.ncbi.nlm.nih.gov/refseq/ | |
dbSNP138 | National Center for Biotechnology Information | https://www.ncbi.nlm.nih.gov/projects/SNP/snp_summary.cgi?view+summary=view+summary&build_id=138 | |
Exome Aggregation Consortium | Broad Institute | http://exac.broadinstitute.org/ | |
National Heart, Lung, and Blood Institute Exome Sequencing Project European Cohort | University of Washington and the Broad Institute | http://evs.gs.washington.edu/EVS/ | |
ClinVar | National Center for Biotechnology Information | https://www.ncbi.nlm.nih.gov/clinvar/ | |
Combined Annotation Dependent Depletion | University of Washington and Hudson-Alpha Institute for Biotechnology | http://cadd.gs.washington.edu/ | |
Sorting Intolerant from Tolerant | J. Craig Venter Instutite | http://sift.jcvi.org/ | |
PolyPhen-2 | Brigham and Women's Hospital, Harvard Medical School | http://genetics.bwh.harvard.edu/pph2/ | |
Human Gene Mutation Database | Qiagen | 834050 | This is a disease mutation database, referred to in step 5.2 and the Representative Results. https://portal.biobase-international.com/cgi-bin/portal/login.cgi?redirect_url=/hgmd/pro/start.php |
Splicing-based Analysis of Variants | Frey lab, University of Toronto | http://tools.genes.toronto.edu/ | |
Human Splicing Finder | Aix Marseille Université | http://www.umd.be/HSF3/HSF.shtml | |
Other materials | |||
Centrifuge | |||
Disposable transfer pipets |
Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden
Genehmigung beantragenThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten