Zum Anzeigen dieser Inhalte ist ein JoVE-Abonnement erforderlich. Melden Sie sich an oder starten Sie Ihre kostenlose Testversion.
Method Article
Unsere Bayesian ändern Point (BCP)-Algorithmus baut auf state-of-the-art Fortschritte in der Modellierung change-Punkten über Hidden-Markov-Modelle und wendet sie auf Chromatinimmunpräzipitation Sequenzierung (ChIPseq) Datenanalyse. BCP funktioniert gut sowohl breit und punktförmige Datentypen, sondern zeichnet sich durch genaue Identifizierung robust, reproduzierbar Inseln diffuse Histon Bereicherung.
ChIPseq ist eine weit verbreitete Technik zur Untersuchung von Protein-DNA-Wechselwirkungen. Lesedichte Profile werden unter Verwendung der nächsten Sequenzierung von Protein-gebundener DNA und Ausrichten des kurzen liest einem Bezugsgenom erzeugt. Angereicherte Regionen als Peaks, die oft drastisch unterscheiden in der Form, in Abhängigkeit von dem Zielprotein 1 offenbart. Zum Beispiel Transkriptionsfaktoren binden oft in einem Standort-und sequenzspezifische Weise und neigen kann punktförmige Spitzen zu produzieren, während Histonmodifikationen weiter verbreitet sind und durch breite, diffuse Inseln Anreicherung 2 gekennzeichnet. Zuverlässig Abgrenzung dieser Regionen lag der Schwerpunkt unserer Arbeit.
Algorithmen zur Analyse ChIPseq Daten wurden verschiedene Methoden, von Heuristiken 3-5 bis strengeren statistischen Modelle, wie zB Hidden Markov Modellen (HMMs) 6-8 eingesetzt. Wir suchten eine Lösung, die die Notwendigkeit für schwierig zu definieren, Ad-hoc-Parameter, die oft minimiertKompromisse Auflösung und verringern die intuitive Bedienbarkeit des Werkzeugs. Mit Bezug auf HMM-basierten Methoden, wollten wir Parameterschätzung Verfahren und einfache, endlichen Klassifikationen, die oft verwendet werden beschneiden.
Darüber hinaus beinhaltet konventionelle ChIPseq Datenanalyse Kategorisierung der erwarteten Lesedichte Profile entweder als punktförmige oder diffuse durch nachfolgende Anwendung des geeigneten Werkzeug gefolgt. Wir weiter das Ziel, die Notwendigkeit für diese zwei unterschiedlichen Modelle mit einem einzigen, vielseitiger Modell, das kompetent adressieren kann das gesamte Spektrum von Datentypen zu ersetzen.
Um diese Ziele zu erreichen, haben wir zunächst eine statistische Rahmen konstruiert, dass natürlich modelliert ChIPseq Datenstrukturen mit einer Schneidkante Fortschritt in HMMs 9, die nur explizite nutzt Formeln-eine Innovation entscheidend für die Performance-Vorteile. Komplexere dann heuristische Modelle beherbergt unsere HMM unendliche versteckten Zustände durch eineBayes-Modell. Wir wandten sie identifizieren vernünftigen Änderung Punkte zu lesen Dichte, die weiter zu definieren Segmente Bereicherung. Unsere Analyse ergab, wie unsere Bayesian ändern Point (BCP)-Algorithmus eine reduzierte Komplexität-nachgewiesen durch eine verkürzte Laufzeit und Speicherbedarf hatte. Die BCP-Algorithmus wurde erfolgreich sowohl punktförmige Spitze und diffuse Insel Identifikation mit robusten Genauigkeit und begrenzte benutzerdefinierten Parametern aufgebracht. Diese illustrierte sowohl ihre Vielseitigkeit und einfache Handhabung. Daher glauben wir, dass es leicht in weiten Bereichen von Datentypen und Endanwender in einer Weise, die einfach verglichen und gegenübergestellt umgesetzt werden, so dass es ein großes Werkzeug für ChIPseq Datenanalyse, die in Zusammenarbeit und Bestätigung zwischen Forschergruppen unterstützen können. Hier zeigen wir die Anwendung der BCP bestehende Transkriptionsfaktor 10,11 und epigenetische Daten 12 seiner Nützlichkeit zu illustrieren.
Ein. Vorbereiten Input Files für BCP Analysis
2a. Diffuse Lesen Profile: Vorverarbeitung ChIP Lesen Dichten für die Erkennung von Enriched Inseln im Diffuse Daten
2b. Punctata Lesen Profile: Vorverarbeitung ChIP und Input BED Dateien zur Erkennung von Peaks in punctata Daten
3. Schätzen Sie die Posterior Mittelwert Lesen Dichte von jedem Block mit unseren BCMIX Approximation
4a. Diffuse Lesen Profile: Post-Prozess Posterior Mittel in Segmente Diffuse Enrichment
4b. Punctata Lesen Profile: Post-Prozess Posterior Mittel in Peak-Kandidaten
BCP zeichnet zu identifizieren Regionen breite Anreicherung in Histonmodifikation Daten. Als Bezugspunkt, wir vorher unsere Ergebnisse mit denen von SICER 3, ein vorhandenes Werkzeug, das starke Leistung gezeigt hat verglichen. Um am besten veranschaulichen BCP die Vorteile, untersuchten wir eine Histon-Modifikation, die gut studiert hatte, um eine Grundlage für die Beurteilung der Erfolgsquoten zu etablieren. In diesem Sinne haben wir dann analysiert H3K36me3, da es sich gezeigt hat, stark assoziieren mit a...
Wir wollten ein Modell zur Analyse ChIPseq Daten, die sowohl punktförmige und diffuse Datenstrukturen identifizieren konnte ebenso gut entwickeln. Bis jetzt haben Regionen der Bereicherung, vor allem diffuse Regionen, die die vorausgesetzte Erwartung große Insel groß nachzudenken, war schwer zu identifizieren. Um diese Probleme anzugehen, nutzten wir die jüngsten Fortschritte in der HMM-Technologie, die viele Vorteile gegenüber bestehenden heuristische Modelle und weniger innovative HMMs besitzen.
Keine Interessenskonflikte erklärt.
Starr Foundation Award (MQZ), NIH ES017166 (MQZ), NSF DMS0906593 (HX).
Name | Company | Catalog Number | Comments |
Name des Reagenzes | Firma | Katalog-Nummer | Kommentare (optional) |
Linux-basierte Workstation |
Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden
Genehmigung beantragenThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten