CorExplorer findet tumorassoziierte Genexpressionsfaktoren auf eine Weise, die mathematisch prinzipientreu ist, indem interaktive Visualisierungen sowie klinische und Datenbankinformationen für die biologische Entdeckung verwendet werden. CorEx führt die Informationsmaximierung so aus, dass relativ wenige Beispiele benötigt werden, um Cluster in hochdimensionalen Daten zu finden. Die Hierarchie der latenten Faktoren, die sie hervorbringt, erleichtert das biologische Verständnis.
Diese Methode hat sich bereits als interessant erwiesen, wenn sie auf die Krebsbiologie angewendet wird. Seine informationstheoretischen Grundlagen machen es für jedes System mit vielen Variablen und wenig Vorkenntnissen über ihre Beziehungen anwendbar. Beginnen Sie mit der Navigation zur CorExplorer-Homepage.
Klicken Sie unter Schnelllinks auf die Plus-Erweiterungs-Schaltfläche, um eine Zusammenfassung des CorEx-Faktordiagramms anzuzeigen, das auf den krebskranken Daten von Interesse trainiert wurde. Hier werden z. B. die Faktordiagramme für TCGA-Eierstockkrebsdaten angezeigt. Nachdem Sie die Faktordiagramme untersucht haben, klicken Sie auf Lungen-TCGA-LUAD, um auf die CorExplorer-Seite für die RNA-Sequenzierung von Lungenkrebs zuzugreifen, und verwenden Sie das Fenster CorExplorer Factor Graph, um das CorEx-Faktordiagramm für ein Gen von Interesse zu untersuchen.
Wenn Sie den Mauszeiger über das Anzeigefenster faktorgraph bewegen, zoomen Sie mit dem Maustrackpad in das Faktordiagramm, um die Details des Diagramms anzuzeigen, z. B. die wichtigsten Gene in jedem Faktor und die Verbindungen zwischen den Knoten in verschiedenen Layern. Um ein Zielgen zu finden, klicken Sie auf das Menü "Gene", und geben Sie den Gennamen ein, um ihn in die Dropdown-Liste zu wählen. Drücken Sie auf der Tastatur die Taste "Return", um die Ansicht auf den Faktor zu zoomen, mit dem das gen von Interesse am stärksten korreliert ist.
Positionieren Sie die Maus über die Diagrammanzeige, und scrollen Sie, um den Knotenzukleinern und die zugehörigen Faktoren anzuzeigen, die Nachbarn des engsten Genfaktors sind. Beachten Sie, dass nur Gene mit einem Gewicht angezeigt werden, das größer als der auf dem Schieberegler min Link Weight angegebene Schwellenwert ist. Um alle Gene anzuzeigen, die mit dem Faktor verknüpft sind, klicken Sie auf den entsprechenden Knoten und wählen Sie Zusätzliche Gene im Popup-Fenster laden aus.
Wenn Fertig angezeigt wird, schließen Sie das Popupfenster. Klicken und ziehen Sie im Kopfzeilenbereich auf den Modifikator min Link Weight auf 0,05, damit die Gene in der Gewichtsreihenfolge angezeigt werden. Um Assoziationen mit einer biologischen Funktion zu identifizieren, deaktivieren Sie im Anmerkungsfenster die falsche Ermittlungsratesortierung, um das Dropdownmenü Faktor nach Faktornummer und nicht nach falscher Ermittlungsrate zu sortieren.
Scrollen Sie, und klicken Sie, um den Faktor des Interesses im Dropdown-Menü Anmerkungsfenster auszuwählen, um die Annotationen für den Faktor anzuzeigen. Klicken Sie dann auf einen Anreicherungsfaktor, um die zugehörigen Gene, wie sie auf der Grafikanzeige gelb hervorgehoben sind, sofort anzuzeigen. Beachten Sie, dass Faktoren, die als unterschiedliche GO-Begriffe ausfallen oder angezeigt werden, danach ausgewählt werden, ob sie für Gene mit der ausgewählten Anmerkung angereichert sind oder nicht.
Für Filterfaktoren von Interesse, unter Verwendung von Überleben und Clusterqualität, wählen Sie aus dem Dropdown-Menü Dataset TCGA_OVCA, um zur CorExplorer-Seite für die TCGA-Ovarialkarzinom-RNA-Sequenzierung zu gelangen. Beachten Sie im Survival-Fenster den Faktor mit dem größten Überlebensunterschied, und wählen Sie diesen Faktor im Fenster Faktordiagramm aus dem Dropdown-Menü Faktor aus. Klicken und ziehen Sie den Schieberegler Gewicht verknüpfen auf 0,5, und notieren Sie die Anzahl der Gene im Faktor.
Erweitern Sie die Liste der Faktoren im Survival-Fenster, und klicken Sie auf den nächstbesten Faktor im Dropdown-Menü "Überleben", um die zugehörigen Überlebenskurven anzuzeigen. Die wichtigen GO- und Kegg-Anmerkungen werden angezeigt. Um die biologische Rolle von Genen in diesem Faktor besser zu verstehen, wählen Sie die Faktorschicht oben im Faktordiagramm-Fenster aus, und bewegen Sie die Maus über das Fenster, während Sie verkleinern, um den gesamten Cluster und die zugehörigen Faktoren anzuzeigen.
Um die relative Bedeutung der Faktoren zu verstehen, die mit dem Clusterknoten verknüpft sind, deaktivieren Sie sortieren nach p-val im Survival-Fenster, und klicken Sie auf jede der Faktorzahlen nacheinander, um sie anzuzeigen, wobei Sie die Faktoren notieren, die eine Überlebensassoziation anzeigen. Wählen Sie im Menü Fenster hinzufügen PPI aus, und klicken Sie auf Hinzufügen, um dem Anzeigebereich ein PPI-Diagrammfenster hinzuzufügen. Wählen Sie im PPI-Diagrammfenster eine Faktorschicht aus, die von Interesse ist, um die signifikanten Protein-Protein-Wechselwirkungen anzuzeigen.
Klicken Sie auf den Link Ansicht bei StringDB, um eine Verbindung mit der STRINGdb-Onlinedatenbank herzustellen, und klicken Sie auf Weiter. Öffnen Sie dann die Registerkarte Anaylsis, um eine Online-GO-Analyse für die PPI-Netzwerkgene zu erhalten. Die obere Zellkomponente wird angezeigt.
Kehren Sie zum CorExplorer-Tab und zum PPI-Fenster zurück, und wählen Sie einen anderen Faktor aus. Klicken Sie erneut auf den Link Ansicht unter StringDB. Eine andere obere Zellkomponente wird angezeigt.
Wählen Sie dann im PPI-Fenster einen anderen Faktor für eine STRING-Datenbankanalyse aus. Um Gemeinsamkeiten und Unterschiede der Genexpressionsvariation zwischen Tumortypen zu finden, klicken Sie auf die CorExplorer-Überschrift, um zur Startseite zurückzukehren, und klicken Sie auf Suchen, um auf eine Seite zuzugreifen, die die Suche nach allen Datensätzen auf der CorExplorer-Website ermöglicht. Geben Sie im Feld Gensuche einen Gennamen ein, der von Interesse ist, und klicken Sie auf Suchen.
Zum Beispiel, wie gezeigt, FLT1 wird mit einem relativ hohen Gewicht und mehreren verschiedenen Faktoren gefunden. Die Suche nach dem BRCA1-Gen im Lungenkrebs-Datensatz zeigt, dass das Gen am stärksten mit dem CorEx-Faktor 26 assoziiert ist. Der GO-Begriff Anreicherung für diesen Faktor ist extrem hoch, mit DNA-Reparatur zeigt eine falsche Entdeckungsrate von nur ein mal 10 bis die negativen 19.
Die Auswahl lenkt die Aufmerksamkeit auch auf den Cluster der zweiten Ebene L2_8, der sechs eng verwandte Faktoren als Kinder hat. Das DNA-Reparatur-Protein-Interaktionsnetzwerk ist stark miteinander verbunden und unterstützt die eng verknüpfte Funktionalität der Gene in Faktor 26. Die zugehörigen Überlebensdiagramme deuten auf einen möglichen Zusammenhang mit dem Überleben des Patienten hin, das in einem größeren Datensatz bestätigt werden müsste.
Beginnend mit der Überlebensbewertung kann die Zerlegung der Faktoren ermöglichen, die mit einem verbesserten Überleben korrelieren, wie es mit bestimmten Genexpressionsgruppen verbunden ist. Das Hinzufügen eines Protein-Protein-Interaktionsfensters für jeden Faktor wiederum erleichtert die Bestimmung möglicher Erklärungen für ihre Assoziationen mit dem Überleben. Es ist wichtig, die Heatmaps für jeden Faktor zu überprüfen, um zu bestätigen, dass das Genexpressionsmuster von ausreichender Qualität ist, um biologische Interpretationen zu unterstützen.
Heatmaps, die starke, klare Variationen in Genexpressionsmustern aufweisen, können entweder eine koordinierte Expression der Faktorgene aufweisen, die von hoch bis niedrig reichen, oder komplexere Muster aufweisen, wobei einige Gene mit niedriger Expression mit anderen Genen mit einer hohen Expression korrelieren. Das übergeordnete Ziel dieses Verfahrens ist es, eine personalisierte Therapie zu setzen, indem ein Auszellertumor auf die CorExplorer-Faktoren kartiert wird, um potenzielle tumorspezifische Therapien zu identifizieren.