DiCoExpress bietet eine vollständige aoristische Analyse von der Qualitätskontrolle bis zur Co-Expression. Es führt eine Differentialanalyse basierend auf Kontrasten innerhalb des verallgemeinerten linearen Modells durch. Darüber hinaus kann es auch eine Anreicherungsanalyse auf der Liste der differentiell exprimierten Gene und der co-exprimierten Gencluster durchführen.
Der Hauptvorteil von DiCoExpress ist, dass es von Leuten wie mir verwendet werden kann, ohne besondere Kenntnisse in Statistik oder Luftprogrammierung. Es hilft wirklich einem nicht-spezialisierten Benutzer, den Kontrast zu schreiben, der für die differentielle Genexpressionsanalyse erforderlich ist. Es bietet auch grafische Ausgaben, die die Ergebnisse veranschaulichen, die zur Veröffentlichung bereit sind.
DiCoExpress ist kein Plan-dediziertes Tool. Es kann für jeden Organismus verwendet werden, solange das experimentelle Design mit bis zu zwei biologischen Faktoren vollständig ist. Darüber hinaus ist auch das Design einer Membran mit einer ungleichen Anzahl von Wiederholungen zwischen den Bedingungen möglich.
Ein Anfänger sollte über Vorkenntnisse in R verfügen.Sie sollten wissen, wie man eine Funktion verwendet und erforderliche und optionale Argumente identifiziert. Dann besteht der kritische Schritt darin, die Dateien, die das und das experimentelle Design enthalten, korrekt bereitzustellen. Öffnen Sie zunächst die R Studio-Sitzung.
Stellen Sie das Verzeichnis auf Template-Skripte ein und öffnen Sie das DiCoExpress-Tutorial dot R-Skript. Laden Sie die DiCoExpress-Funktionen in die R-Sitzung. Laden Sie dann Datendateien in die R-Sitzung und teilen Sie die Objektdatendateien in mehrere Objekte auf, um die Dateien leicht zu bearbeiten.
Als nächstes wählen Sie eine Strategie unter NB-Bedingungen oder NB-Replikaten und einen Schwellenwert zum Filtern von Genen mit niedriger Exprimierung. Geben Sie Gruppenfarben an, und wählen Sie eine Normalisierungsmethode aus. Führen Sie dann die Qualitätskontrolle durch.
Wenn Daten entsprechend dem Replikationsfaktorstatus als true repliziert werden, andernfalls als false. Weisen Sie die Wechselwirkung als wahr zu, um eine Wechselwirkung zwischen den beiden biologischen Faktoren zu berücksichtigen. Andernfalls weisen Sie false zu, geben Sie dann das statistische Modell an und definieren Sie den Schwellenwert für die False-Discovery-Rate.
Führen Sie die Differentialanalyse durch, gefolgt von der Festlegung eines Schwellenwerts für die Anreicherungsanalyse und der Anreicherungsanalyse von differentiell exprimierten Genlisten. Wählen Sie die zu vergleichenden DEG-Listen aus. Geben Sie einen Namen für den Listenvergleich an, und verwenden Sie denselben Namen für das Verzeichnis, in dem die Ausgabedateien gespeichert werden.
Setzen Sie den Parametervorgang auf union oder intersection, um die Aktion anzugeben, die für die DEG-Listen ausgeführt werden soll, und vergleichen Sie die Listen. Führen Sie eine Co-Expressionsanalyse durch, gefolgt von der Anreicherungsanalyse der Co-Expressionscluster. Generieren Sie schließlich zwei Protokolldateien, die alle notwendigen Informationen enthalten, um die Analyse zu reproduzieren.
Die gesamtnormalisierten Zählungen pro Stichprobe sollten beim Vergleich sowohl intra- als auch inter-Bedingungen ähnlich sein. Die normalisierten Genexpressionszahlen zeigten einen ähnlichen Median und eine ähnliche Varianz, sowohl unter intra- als auch unter inter-Bedingungen. Zur Identifizierung der potenziellen zugrunde liegenden Datenstrukturen wurden PCA-Plots erstellt.
Es wurde eine klare Unterscheidung zwischen den Behandlungen beobachtet und es fehlte eine Clusterbildung, was auf einen qualitativ hochwertigen Datensatz hindeutet. Die Rohwerthistogramme wurden aufgezeichnet, um die Qualität der Modellierung zu beurteilen. Die Verteilung der Rohwerte war gleichmäßig, mit einem Peak am linken Ende der Verteilung, wie erwartet.
Das Fehlen eines Peaks am rechten Ende zeigt an, dass die statistische Modellierung korrekt erscheint. Das Expressionsprofil von Gen CIG62301.1 wurde in jedem Genotyp und Zustand aufgetragen. Neben der Anzahl der nach oben und unten differentiell exprimierten Gene wurden auch für jeden getesteten Kontrast aufgetragen.
Die Co-Expressionsanalyse wurde an der Vereinigung von fünf DEG-Listen durchgeführt. Im Gegensatz dazu wird nach Variationen des Behandlungsansprechens zwischen Genotyp eins oder zwei im Vergleich zu anderen gesucht. Die co-exprimierten Gene für jeden identifizierten Cluster wurden in einzelne Textdateien gedruckt und das Expressionsprofil der Gene wurde aufgetragen.
Mit DiCoExpress erhalten Biologen statistisch fundierte Genexpressionsanalysen. Der nächste Schritt ist, aus diesen Ergebnissen biologisch sinnvoll zu machen.