OpenProt ist die erste Datenbank, die eine polysystronische Annotation eukaryotischer Genome ermöglicht, das Kodierungspotenzial von Protogenen erkennt und die Entdeckung bisher nicht nachweisbarer Proteine ermöglicht. Wir haben dieses Protokoll so konzipiert, dass es für alle Benutzer zugänglich ist, ohne umfangreiche bioinformatische Fähigkeiten zu erfordern. Um die heutigen Herausforderungen in der Medizin zu verstehen und anzugehen, müssen wir die proteomische Landschaft und alle Akteure und ihre Dynamik vollständig verstehen.
OpenProt bietet diese Möglichkeit. Obwohl openProt hier für die Analyse von patonomischen Experimenten verwendet wird, kann es auch mit anderen Systemen verwendet werden, da es einfach eine klarere Definition des Proteoms bietet. Öffnen Sie zunächst die OpenProt-Website und verwenden Sie den Link aus dem Oberen Seitenmenü, um die Downloadseite zu öffnen.
Klicken Sie auf die Arten von Interesse auf der Grundlage der Analyse'experimentelleDaten und der gewünschten Proteintyp. Klicken Sie auf AllProts, Isoforms und RefProds, um Dateien zu generieren, die alle bekannten und neuartigen Proteintypen enthalten, die in der OpenProt-Datenbank vorhanden sind, und klicken Sie auf die Anmerkung, aus der die Proteinsequenzen entnommen werden. Klicken Sie auf die Höhe der Belege, die für die Proteinbetrachtung gemäß dem Forschungsziel erforderlich sind.
Klicken Sie dann auf alle vorhergesagten Dateien, die alle OpenProt-Vorhersagen enthalten, und klicken Sie auf das gewünschte Dateiformat, das Sie herunterladen möchten. Wählen Sie für proteomische Anaysen die FASTA-Proteindatei aus. Die Readme-Datei enthält alle notwendigen Informationen zum Dateiformat.
Melden Sie sich für die Datenbankbehandlung bei einer entsprechenden Proteomics-Toolinstanz an, und erstellen Sie einen neuen Verlauf. Um die heruntergeladene OpenProt-Datenbank zu importieren, klicken Sie auf Hochladen. Um den Datenbankbehandlungsworkflow einzugeben, wechseln Sie zur Workflowseite, klicken Sie erneut auf Hochladen, und klicken Sie auf Workflow ausführen.
Wählen Sie dann die importierte OpenProt-Datenbank als Eingabe aus und benennen Sie die erhaltene Fasta-Datei in etwas Sinnvolles um. Die Datenbank kann für Proteomikanalysen verwendet werden. Öffnen Sie zur Vorbereitung der Massenspektrometriedatei das frei verfügbare MS-Konvertierungstool aus der proteo Wizard Suite, und laden Sie die zu analysierende Datendatei hoch.
Wählen Sie das Verzeichnis für die Ausgabe und legen Sie das gewünschte Dateiformat auf mzML fest und verwenden Sie dann den Wavelet-basierten Algorithmus auf den Massenspektrometriestufen eins und zwei, um einen Peak-Picking-Filter auszuwählen und die Konvertierung zu starten. Erstellen Sie für die Proteinquantifizierung eine neue Historie, und ziehen Sie die zuvor erstellte Datenbank in die neue Historie. Klicken Sie auf Hochladen, um die transformierte mzML-Datendatei zu importieren.
Öffnen Sie die Workflowseite, klicken Sie erneut auf Hochladen, um den gewünschten Workflow zu importieren, und wählen Sie Workflow ausführen aus, um die verschiedenen Parameter zu überprüfen. Wählen Sie die importierte mzML-Datendatei aus und geben Sie die zuvor erstellte Datenbank als Fasta-Datenbankdatei ein. Da der Workflow verwendet die X!
Tandem-Suchmaschine, klicken Sie auf Hochladen, um das X zu importieren! Tandem-Standardkonfigurationsdatei. Um die erhebliche Vergrößerung bei der Verwendung der gesamten OpenProt databse zu berücksichtigen, verwenden Sie eine strenge falsche Erkennungsrate.
Führen Sie zur Qualitätskontrolle das Dateiinfo-Tool auf der ID-Filterausgabe aus, um allgemeine Leistungsmetriken bereitzustellen, z. B. die Anzahl der Peptidspektrumübereinstimmungen oder die Anzahl der identifizierten Peptide und Proteine. Kehren Sie zum OpenProt-Datenbankmining zur OpenProt-Website zurück, und öffnen Sie die Suchseite. Klicken Sie auf die Arten, für die das Protein identifiziert wurde, und geben Sie die Protein-Beitrittsnummer in das Proteinabfragefeld ein.
Klicken Sie auf Überspannung, und es wird eine Tabelle mit grundlegenden Informationen für das abgefragte Protein angezeigt. Klicken Sie als Nächstes auf den Link "Details". Die neu geöffnete Seite enthält einen Genombrowser, der sich auf das abgefragte Protein konzentriert, sowie weitere Informationen.
Um Protein- oder DNA-Sequenzen zu erhalten, klicken Sie auf die Protein- oder DNA-Links aus den Info-Registerkarten bzw. klicken Sie auf die Registerkarten, um die detaillierten Informationen über den Nachweis des Ribosomen-Profilierungsnachweises für Massenspektrometrie und die Konservierung und die Identifizierung von Proteindomänen zu durchsuchen. In dieser repräsentativen Analyse wurden die meisten der im Originalpapier identifizierten Proteine auch mit dem OpenProt-2_pep oder der OpenProt_all-Datenbank identifiziert, was zeigt, dass OpenProt-Datenbanken in der Lage sind, Proteinidentifikation und -quantifizierung zu erzeugen, die mit denen der aktuellen Verfahren auf der Grundlage der InterPro KB-Datenbanken vergleichbar sind. 11 gut unterstützte Proteine, die derzeit noch nicht in Datenbanken mit Anmerkungen gekennzeichnet sind, wurden in allen Datensätzen mit selbstbewussten Peptiden mit der OpenProt-2_pep-Datenbank identifiziert.
29 neuartige Proteine wurden in allen Datensätzen mit selbstbewussten Peptiden mit Hilfe der OpenProt_all-Datenbank entdeckt. Die empfohlene strenge falsche Entdeckungsrate hatte keinen Einfluss auf die sichersten Proteinidentifikationen, obwohl sie die Gesamtzahl der identifizierten Proteine verringerte. Ein neuartiges Protein wurde als Interaktor des Raf-1-Proteins entdeckt.
Diese Proteine waren zuvor nicht durch Massenspektrometrie oder Ribosomenprofilierung nachgewiesen worden und zeigten ein qualitativ hochwertiges Spektrum. Denken Sie daran, sicherzustellen, dass die ausgewählten Parameter dem experimentellen Design entsprechen, und überprüfen Sie immer die Qualität der sportlichen Beweise, wenn sie neuartige Proteinfunde melden. Dieses Protokoll ist an alle Top-Down-Proteomik-Experimente angepasst, insbesondere bei Verwendung mit funktioneller Proteomik.
Dies wird ein viel tiefes Screening und Verständnis von Protein-Wechselwirkungen und zellulären Bahnen ermöglichen. OpenProt hebt die erhebliche Unterschätzung der protomischen Landschaft hervor, die durch aktuelle genomische Notationen vermittelt wird, und betont die polysystronische Natur eukaryotischer Gene. Es ist ein ganz neuer Weg für die Forschung.
Das Schöne an diesem Protokoll ist, dass es keine umfangreichen bioinformatischen Fähigkeiten erfordert und dass es, da es entfernte Server verwendet, auf jedem Computer ausgeführt werden kann.