OpenProt è il primo database che consente un'annotazione polisystronica di genomi eucarioti, riconosce il potenziale codificante dei proto-geni e consente la scoperta di proteine precedentemente non rilevabili. Abbiamo progettato questo protocollo in modo che sia accessibile a tutti gli utenti senza richiedere ampie competenze bioinformatiche, essenzialmente mette le scoperte proteomiche alla portata di chiunque. Per comprendere e affrontare le sfide odierne in medicina, dobbiamo comprendere appieno il paesaggio proteomico e tutti gli attori e le loro dinamiche.
OpenProt offre questa possibilità. Anche se qui, OpenProt viene utilizzato per l'analisi di esperimenti patonomici, può anche essere utilizzato con altri sistemi in quanto fornisce semplicemente una definizione più chiara del proteoma. Inizia aprendo il sito Web OpenProt e usando il link dal menu della pagina superiore per aprire la pagina dei download.
Fare clic sulle specie di interesse in base ai dati sperimentali delle analisi e al tipo di proteina desiderato. Fate clic su AllProts, Isoforms e RefProds per generare file contenenti tutti i tipi di proteine noti e nuovi presenti nel database OpenProt e, se disponibili, fate clic sull'annotazione da cui vengono disegnate le sequenze proteiche. Clicca sul livello di prove a supporto necessarie per la considerazione delle proteine in base all'obiettivo di ricerca.
Quindi fare clic su Tutti i file previsti per generare file contenenti tutte le previsioni OpenProt e fare clic sul formato di file desiderato da scaricare. Per gli anayses proteomici, selezionare il file proteico FASTA. Il file readme conterrà tutte le informazioni necessarie sul formato di file.
Per la gestione del database, accedere a un'istanza appropriata dello strumento di proteomica e creare una nuova cronologia. Per importare il database OpenProt scaricato, fare clic su Carica. Per immettere il flusso di lavoro di gestione del database, passare alla pagina del flusso di lavoro, fare di nuovo clic su Carica e quindi su Esegui flusso di lavoro.
Selezionare quindi il database OpenProt importato come input e rinominare il file Fasta ottenuto in qualcosa di significativo. La base di dati è pronta per essere utilizzata per le analisi proteomiche. Per la preparazione di file di spettrometria di massa, aprire lo strumento di conversione MS liberamente disponibile dalla suite proteo wizard e caricare il file di dati da analizzare.
Selezionate la directory per l'output e impostate il formato di file desiderato su mzML, quindi utilizzate l'algoritmo basato su wavelet sui livelli di spettrometria di massa uno e due per selezionare un filtro di prelievo di picco e avviare la conversione. Per la quantificazione delle proteine, creare una nuova cronologia e trascinare e rilasciare il database creato in precedenza nella nuova cronologia. Fare clic su Carica per importare il file di dati mzML trasformato.
Aprire la pagina del flusso di lavoro, fare di nuovo clic su Carica per importare il flusso di lavoro desiderato e selezionare Esegui flusso di lavoro per esaminare i diversi parametri. Selezionare il file di dati mzML importato e immettere il database creato in precedenza come file Fasta del database. Poiché il flusso di lavoro utilizza la X!
Motore di ricerca tandem, fare clic su Carica per importare la X! File di configurazione predefinito tandem. Per tenere conto del notevole aumento delle dimensioni quando si utilizza l'intero databse OpenProt utilizzare un rigoroso tasso di individuazione falso.
Per il controllo qualità, eseguire lo strumento di informazioni sui file sull'output del filtro ID per fornire metriche comuni delle prestazioni, come il numero di corrispondenze dello spettro peptidico o il numero di peptidi e proteine identificati. Per il mining di database OpenProt, tornare al sito Web OpenProt e aprire la pagina di ricerca. Fare clic sulle specie di interesse per le quali la proteina è stata identificata e inserire il numero di adesione della proteina nella casella di interrogazione proteine.
Fare clic su surge e apparirà una tabella contenente le informazioni di base per la proteina interrogata. Fare quindi clic sul collegamento dettagli. La pagina appena aperta conterrà un browser del genoma incentrato sulla proteina interrogata, così come altre informazioni.
Per ottenere sequenze proteiche o di DNA, fare clic sui collegamenti proteine o DNA dalle schede delle informazioni, rispettivamente Quindi fare clic sulle schede per sfogliare le informazioni dettagliate sul rilevamento della profilazione ribosoma delle prove di spettrometria di massa e sui domini proteici di conservazione e identificati. In questa analisi rappresentativa, la maggior parte delle proteine identificate nel documento originale sono state identificate anche utilizzando il 2_pep OpenProt o il database OpenProt_all, dimostrando che le banche dati OpenProt sono in grado di produrre identificazione e quantificazione proteica paragonabili a quella delle procedure attuali basate sui database InterPro KB. 11 proteine ben supportate non ancora annotate nei database sono state identificate in tutti i set di dati con peptidi sicuri utilizzando il database OpenProt 2_pep database.
29 nuove proteine sono state scoperte in tutti i set di dati con peptidi sicuri utilizzando il OpenProt_all database. Il rigoroso tasso di scoperta falso raccomandato non ha influenzato le identificazioni proteiche più sicure, sebbene abbia diminuito il numero totale di proteine identificate. Una nuova proteina è stata scoperta come interagente della proteina Raf-1.
Queste proteine non erano state precedentemente rilevate dalla spettrometria di massa o dal profilo ribosoma e dimostravano uno spettro di buona qualità. Ricordarsi di garantire che i parametri selezionati siano adeguati al progetto sperimentale e verificare sempre la qualità delle prove sportive quando si riportano nuove scoperte proteiche. Questo protocollo è adattabile a tutti gli esperimenti di proteomica dall'alto verso il basso, in particolare se usato con proteomica funzionale.
Ciò consentirà uno screening e una comprensione molto profondi delle interazioni proteiche e delle vie cellulari. OpenProt evidenzia la sostanziale sottovalutazione del paesaggio protomico trasmesso dalle attuali notazioni genomiche e sottolinea la natura polisytronica dei geni eucarioti. Si tratta di una via completamente nuova per la ricerca.
Il bello di questo protocollo è che non richiede ampie competenze bioinformatiche e che poiché utilizza server distanti, può essere eseguito su qualsiasi computer.