OpenProt is de eerste database die een polysystronic annotatie van eukaryotische genomen mogelijk maakt, het coderingspotentieel van proto-genen herkent en de ontdekking van voorheen niet-detecteerbare eiwitten mogelijk maakt. We hebben dit protocol zo ontworpen dat het toegankelijk is voor alle gebruikers zonder dat uitgebreide bio-informatica vaardigheden Het plaatst in wezen proteomische ontdekkingen binnen de greep van iemand. Om de huidige uitdagingen in de geneeskunde te begrijpen en aan te pakken, moeten we het proteomische landschap en alle actoren en hun dynamiek volledig begrijpen.
OpenProt biedt die mogelijkheid. Hoewel hier, OpenProt wordt gebruikt voor de analyse van patonomische experimenten, het kan ook worden gebruikt met andere systemen als het biedt gewoon een meer duidelijke definitie van het proteoom. Begin met het openen van de OpenProt-website en het gebruik van de link vanuit het bovenste paginamenu om de downloadpagina te openen.
Klik op de soorten die van belang zijn op basis van de experimentele gegevens van de analyses en het gewenste eiwittype. Klik op AllProts, Isoforms en RefProds om bestanden te genereren met alle bekende en nieuwe eiwittypen die aanwezig zijn in de OpenProt-database en klik indien beschikbaar op de annotatie waaruit de eiwitsequenties worden getrokken. Klik op het niveau van ondersteunend bewijs dat nodig is voor de eiwitoverweging volgens de onderzoeksdoelstelling.
Klik vervolgens op alle voorspelde bestanden met alle OpenProt-voorspellingen en klik op de gewenste bestandsindeling om te downloaden. Selecteer voor proteomische anayses het FASTA-eiwitbestand. Het leesme-bestand bevat alle benodigde informatie in de bestandsindeling.
Log in op een geschikte instantie voor proteomics-gereedschap en maak een nieuwe geschiedenis voor databaseverwerking. Als u de gedownloade OpenProt-database wilt importeren, klikt u op Uploaden. Als u de werkstroom voor databaseafhandeling wilt invoeren, gaat u naar de werkstroompagina, klikt u nogmaals op Uploaden en klikt u op De werkstroom uitvoeren.
Selecteer vervolgens de geïmporteerde OpenProt-database als invoer en wijzig het verkregen Fasta-bestand in iets zinvols. De database is klaar om te worden gebruikt voor proteomics analyses. Open voor de voorbereiding van massaspectrometriebestanden de vrij beschikbare MS-convertertool vanuit de proteo-wizardsuite en upload het te analyseren gegevensbestand.
Selecteer de map voor de uitvoer en stel de gewenste bestandsindeling in op mzML en gebruik het op basis van het wavelet gebaseerde algoritme op massaspectrometrieniveaus één en twee om een piekpickingfilter te selecteren en de conversie te starten. Maak voor eiwitkwantificering een nieuwe geschiedenis en sleep en drop de eerder gemaakte database in de nieuwe geschiedenis. Klik op Uploaden om het getransformeerde mzML-gegevensbestand te importeren.
Open de werkstroompagina, klik nogmaals op Uploaden om de gewenste werkstroom te importeren en selecteer de werkstroom om de verschillende parameters te controleren. Selecteer het geïmporteerde mzML-gegevensbestand en voer de eerder gemaakte database in als het Fasta-databasebestand. Aangezien de workflow gebruik maakt van de X!
Tandem zoekmachine, klik op Uploaden om de X te importeren! Tandem standaardconfiguratiebestand. Om rekening te houden met de aanzienlijke toename in omvang bij het gebruik van de hele OpenProt databse gebruik maken van een strenge false discovery rate.
Voer voor kwaliteitscontrole het hulpprogramma bestandsgegevens uit op de id-filteruitvoer om algemene prestatiestatistieken te bieden, zoals het aantal peptidespectrumovereenkomsten of het aantal geïdentificeerde peptiden en eiwitten. Voor OpenProt database mining, terug te keren naar de OpenProt website en open de zoekpagina. Klik op de soorten waarvoor het eiwit is geïdentificeerd en voer het eiwittoetredingsnummer in de eiwitquerybox in.
Klik op piek en er verschijnt een tabel met basisinformatie voor het opgevraagde eiwit. Klik vervolgens op de koppeling Details. De nieuw geopende pagina bevat een genoombrowser die is gecentreerd op het opgevraagde eiwit, evenals andere informatie.
Om eiwit- of DNA-sequenties te verkrijgen, klikt u op de eiwit- of DNA-koppelingen van respectievelijk de infotabbladen, respectievelijk klik vervolgens op de tabbladen om door de gedetailleerde informatie over de massaspectrometriebewijs te bladeren, ribosoom profileringsdetectie en conserverings- en geïdentificeerde eiwitdomeinen. In deze representatieve anlyse werden de meeste in het oorspronkelijke papier geïdentificeerde eiwitten ook geïdentificeerd met behulp van de OpenProt-2_pep of de OpenProt_all-database, waaruit blijkt dat OpenProt-databases in staat zijn om eiwitidentificatie en kwantificering te produceren die vergelijkbaar is met die van de huidige procedures op basis van de InterPro KB-databases. 11 goed ondersteunde eiwitten die nog niet zijn geannoteerd in databases werden geïdentificeerd in alle datasets met zelfverzekerde peptiden met behulp van de OpenProt 2_pep database.
29 nieuwe eiwitten werden ontdekt in alle datasets met zelfverzekerde peptiden met behulp van de OpenProt_all database. De aanbevolen strenge false discovery rate had geen invloed op de meest zelfverzekerde eiwitidentificaties, hoewel het het totale aantal geïdentificeerde eiwitten wel daalde. Een nieuw eiwit werd ontdekt als een interactor van de Raf-1 eiwit.
Deze eiwitten waren niet eerder ontdekt door massaspectrometrie of ribosoomprofilering en toonden een goed kwaliteitsspectrum aan. Vergeet niet om ervoor te zorgen dat de geselecteerde parameters zijn geschikt voor het experimentele ontwerp en controleer altijd de kwaliteit van het sportbewijs bij het melden van nieuwe eiwit ontdekkingen. Dit protocol is aanpasbaar aan alle top-down proteomics experimenten met name bij gebruik met functionele proteomics.
Dit zal veel diepe screening en begrip van eiwit interacties en cellulaire trajecten mogelijk te maken. OpenProt benadrukt de aanzienlijke onderschatting van het protomische landschap doorgegeven door de huidige genomische notaties en benadrukt de polysystronic aard van eukaryotische genen. Het is een hele nieuwe weg voor onderzoek.
Het mooie van dit protocol is dat het geen uitgebreide bio-informaticavaardigheden vereist en dat omdat het verre servers gebruikt, het op elke computer kan worden uitgevoerd.