OpenProt es la primera base de datos que permite una anotación polisinstrónica de genomas eucariotas, reconoce el potencial de codificación de los proto genes y permite el descubrimiento de proteínas previamente indetectables. Hemos diseñado este protocolo para que sea accesible a todos los usuarios sin necesidad de amplias habilidades bioinformáticas Esencialmente pone descubrimientos proteómicos a disposición de cualquier persona. Para comprender y abordar los desafíos actuales en la medicina, necesitamos comprender plenamente el panorama proteómico y todos los actores y sus dinámicas.
OpenProt ofrece esa posibilidad. Aunque aquí, OpenProt se utiliza para el análisis de experimentos patonómicos, también se puede utilizar con otros sistemas, ya que simplemente proporciona una definición más clara del proteome. Comience abriendo el sitio web de OpenProt y utilizando el enlace del menú de la página superior para abrir la página de descargas.
Haga clic en las especies de interés en función de los datos experimentales de los análisis y el tipo de proteína deseado. Haga clic en AllProts, Isoforms y RefProds para generar archivos que contengan todos los tipos de proteínas conocidos y novedosos presentes en la base de datos OpenProt y, si está disponible, haga clic en la anotación desde la que se dibujan las secuencias de proteínas. Haga clic en el nivel de evidencia de apoyo necesaria para la consideración de la proteína de acuerdo con el objetivo de investigación.
A continuación, haga clic en todo lo que se predijo para generar archivos que contienen todas las predicciones de OpenProt y haga clic en el formato de archivo deseado para descargar. Para análisis proteómicos, seleccione el archivo de proteína FASTA. El archivo Léame contendrá toda la información necesaria en el formato de archivo.
Para el control de bases de datos, inicie sesión en una instancia de herramienta proteómica adecuada y cree un nuevo historial. Para importar la base de datos OpenProt descargada, haga clic en Cargar. Para introducir el flujo de trabajo de control de base de datos, vaya a la página de flujo de trabajo, haga clic en Cargar de nuevo y haga clic en Ejecutar el flujo de trabajo.
A continuación, seleccione la base de datos OpenProt importada como entrada y cambie el nombre del archivo Fasta obtenido a algo significativo. La base de datos está lista para ser utilizada para análisis proteómicos. Para la preparación de archivos de espectrometría de masas, abra la herramienta de conversión de MS disponible libremente desde la suite de asistentes de proteo y cargue el archivo de datos que se va a analizar.
Seleccione el directorio para la salida y establezca el formato de archivo deseado en mzML y, a continuación, utilice el algoritmo basado en wavelet en los niveles de espectrometría de masas uno y dos para seleccionar un filtro de selección de pico e iniciar la conversión. Para la cuantificación de proteínas, cree un nuevo historial y arrastre y suelte la base de datos creada anteriormente en el nuevo historial. Haga clic en Cargar para importar el archivo de datos mzML transformado.
Abra la página de flujo de trabajo, haga clic en Cargar de nuevo para importar el flujo de trabajo deseado y seleccione Ejecutar el flujo de trabajo para revisar los diferentes parámetros. Seleccione el archivo de datos mzML importado e introduzca la base de datos creada anteriormente como el archivo Fasta de la base de datos. Dado que el flujo de trabajo utiliza la X!
Motor de búsqueda en tándem, haga clic en Cargar para importar la X! Archivo de configuración predeterminado tándem. Para tener en cuenta el aumento sustancial de tamaño al usar toda la databse de OpenProt, utilice una tasa de detección falsa estricta.
Para el control de calidad, ejecute la herramienta de información de archivos en la salida del filtro ID para proporcionar métricas comunes de rendimiento, como el número de coincidencias de espectro de péptidos o el número de péptidos y proteínas identificados. Para la minería de bases de datos OpenProt, vuelva al sitio web de OpenProt y abra la página de búsqueda. Haga clic en las especies de interés para las que se identificó la proteína e introduzca el número de adhesión a proteínas en el cuadro de consulta de proteínas.
Aparecerá una oleada de clics y aparecerá una tabla que contiene información básica para la proteína consultada. A continuación, haga clic en el vínculo de detalles. La página recién abierta contendrá un navegador del genoma que se centra en la proteína consultada, así como otra información.
Para obtener secuencias de proteínas o ADN, haga clic en los enlaces de proteína o ADN de las pestañas de información, respectivamente, luego haga clic en las pestañas para examinar la información detallada sobre la evidencia de espectrometría de masas evidencia la detección de perfiles ribosomas, y la conservación y los dominios de proteína identificados. En esta anólisis representativa, la mayoría de las proteínas identificadas en el documento original también se identificaron utilizando la base de datos OpenProt 2_pep o OpenProt_all, lo que muestra que las bases de datos OpenProt son capaces de producir identificación y cuantificación de proteínas comparables a las de los procedimientos actuales basados en las bases de datos InterPro KB. 11 proteínas bien soportadas que aún no están anotadas en bases de datos se identificaron en todos los conjuntos de datos con péptidos seguros utilizando la base de datos OpenProt 2_pep.
Se descubrieron 29 proteínas novedosas en todos los conjuntos de datos con péptidos seguros utilizando la base de datos OpenProt_all. La estricta tasa de descubrimiento falso recomendada no afectó a las identificaciones proteicas más seguras, aunque disminuyó el número total de proteínas identificadas. Una proteína novedosa fue descubierta como un interactor de la proteína Raf-1.
Estas proteínas no habían sido detectadas previamente por espectrometría de masas o perfiles ribosos y demostraron un espectro de buena calidad. Recuerde asegurarse de que los parámetros seleccionados son adecuados para el diseño experimental y siempre verificar la calidad de la evidencia deportiva al reportar nuevos descubrimientos de proteínas. Este protocolo es adaptable a todos los experimentos proteómicos de arriba hacia abajo, especialmente cuando se utiliza con proteómica funcional.
Esto permitirá un análisis y comprensión mucho profundos de las interacciones proteicas y las vías celulares. OpenProt destaca la subestimación sustancial del paisaje protomático retransmitido por las notaciones genómicas actuales y enfatiza la naturaleza polisystrónica de los genes eucariotas. Es una nueva vía para la investigación.
La belleza de este protocolo es que no requiere amplias habilidades bioinformáticas y que como utiliza servidores distantes, se puede ejecutar en cualquier ordenador.