Esta medida puede ayudar a responder preguntas clave en el campo de la detección biomédica sobre la generación de múltiples soluciones. La principal ventaja de esta técnica es que proporciona una interfaz gráfica de usuario fácil de usar para ayudar a los investigadores biomédicos en la detección de múltiples características disminuye. Comience cargando la matriz de datos y las etiquetas de clase en el software.
Haga clic en cargar matriz de datos para seleccionar el archivo de métricas de datos especificado por el usuario y cargar etiquetas de clase para seleccionar el archivo de etiqueta de clase correspondiente. Para determinar las etiquetas de clase en el número de entidades de clasificación superior, seleccione los nombres de las clases positivas y negativas en los cuadros desplegables adecuados y seleccione 10 como el número de entidades de clasificación superior en el cuadro desplegable X superior para una pantalla completa del subconjunto de entidades. Para ajustar los parámetros del sistema para diferentes prestaciones, seleccione la precisión de la medición de rendimiento como el cuadro desplegable de precisión equilibrada de precisión para el clasificador de máquina de aprendizaje extremo seleccionado.
A continuación, seleccione un valor de corte de 0,7 para la medición de rendimiento especificada en el cuadro de entrada de corte de rendimiento. Para ejecutar la canalización, haga clic en analizar y seleccione 0,7 como valor predeterminado del corte de medición de rendimiento. Y, 10 como el número predeterminado de los mejores subconjuntos de características.
A continuación, recopile e interprete las características detectadas por el software. Para generar un gráfico de dispersión 3D de las 10 entidades principales de los subconjuntos con los mejores rendimientos de clasificación detectados por el software, haga clic en analizar y ordenar las tres entidades de un subconjunto de entidades en orden ascendente de sus rangos, utilizando los rangos de las tres entidades como los ejes F1, F2 y F3. Cambie el valor de corte de rendimiento a 0,7 y haga clic en analizar para generar un gráfico de dispersión 3D de los subconjuntos de entidades con un valor de medición de rendimiento mayor o igual que el rendimiento.
A continuación, haga clic en Ajuste 3D para abrir una nueva ventana para ajustar manualmente los ángulos de visión de la gráfica de dispersión 3D y reducir para reducir la redundancia de los subconjuntos de entidades detectados. Para anotar un gen en los niveles de secuencia de ADN y proteínas, abra la página web de la base de datos David y haga clic en el enlace de conversión de ID de gen para introducir los ID de entidad del primer subconjunto de biomarcadores del conjunto de datos preparado. Haga clic en el vínculo de la lista de genes y haga clic en Enviar lista para recuperar las anotaciones de interés y mostrar la lista de genes para obtener la lista de símbolos gene.
A continuación, abra la página web de la base de datos GeneCards e introduzca el nombre del gen de interés en el cuadro de entrada de consulta de base de datos para encontrar las anotaciones de este gen. Abra la base de datos Online Mendelian Inheritance in Man y busque el gen para encontrar las anotaciones de este gen de la base de datos. Para anotar las proteínas codificadas, abra la página de la base de datos de la base de conocimiento UniProt y busque las anotaciones del gen de esta base de datos.
Abra el sistema de predicción basado en grupos, o servidor web GPS, y recupere la secuencia de proteínas codificada por el gen del biomarcador de la base de datos de la base de datos de conocimiento UniProt y utilice la herramienta GPS en línea para predecir los residuos de modificación posteriores a la transición de las proteínas. Para anotar las interacciones proteína-proteína y los módulos funcionales enriquecidos, abra la página del servidor web de cadenas y utilice la base de datos de cadenas para buscar en la elevación los genes de interés para encontrar sus propiedades orquestadas. Para exportar los subconjuntos de biomarcadores detectados para su análisis posterior, haga clic en exportar la tabla y seleccione el formato de texto adecuado para guardar los archivos.
A continuación, exporte los trazados de visualización como archivos de imagen individuales, haciendo clic en Guardar debajo de cada trazado y seleccionando el formato de imagen adecuado para guardar cada archivo. En este experimento representativo, dos conjuntos de datos se formatearon como archivos CSV y se cargaron en el software como se ha demostrado. En el primer conjunto de datos, se cargaron 128 muestras con 12. 625 entidades y etiquetas de clase individuales con la Matriz de datos final que contiene 95 muestras negativas y 33 muestras positivas.
También se llevaron a cabo operaciones similares para el segundo conjunto de datos difíciles. La búsqueda de una palabra clave específica del usuario en los nombres de entidad revela un histograma de las entidades de cada conjunto de datos. Después de ejecutar el algoritmo de canalización para cada conjunto de datos, se detectaron 120 subconjuntos de biomarcadores calificados para el conjunto de datos fácil de discriminar, con 57 subconjuntos de biomarcadores de triplete que demostraron una precisión del 100%.
Sin embargo, solo se detectaron 76 subconjuntos de biomarcadores para el conjunto de datos difícil. Y, con una menor precisión de subconjunto de biomarcadores que sugiere que los biomarcadores son específicos del fenotipo, otro desafío importante en la detección de biomarcadores. Al usar este procedimiento, es importante recordar que un problema de selección futuro tiene varias soluciones.
Lea la mejor tarjeta SIM de rendimiento. Después de su desarrollo, esta técnica allanó el camino para que los investigadores biomédicos exploraran la detección biomédica con múltiples soluciones.