Para empezar, cree un nuevo entorno virtual denominado Modelo de mantenimiento con la versión 3.7 de Python. En la plataforma de supercomputación del clúster Slurm, ejecute el módulo Load Anaconda Command. Una vez que se ejecuta el comando, aparece un mensaje de confirmación en la pantalla.
Ingrese Y para continuar y espere a que se complete el proceso. A continuación, active el entorno virtual siguiendo las instrucciones específicas de la plataforma. A continuación, ejecute el comando para instalar PyTorch 1.13.1.
Instale paquetes adicionales para la geometría de la antorcha, como torch_scatter, torch_sparse, torch_cluster y torch_spline_convulsion, siguiendo las instrucciones de instalación. A continuación, instale el paquete geométrico de la antorcha versión 2.2.0. Descargue el código y el modelo de salud previamente entrenado desde el sitio web del Laboratorio de Informática de la Salud.
Descomprima el archivo a la ruta deseada. A continuación, cambie el directorio de trabajo de la línea de comandos a la carpeta mqTrans del modelo de salud. Ejecute el comando para generar características mqTrans y obtener las salidas.
Las entidades mqTrans se generarán como CSV de destino MQ de salida y el archivo de etiqueta se volverá a guardar como CSV de etiqueta de salida. Además, los valores de expresión originales de los genes de ARNm se extraerán como objetivos de prueba de salida de archivo CSV. A continuación, utilice el algoritmo de selección de características para seleccionar las características de mqTrans.
Si selecciona características mqTrans o características originales sin combinarlas, establezca Combinar en false. Seleccione 800 entidades originales y divida el conjunto de datos en 0,8 a 0,2 para el entrenamiento y las pruebas. Para combinar las características de mqTrans con los valores de expresión originales para la selección de características, establezca combine en true.
Se identificaron biomarcadores oscuros con valores diferenciales de mqTrans, pero expresión no diferencial de ARNm. Entre 3062 características, se detectaron 221 biomarcadores oscuros. La escasez general de biomarcadores oscuros se observó en comparación con los biomarcadores tradicionales en la mayoría de los tipos de cáncer, excepto BRCA, MESO y TGCT.