Para comenzar, inicie una nueva sesión de Jupyter Notebook abriendo una nueva ventana de terminal y escribiendo Jupyter Notebook. A continuación, pulse Intro. En la página principal de Jupyter Notebook, seleccione el cuaderno titulado Preprocesamiento de datos de expresión M01.
ipynb para abrirlo en una nueva pestaña del navegador. Este cuaderno normalizará y escalará los datos de entrada, controlará los datos que faltan y eliminará los valores atípicos. En la segunda celda del bloc de notas, reemplace el marcador de posición your_dataset_name.
csv con el nombre real del archivo del conjunto de datos. En la última celda del bloc de notas, reemplace M01_output_data. csv con el nombre preferido para el archivo de datos de salida.
Para cada tipo de datos, como proteómica, metabolómica, datos clínicos continuos y datos clínicos binarios, utilice el comando de la cuarta celda para determinar los índices correspondientes a la primera y la última columna. Compruebe los nombres de las columnas para localizar las columnas correspondientes a los datos proteómicos, los datos metabolómicos y los datos clínicos. Especifique las posiciones de columna para los diferentes tipos de datos en la quinta celda reemplazando col_start y col_end por los índices de la primera y la última columna de cada tipo de datos.
Seleccione Celda y, a continuación, Ejecutar todo en la barra de menús de Jupyter para crear el archivo de datos de salida en la carpeta especificada.