Comience agregando todos los conjuntos de datos de entrada multiómicos a la carpeta de datos de entrada. Aquí contienen datos de pacientes con síndromes coronarios estables, crónicos y agudos. Para preprocesar los datos, haga clic en el símbolo de la carpeta y, a continuación, haga doble clic en el mofa_workflow scripts y configuraciones para acceder a la carpeta de configuración.
Haga doble clic en el archivo CSV de configuración de datos para abrirlo. En la columna de valor, introduzca las rutas de acceso a las carpetas de datos de entrada y resultados. En la columna nombre-valor de configuración, especifique el nombre que se agregará como extensión de archivo para todos los archivos guardados.
Para guardar los cambios, seleccione Archivo y Guardar archivo CSV en el menú de la parte superior. Luego, usando el menú de navegación en el lado izquierdo, haga clic en scripts para ir a la carpeta de scripts. Haga doble clic en 00_Configuration_Update.
ipynb para abrir el cuaderno de inicialización. Para ejecutar el script, haga clic en el botón Reiniciar kernel y ejecutar todas las celdas en la parte superior y, a continuación, haga clic en Reiniciar en la ventana emergente. Para navegar a la carpeta de configuraciones, haga doble clic en configuraciones.
A continuación, haga doble clic en 01_Pre_Processing_SC_Data. csv para abrir el archivo. Verifique los valores completados automáticamente, seleccione Archivo y Guardar archivo CSV en el menú de la parte superior para guardar los cambios.
A continuación, utilice el menú de navegación de la izquierda y haga clic en scripts para navegar a la carpeta de scripts. Haga doble clic en 01_Prepare_Pseudobulk. ipynb para abrir el bloc de notas.
Para ejecutar el script, haga clic en el botón Reiniciar kernel y ejecutar todas las celdas en la parte superior y, a continuación, haga clic en Reiniciar en la ventana emergente. Para navegar a la carpeta de figuras, haga doble clic primero en figuras y luego en 01_figures. Abra el gráfico recién generado, FIG01_Amount_of_Cells vista general.
A continuación, examine la gráfica para identificar los grupos de tipos de células con un número muy bajo de células por muestra. Anote los nombres de esos identificadores de clúster para excluirlos en los pasos siguientes. Para volver a la carpeta de configuración, haga clic en los puntos y haga doble clic en las configuraciones.
A continuación, abra el archivo 02_Pre_Processing_Configuration_SC.csv. Agregue todos los ID de clúster identificados para la exclusión en el paso anterior, separados por comas en la columna cell_type_exclusion. Para guardar los cambios, seleccione Archivo y Guardar archivo CSV en el menú de la parte superior.
Ahora abra el archivo 02_Pre_Processing_Configuration. CSV y ajuste la configuración de preprocesamiento para cada conjunto de datos incluido y almacenado en la carpeta de entrada de datos. Ajuste los parámetros de las columnas según sea necesario en función de los pasos de preprocesamiento que se deban aplicar.
Guarde los cambios seleccionando Archivo y Guardar archivo CSV. Para navegar a la carpeta de scripts, haga clic en scripts. Abra el bloc de notas 02_Integrate_and_Normalize_Data_Sources.ipynb.
Haga clic en el botón Reiniciar kernel y ejecutar todas las celdas en la parte superior y luego haga clic en Reiniciar en la ventana emergente. A continuación, navegue hasta la carpeta de 02_results generada. Haga clic en el símbolo de la carpeta, luego haga doble clic en resultados y 02_results.
Verifique que incluya el 02_Combined_Data de archivo, el nombre de la configuración, el CSV INTEGRADO que contiene el archivo de entrada de datos de preproceso combinado.