Para começar, inicie uma nova sessão do Jupyter Notebook abrindo uma nova janela do terminal e digitando Jupyter Notebook. Em seguida, pressione Enter. Na página inicial do Jupyter Notebook, selecione o bloco de anotações intitulado Pré-processamento de dados de expressão M01.
ipynb para abri-lo em uma nova guia do navegador. Este bloco de anotações normalizará e dimensionará os dados de entrada, manipulará dados ausentes e removerá valores atípicos. Na segunda célula do bloco de anotações, substitua o espaço reservado your_dataset_name.
CSV com o nome real do arquivo de conjunto de dados. Na última célula do bloco de anotações, substitua M01_output_data. CSV com o nome preferencial para o arquivo de dados de saída.
Para cada tipo de dados, como proteômica, metabolômica, dados clínicos contínuos e dados clínicos binários, use o comando na quarta célula para determinar os índices correspondentes à primeira e à última coluna. Verifique os nomes das colunas para localizar as colunas correspondentes aos dados proteômicos, dados metabolômicos e dados clínicos. Especifique as posições de coluna para diferentes tipos de dados na quinta célula substituindo col_start e col_end pelos índices da primeira e da última coluna para cada tipo de dados.
Selecione Célula e, em seguida, Executar Tudo na barra de menus do Jupyter para criar o arquivo de dados de saída na pasta especificada.