Для начала запустите новый сеанс Jupyter Notebook, открыв новое окно терминала и введя команду Jupyter Notebook. Затем нажмите Enter. На домашней странице записной книжки Jupyter Notebook выберите записную книжку с именем M01 expression data pre-processing.
ipynb, чтобы открыть его в новой вкладке браузера. Эта записная книжка будет нормализовать и масштабировать входные данные, обрабатывать недостающие данные и удалять выбросы. Во второй ячейке блокнота замените заполнитель your_dataset_name.
csv с фактическим именем файла набора данных. В последней ячейке блокнота замените M01_output_data. csv с предпочтительным именем для файла выходных данных.
Для каждого типа данных, таких как протеомика, метаболомика, непрерывные клинические данные и двоичные клинические данные, используйте команду в четвертой ячейке, чтобы определить индексы, соответствующие первому и последнему столбцам. Проверьте названия столбцов, чтобы найти столбцы, соответствующие данным протеомики, метаболомике и клиническим данным. Укажите позиции столбцов для различных типов данных в пятой ячейке, заменив col_start и col_end индексами первого и последнего столбцов для каждого типа данных.
Выберите «Ячейка», затем «Запустить все» в строке меню Jupyter, чтобы создать файл выходных данных в указанной папке.