Для начала на главной странице блокнота Jupyter нажмите на оптимизацию модели M02-DeepOmicsAE. ipynb notebook, чтобы открыть его в новой вкладке. Во второй ячейке записной книжки введите имя выходного файла, сгенерированного при предварительной обработке данных, вместо M01_output_data.csv.
В пятой ячейке укажите позиции столбцов для различных типов данных, таких как данные протеомики, данные метаболомики, клинические данные и все данные молекулярной экспрессии. Замените col_start и col_end соответствующими индексами столбцов для каждого типа данных. Укажите имя столбца, содержащего целевую переменную, вместо y_column_name в качестве y_label.
В шестой ячейке определите количество раундов для оптимизации модели, присвоив значение n_comb. Большее количество раундов оптимизации поможет точно настроить параметры модели и повысить производительность модели, но мы также увеличим время обработки. Запустите блокнот, выбрав «Ячейка», а затем «Запустить все» в строке меню.
Чтобы реализовать рабочий процесс, нажмите на реализацию M03a-DeepOmicsAE с пользовательскими оптимизированными параметрами. ipynb notebook на главной странице Jupyter notebook. Во второй ячейке записной книжки введите имя выходного файла, сгенерированного при предварительной обработке данных, вместо M01_output_data.csv.
В пятой ячейке укажите позиции столбцов для различных типов данных, таких как данные протеомики, данные метаболомики, клинические данные и все данные молекулярной экспрессии. Замените col_start и col_end соответствующими индексами столбцов для каждого типа данных. Укажите имя столбца, содержащего целевую переменную, вместо y_column_name в качестве y_label.
Выберите «Ячейка», а затем «Запустить все» в строке меню. Графики PCA и распределение оценок важных признаков будут автоматически сохранены в локальной папке. Списки важных характеристик для каждого идентифицированного модуля СЦБ также будут храниться в виде текстовых файлов в локальной папке с именами module_n.txt.
Чтобы реализовать расчетную схему с предустановленными параметрами, нажмите на реализацию M03b-DeepOmicsAE с предустановленными параметрами. ipynb notebook на главной странице Jupyter notebook. Затем проделайте ту же процедуру.
Обратите внимание, что параметры kprot, kmet и latent в седьмой ячейке блокнотов вычисляются автоматически внутри скрипта на основе результатов предыдущих раундов оптимизации. Протеом, метаболом и клинические данные из 142 посмертных образцов человеческого мозга, полученных от людей, которые были либо здоровы, либо с диагнозом болезнь Альцгеймера, были проанализированы с использованием этого рабочего процесса, основанного на модели автоэнкодера глубокого обучения для извлечения краткого набора признаков из многомерных мультиомических входных данных. Результаты оптимизации параметров модели показывают, что выбор небольшого числа протеомных и метаболомических признаков для использования в качестве входных данных для модели обеспечивает более высокую степень разделения между здоровыми пациентами и пациентами с болезнью Альцгеймера.
В то время как количество нейронов в латентном слое не оказало существенного влияния на производительность модели. С помощью оптимальных параметров из латентного слоя модели автокодировщика был выделен небольшой набор признаков, обобщающих входные данные, называемых извлеченными признаками. Анализ PCA показал, что диагностические группы были разделены по выделенным признакам.
Тем не менее, группы не были хорошо различимы по исходным признакам, что указывает на то, что извлеченные признаки отражают информацию, имеющую решающее значение для определения состояния заболевания.