시작하려면 Jupyter 노트북 홈페이지에서 M02-DeepOmicsAE 모델 최적화를 클릭합니다. ipynb 노트북을 클릭하여 새 탭에서 엽니다. Notebook의 두 번째 셀에 데이터 사전 처리 시 생성된 출력 파일의 이름을 M01_output_data.csv 대신 입력합니다.
다섯 번째 셀에서 단백질체학 데이터, 대사체학 데이터, 임상 데이터, 모든 분자 발현 데이터와 같은 다양한 데이터형에 대한 열 위치를 지정합니다. col_start 및 col_end를 각 데이터 형식에 적합한 열 인덱스로 바꿉니다. y_column_name 대신 대상 변수를 포함하는 열의 이름을 y_label로 지정합니다.
여섯 번째 셀에서 n_comb에 값을 할당하여 모델 최적화를 위한 라운드 수를 정의합니다. 최적화 라운드가 많을수록 모델 매개변수를 미세 조정하고 모델 성능을 개선하는 데 도움이 되지만 처리 시간도 늘어납니다. Cell(셀)을 선택하여 Notebook을 실행한 다음, 메뉴 모음에서 Run All(모두 실행)을 실행합니다.
워크플로우를 구현하려면 최적화된 맞춤형 파라미터가 있는 M03a-DeepOmicsAE 구현을 클릭합니다. Jupyter Notebook 홈페이지의 ipynb notebook. Notebook의 두 번째 셀에 데이터 사전 처리 시 생성된 출력 파일의 이름을 M01_output_data.csv 대신 입력합니다.
다섯 번째 셀에서 단백질체학 데이터, 대사체학 데이터, 임상 데이터, 모든 분자 발현 데이터와 같은 다양한 데이터형에 대한 열 위치를 지정합니다. col_start 및 col_end를 각 데이터 형식에 적합한 열 인덱스로 바꿉니다. y_column_name 대신 대상 변수를 포함하는 열의 이름을 y_label로 지정합니다.
메뉴 모음에서 Cell(셀)을 선택한 다음 Run All(모두 실행)을 선택합니다. 중요한 특징 점수의 PCA 플롯 및 분포는 로컬 폴더에 자동으로 저장됩니다. 식별된 각 시그널링 모듈에 대한 중요한 기능 목록도 module_n.txt라는 이름의 로컬 폴더에 텍스트 파일로 저장됩니다.
사전 설정된 매개 변수를 사용하여 워크플로우를 구현하려면 사전 설정된 매개 변수를 사용하여 M03b-DeepOmicsAE 구현을 클릭합니다. Jupyter Notebook 홈페이지의 ipynb notebook. 그런 다음 동일한 절차를 따르십시오.
Notebook의 일곱 번째 셀에 있는 매개 변수 kprot, kmet 및 latent는 이전 최적화 라운드의 결과를 기반으로 스크립트 내에서 자동으로 계산됩니다. 건강하거나 알츠하이머병 진단을 받은 개인으로부터 추출한 142개의 사후 인간 뇌 샘플에서 얻은 단백질체, 대사체 및 임상 데이터는 고차원 다중 오믹스 입력 데이터에서 간결한 특징 세트를 추출하기 위해 딥 러닝 자동 인코더 모델을 기반으로 하는 이 워크플로를 사용하여 분석되었습니다. 모델 파라미터 최적화의 결과는 모델의 입력으로 사용할 소수의 단백질체 및 메타볼로믹 특징을 선택하면 건강한 환자와 알츠하이머병 환자 간의 분리 수준이 높아진다는 것을 보여줍니다.
반면 잠재층의 뉴런 수는 모델의 성능에 큰 영향을 미치지 않았습니다. 최적의 매개 변수를 사용하여 입력 데이터를 요약하는 작은 기능 집합(추출된 기능이라고 함)을 자동 인코더 모델의 잠재 계층에서 추출했습니다. PCA 분석은 진단 그룹이 추출된 특징에 의해 분리되었음을 보여주었습니다.
그러나 그룹은 원래 특징에 의해 잘 구별되지 않았으며, 이는 추출된 특징이 질병 상태를 결정하는 데 중요한 정보를 포착한다는 것을 나타냅니다.