Optimering af modelparametre og implementering af DeepOmicsAE workflow

Please note that all translations are AI generated. Click here for the English version.

43 Views

•

04:04 min

•

December 15th, 2023

DOI :

10.3791/201017-v

December 15th, 2023

•

Elena Panizza¹

¹Department of Molecular Medicine, Cornell University

Transcript

For at begynde skal du i Jupyter-notesbogens hjemmeside klikke på M02-DeepOmicsAE-modeloptimering. IPYNB notesbog for at åbne den i en ny fane. I den anden celle i notesbogen skal du skrive navnet på den outputfil, der genereres ved dataforbehandling i stedet for M01_output_data.csv.

I den femte celle skal du angive kolonnepositionerne for forskellige datatyper, f.eks. proteomicsdata, metabolomicsdata, kliniske data og alle molekylære ekspressionsdata. Erstat col_start og col_end med de relevante kolonneindeks for hver datatype. Angiv navnet på den kolonne, der indeholder målvariablen, i stedet for y_column_name som y_label.

I den sjette celle skal du definere antallet af runder til modeloptimering ved at tildele en værdi til n_comb. Flere optimeringsrunder vil hjælpe med at finjustere modelparametrene og forbedre modellens ydeevne, men vi vil også øge behandlingstiden. Udfør notesbogen ved at vælge Celle og derefter Kør alle på menulinjen.

For at implementere arbejdsgangen skal du klikke på M03a-DeepOmicsAE-implementeringen med brugerdefinerede optimerede parametre. ipynb notesbog på Jupyter notesbog hjemmeside. I den anden celle i notesbogen skal du skrive navnet på den outputfil, der genereres ved dataforbehandling i stedet for M01_output_data.csv.

Vælg Celle efterfulgt af Kør alle fra menulinjen. PCA-plottene og fordelingen af vigtige funktionsresultater gemmes automatisk i den lokale mappe. Lister over vigtige funktioner for hvert identificeret signalmodul gemmes også som tekstfiler i den lokale mappe med de module_n.txt navne.

For at implementere arbejdsgangen med forudindstillede parametre skal du klikke på M03b-DeepOmicsAE-implementeringen med forudindstillede parametre. ipynb notesbog på Jupyter notesbog hjemmeside. Følg derefter den samme procedure.

Bemærk, at parametrene kprot, kmet og latent i den syvende celle i notesbøgerne beregnes automatisk i scriptet baseret på resultaterne af tidligere optimeringsrunder. Proteom-, metabolom- og kliniske data fra 142 postmortem humane hjerneprøver afledt af personer, der enten var raske eller diagnosticeret med Alzheimers sygdom, blev analyseret ved hjælp af denne arbejdsgang baseret på en dyb læring auto-encoder-model til udtrækning af et kortfattet sæt funktioner fra de højdimensionelle multi-omics-inputdata. Resultaterne fra modelparameteroptimering viser, at valg af et lille antal proteomiske og metabolomiske egenskaber, der skal bruges som input til modellen, giver en højere grad af adskillelse mellem raske og Alzheimers sygdomspatienter.

Mens antallet af neuroner i det latente lag ikke havde stor indflydelse på modellens ydeevne. Ved hjælp af de optimale parametre blev et lille sæt funktioner, der opsummerer inputdataene, kaldet ekstraherede funktioner, ekstraheret fra autokodermodellens latente lag. PCA-analyse viste, at diagnosegrupperne blev adskilt af de ekstraherede funktioner.

Grupperne blev imidlertid ikke skelnet godt af de oprindelige træk, hvilket indikerer, at de ekstraherede funktioner fanger de oplysninger, der er afgørende for at bestemme sygdomstilstanden.

Explore More Videos

Denne m ned i JoVE

udgave

From the series

Analyse af signalmoduler i Alzheimers sygdom med dyb læring