For å begynne, i Jupyter notebook hjemmeside, klikk på M02-DeepOmicsAE modelloptimalisering. ipynb notebook for å åpne den i en ny fane. I den andre cellen i notatboken skriver du inn navnet på utdatafilen som genereres ved forhåndsbehandling av data i stedet for M01_output_data.csv.
I den femte cellen angir du kolonneposisjonene for forskjellige datatyper, for eksempel proteomikkdata, metabolomikkdata, kliniske data og alle molekylære uttrykksdata. Erstatt col_start og col_end med riktige kolonneindekser for hver datatype. Angi navnet på kolonnen som inneholder målvariabelen i stedet for y_column_name som y_label.
I den sjette cellen definerer du antall runder for modelloptimalisering ved å tilordne en verdi til n_comb. Flere optimaliseringsrunder vil bidra til å finjustere modellparametrene og forbedre modellytelsen, men vi vil også øke behandlingstiden. Kjør notatblokken ved å velge Celle og deretter Kjør alle fra menylinjen.
For å implementere arbeidsflyten, klikk på M03a-DeepOmicsAE-implementeringen med tilpassede optimaliserte parametere. ipynb notebook på hjemmesiden til Jupyter notebook. I den andre cellen i notatboken skriver du inn navnet på utdatafilen som genereres ved forhåndsbehandling av data i stedet for M01_output_data.csv.
I den femte cellen angir du kolonneposisjonene for forskjellige datatyper, for eksempel proteomikkdata, metabolomikkdata, kliniske data og alle molekylære uttrykksdata. Erstatt col_start og col_end med riktige kolonneindekser for hver datatype. Angi navnet på kolonnen som inneholder målvariabelen i stedet for y_column_name som y_label.
Velg Celle etterfulgt av Kjør alle fra menylinjen. PCA-plottene og distribusjonen av viktige funksjonsresultater lagres automatisk i den lokale mappen. Lister over viktige funksjoner for hver identifiserte signalmodul vil også bli lagret som tekstfiler i den lokale mappen med navnene module_n.txt.
For å implementere arbeidsflyten med forhåndsinnstilte parametere, klikk på M03b-DeepOmicsAE-implementeringen med forhåndsinnstilte parametere. ipynb notebook på hjemmesiden til Jupyter notebook. Følg deretter samme prosedyre.
Legg merke til at parameterne kprot, kmet og latent i den syvende cellen i notatblokkene beregnes automatisk i skriptet basert på resultatene fra tidligere optimaliseringsrunder. Proteom-, metabolom- og kliniske data fra 142 postmortem humane hjerneprøver avledet fra individer som enten var sunne eller diagnostisert med Alzheimers sykdom, ble analysert ved hjelp av denne arbeidsflyten basert på en dyplærende autokodermodell for å trekke ut et kortfattet sett med funksjoner fra de høydimensjonale multi-omics-inngangsdataene. Resultatene fra modellparameteroptimalisering viser at valg av et lite antall proteomiske og metabolomiske egenskaper som skal brukes som input for modellen, gir en høyere grad av separasjon mellom de friske og Alzheimers sykdomspasienter.
Mens antall nevroner i det latente laget ikke hadde stor innvirkning på modellens ytelse. Ved hjelp av de optimale parametrene ble et lite sett med funksjoner som oppsummerte inngangsdataene, kalt ekstraherte funksjoner, hentet fra autokodermodellens latente lag. PCA-analyse viste at diagnosegruppene var atskilt av de ekstraherte funksjonene.
Gruppene ble imidlertid ikke skilt godt ut av de opprinnelige trekkene, noe som indikerer at de ekstraherte trekkene fanger opp informasjonen som er avgjørende for å bestemme sykdomstilstanden.