Klik om te beginnen op de startpagina van de Jupyter-notebook op de optimalisatie van het M02-DeepOmicsAE-model. ipynb-notitieboek om het in een nieuw tabblad te openen. Typ in de tweede cel van het notitieblok de naam van het uitvoerbestand dat is gegenereerd tijdens de voorbewerking van gegevens in plaats van M01_output_data.csv.
Geef in de vijfde cel de kolomposities op voor verschillende gegevenstypen, zoals proteomics-gegevens, metabolomics-gegevens, klinische gegevens en alle moleculaire expressiegegevens. Vervang col_start en col_end door de juiste kolomindexen voor elk gegevenstype. Geef de naam op van de kolom met de doelvariabele in plaats van y_column_name als y_label.
Definieer in de zesde cel het aantal rondes voor modeloptimalisatie door een waarde toe te wijzen aan n_comb. Meer optimalisatierondes zullen helpen bij het verfijnen van de modelparameters en het verbeteren van de modelprestaties, maar we zullen ook de verwerkingstijd verlengen. Voer het notitieblok uit door Cel te selecteren en vervolgens Alles uitvoeren in de menubalk.
Om de workflow te implementeren, klikt u op de M03a-DeepOmicsAE-implementatie met aangepaste geoptimaliseerde parameters. ipynb-notebook op de startpagina van het Jupyter-notebook. Typ in de tweede cel van het notitieblok de naam van het uitvoerbestand dat is gegenereerd tijdens de voorbewerking van gegevens in plaats van M01_output_data.csv.
Geef in de vijfde cel de kolomposities op voor verschillende gegevenstypen, zoals proteomics-gegevens, metabolomics-gegevens, klinische gegevens en alle moleculaire expressiegegevens. Vervang col_start en col_end door de juiste kolomindexen voor elk gegevenstype. Geef de naam op van de kolom met de doelvariabele in plaats van y_column_name als y_label.
Selecteer Cel gevolgd door Alles uitvoeren in de menubalk. De PCA-plots en de verdeling van belangrijke functiescores worden automatisch opgeslagen in de lokale map. Lijsten met belangrijke functies voor elke geïdentificeerde signaleringsmodule worden ook opgeslagen als tekstbestanden in de lokale map met de namen module_n.txt.
Om de workflow met vooraf ingestelde parameters te implementeren, klikt u op de M03b-DeepOmicsAE-implementatie met vooraf ingestelde parameters. ipynb-notebook op de startpagina van het Jupyter-notebook. Volg dan dezelfde procedure.
Merk op dat de parameters kprot, kmet en latent in de zevende cel van de notebooks automatisch worden berekend in het script op basis van de resultaten van eerdere optimalisatierondes. Proteoom, metaboloom en klinische gegevens van 142 postmortale menselijke hersenmonsters afkomstig van personen die gezond waren of gediagnosticeerd waren met de ziekte van Alzheimer, werden geanalyseerd met behulp van deze workflow op basis van een deep-learning auto-encodermodel voor het extraheren van een beknopte set kenmerken uit de hoogdimensionale multi-omics-invoergegevens. De resultaten van de optimalisatie van de modelparameters laten zien dat het selecteren van een klein aantal proteomische en metabolomische kenmerken die als input voor het model worden gebruikt, zorgt voor een hogere mate van scheiding tussen gezonde patiënten en patiënten met de ziekte van Alzheimer.
Terwijl het aantal neuronen in de latente laag geen grote invloed had op de prestaties van het model. Met behulp van de optimale parameters werd een kleine set functies die de invoergegevens samenvatten, geëxtraheerde functies genoemd, geëxtraheerd uit de latente laag van het auto-encodermodel. PCA-analyse toonde aan dat de diagnostische groepen werden gescheiden door de geëxtraheerde kenmerken.
De groepen werden echter niet goed onderscheiden door de oorspronkelijke kenmerken, wat aangeeft dat de geëxtraheerde kenmerken de informatie vastleggen die cruciaal is voor het bepalen van de ziektetoestand.