Para começar, crie um novo ambiente virtual chamado Health Model with Python versão 3.7. Na plataforma de supercomputação de cluster Slurm, execute o módulo Load Anaconda Command. Depois que o comando é executado, um prompt de confirmação aparece na tela.
Digite Y para prosseguir e aguarde a conclusão do processo. Em seguida, ative o ambiente virtual seguindo instruções específicas da plataforma. Em seguida, execute o comando para instalar o PyTorch 1.13.1.
Instale pacotes adicionais para tocha geométrica, como torch_scatter, torch_sparse, torch_cluster e torch_spline_convulsion, seguindo as diretrizes de instalação. Em seguida, instale o pacote geométrico da tocha versão 2.2.0. Faça o download do código e do modelo de saúde pré-treinado no site do Laboratório de Informática em Saúde.
Descompacte o arquivo para um caminho desejado. Em seguida, altere o diretório de trabalho na linha de comando para a pasta mqTrans do modelo de integridade. Execute o comando para gerar recursos mqTrans e obter as saídas.
Os recursos mqTrans serão gerados como destino MQ de saída CSV, e o arquivo de rótulo será salvo novamente como rótulo de saída CSV. Adicionalmente, os valores de expressão originais dos genes de RNAm serão extraídos como alvos de teste de saída de arquivo CSV. Em seguida, use o algoritmo de seleção de recursos para selecionar recursos mqTrans.
Se selecionar recursos mqTrans ou recursos originais sem combiná-los, defina Combinar como false. Selecione 800 recursos originais e divida o conjunto de dados em 0,8 a 0,2 para treinamento e teste. Para combinar recursos mqTrans com os valores de expressão originais para seleção de recursos, defina combinar como true.
Biomarcadores escuros com valores diferenciais de mqTrans, mas expressão não diferencial de mRNA, foram identificados. Entre 3062 características, 221 biomarcadores escuros foram detectados. A escassez geral de biomarcadores escuros foi observada em comparação com os biomarcadores tradicionais na maioria dos tipos de câncer, exceto BRCA, MESO e TGCT.