Este programa implementa uma medida automática e eficiente para a detecção de nódulos tireoidianos, o que pode reduzir a carga de trabalho dos médicos no futuro. Esta técnica aplica um transformador Swin a uma rede de detecção de nódulos. Os Swin Transformers são eficazes na captura de informações de conteúdo de longo alcance, o que é muito útil para melhorar a sensibilidade da detenção de nódulos.
Para começar, abra um terminal na máquina e instale o Python 3.8 digitando sudo apt-get install python3.8 na linha de comando. Para instalar o PyTorch 1.7, vá para o site oficial do Miniconda e instale-o. Em seguida, crie um ambiente Conda digitando o comando mostrado na tela na linha de comando, e ative-o digitando conda activate SwinFasterRCNN.
Instale o PyTorch escrevendo o comando mostrado na linha de comando. Para a instalação de detecção de MM, clone do repositório oficial do GitHub e instale o MM Detection escrevendo o comando pip install v e na linha de comando. Abra o schedule_1x.
py no editor de texto Vim e edite o arquivo para definir os parâmetros padrão relacionados ao treinamento, incluindo o otimizador, a taxa de aprendizado e o épico. Comece o treinamento digitando o comando mostrado na tela. Aguarde até que a rede inicie o treinamento para 48 épicos e para que os pesos treinados resultantes da rede SwinFasterRCNN sejam gerados na pasta de saída.
Salve os pesos do modelo com a mais alta precisão no conjunto de validação. Após o treinamento, selecione o modelo com melhor desempenho no conjunto de validação para detecção de nódulos tireoidianos nas novas imagens. Execute o script de teste para redimensionar a imagem para 512 pixels por 512 pixels e normalizá-la.
Aguarde até que o script carregue automaticamente os parâmetros do modelo pré-treinado para o SwinFasterRCNN e alimente a imagem pré-processada no SwinFasterRCNN para inferência. Aguarde até que o SwinFasterRCNN produza a caixa de previsão para cada imagem. Finalmente, permita que o script execute automaticamente o pós-processamento do NMS em cada imagem para remover as caixas de detecção duplicadas.
Os resultados de detecção para a mesma imagem são mostrados em uma determinada linha. As colunas são os resultados de detecção para SwinFasterRCNN, FasterRCNN, YOLOv3, SSD, RetinaNet e DETR. As verdades terrestres das regiões são marcadas com caixas retangulares verdes.
Os resultados da detecção são enquadrados pelas caixas retangulares vermelhas. É muito importante selecionar o hiperparâmetro apropriado para garantir essas convergências, o que precisa ser determinado por muitos experimentos.