Questo programma implementa una misura automatica ed efficiente per rilevare i noduli tiroidei, che potrebbe ridurre il carico di lavoro dei medici in futuro. Questa tecnica applica un trasformatore Swin a una rete di rilevamento dei noduli. I trasformatori Swin sono efficaci nell'acquisizione di informazioni sui contenuti a lungo raggio, il che è molto utile per migliorare la sensibilità della detenzione dei noduli.
Per iniziare, aprire un terminale sulla macchina e installare Python 3.8 digitando sudo apt-get install python3.8 nella riga di comando. Per installare PyTorch 1.7, visitare il sito Web ufficiale di Miniconda e installarlo. Quindi creare un ambiente Conda digitando il comando visualizzato sullo schermo nella riga di comando e attivarlo digitando conda activate SwinFasterRCNN.
Installare PyTorch scrivendo il comando mostrato nella riga di comando. Per l'installazione di rilevamento MM, clonare dal repository GitHub ufficiale, quindi installare MM Detection scrivendo il comando pip install v e nella riga di comando. Aprire il schedule_1x.
py nell'editor di testo Vim e modifica il file per impostare i parametri predefiniti relativi all'allenamento, inclusi ottimizzatore, tasso di apprendimento ed epic. Iniziare l'addestramento digitando il comando visualizzato sullo schermo. Attendere che la rete inizi l'addestramento per 48 epiche e che i pesi addestrati risultanti della rete SwinFasterRCNN vengano generati nella cartella di output.
Salvate i pesi del modello con la massima precisione sul set di convalida. Dopo l'addestramento, selezionare il modello con le migliori prestazioni sul set di convalida per il rilevamento dei noduli tiroidei nelle nuove immagini. Eseguire lo script di test per ridimensionare l'immagine a 512 pixel per 512 pixel e normalizzarla.
Attendere che lo script carichi automaticamente i parametri del modello pre-addestrati in SwinFasterRCNN e inserire l'immagine pre-elaborata in SwinFasterRCNN per l'inferenza. Attendere che SwinFasterRCNN restituisca la casella di previsione per ogni immagine. Infine, consentire allo script di eseguire automaticamente la post-elaborazione NMS su ciascuna immagine per rimuovere le caselle di rilevamento duplicate.
I risultati del rilevamento per la stessa immagine vengono visualizzati in una determinata riga. Le colonne sono i risultati del rilevamento per SwinFasterRCNN, FasterRCNN, YOLOv3, SSD, RetinaNet e DETR. Le verità di base delle regioni sono contrassegnate da caselle rettangolari verdi.
I risultati del rilevamento sono incorniciati dalle caselle rettangolari rosse. È molto importante selezionare l'iperparametro appropriato per garantire che quelle convergenze debbano essere determinate da molti esperimenti.