AFFILIAZIONE
fondazione irccs policlinico san matteo
AUTORE PRINCIPALE
Dott. Palmieri Antonio
VALUTA IL CHALLENGE
Registrazione obbligatoria. Una valutazione consentita
login avvenuto
GRUPPO DI LAVORO
Dott. Palmieri Antonio fondazione irccs policlinico san matteo
Prof. Bellazzi Riccardo università di pavia
Dott. Malovini Alberto Luigi università di pavia
Dott.ssa Gerbasi Alessia università di pavia
Ing. Lago Paolo fondazione irccs policlinico san matteo
Ing. Bivona Rosanna fondazione irccs policlinico san matteo
Ing. Parussini Matteo fondazione irccs policlinico san matteo
Ing. Baldiraghi Chiara fondazione irccs policlinico san matteo
Prof. Bellazzi Riccardo università di pavia
Dott. Malovini Alberto Luigi università di pavia
Dott.ssa Gerbasi Alessia università di pavia
Ing. Lago Paolo fondazione irccs policlinico san matteo
Ing. Bivona Rosanna fondazione irccs policlinico san matteo
Ing. Parussini Matteo fondazione irccs policlinico san matteo
Ing. Baldiraghi Chiara fondazione irccs policlinico san matteo
AREA TEMATICA
Applicazioni innovative di bioingegneria: idee dalle Università
ABSTRACT
Il tumore al seno è uno dei tumori più diffusi tra le donne (pari a circa il 30% di tutti i tumori che affliggono il genere femminile). La diagnosi precoce è essenziale per aumentare le probabilità di prognosi favorevole e ridurre l’invasività dei trattamenti. In questo contesto, le microcalcificazioni mammarie rappresentano uno dei primi segni di possibile neoplasia, individuabile tramite mammografia digitale. Tuttavia, non tutte sono indicative di malignità, e la loro corretta interpretazione richiede competenze specialistiche e strumenti avanzati.
Questa tesi propone una pipeline innovativa per l’analisi automatica delle mammografie, finalizzata alla segmentazione e classificazione delle microcalcificazioni mediante tecniche di Deep Learning (DL) e Machine Learning (ML). L’obiettivo è migliorare l’accuratezza diagnostica e ridurre il ricorso a biopsie inutili, con benefici per pazienti e sistema sanitario.
La pipeline comprende: preprocessing delle immagini, segmentazione con rete UNet (DeepMiCa), estrazione delle ROI (Region of Interest), calcolo delle feature radiomiche (attraverso PyRadiomics), classificazione con modelli ML e DL, e combinazione delle predizioni tramite un modello ensemble basato su Ridge Regression. Il dataset utilizzato proviene dall’Istituto Clinico Scientifico IRCCS Maugeri (1722 ROI da 314 pazienti, 89% benigne e 11% maligne).
La segmentazione con DeepMiCa, pre-addestrato sul dataset INbreast, ha ottenuto ottime metriche (IOU: 74%, AUROC: 95%). Per la classificazione ML sono stati testati diversi algoritmi (Random Forest, SVM, Lasso, ecc.) con validazione K-Fold e tecniche di oversampling; il miglior risultato è stato AUPRC del 60% con Random Forest. Per il DL, sono stati valutati modelli CNN e ViT: il migliore è stato Vgg16 (AUPRC 46%). La combinazione ML+DL ha migliorato ulteriormente le prestazioni, con un AUPRC del 66% (Vgg16 + Random Forest).
In conclusione, l’approccio integrato ML/DL ha dimostrato potenziale nella diagnosi automatizzata delle microcalcificazioni. Per il futuro si propone: miglioramento del dataset, integrazione di dati clinici, sviluppo di modelli multimodali e validazione clinica. Questi strumenti non mirano a sostituire il parere medico e professionale, ma a supportarlo con maggiore precisione e affidabilità.
Questa tesi propone una pipeline innovativa per l’analisi automatica delle mammografie, finalizzata alla segmentazione e classificazione delle microcalcificazioni mediante tecniche di Deep Learning (DL) e Machine Learning (ML). L’obiettivo è migliorare l’accuratezza diagnostica e ridurre il ricorso a biopsie inutili, con benefici per pazienti e sistema sanitario.
La pipeline comprende: preprocessing delle immagini, segmentazione con rete UNet (DeepMiCa), estrazione delle ROI (Region of Interest), calcolo delle feature radiomiche (attraverso PyRadiomics), classificazione con modelli ML e DL, e combinazione delle predizioni tramite un modello ensemble basato su Ridge Regression. Il dataset utilizzato proviene dall’Istituto Clinico Scientifico IRCCS Maugeri (1722 ROI da 314 pazienti, 89% benigne e 11% maligne).
La segmentazione con DeepMiCa, pre-addestrato sul dataset INbreast, ha ottenuto ottime metriche (IOU: 74%, AUROC: 95%). Per la classificazione ML sono stati testati diversi algoritmi (Random Forest, SVM, Lasso, ecc.) con validazione K-Fold e tecniche di oversampling; il miglior risultato è stato AUPRC del 60% con Random Forest. Per il DL, sono stati valutati modelli CNN e ViT: il migliore è stato Vgg16 (AUPRC 46%). La combinazione ML+DL ha migliorato ulteriormente le prestazioni, con un AUPRC del 66% (Vgg16 + Random Forest).
In conclusione, l’approccio integrato ML/DL ha dimostrato potenziale nella diagnosi automatizzata delle microcalcificazioni. Per il futuro si propone: miglioramento del dataset, integrazione di dati clinici, sviluppo di modelli multimodali e validazione clinica. Questi strumenti non mirano a sostituire il parere medico e professionale, ma a supportarlo con maggiore precisione e affidabilità.