
AFFILIAZIONE
Santer Reply
AUTORE PRINCIPALE
Dr.ssa Brovero Matilde
VALUTA IL CHALLENGE
Registrazione obbligatoria. Una valutazione consentita
login avvenuto
[yasr_visitor_votes]
GRUPPO DI LAVORO
Dr.ssa Brovero Matilde – Santer Reply
AREA TEMATICA
Applicazioni di intelligenza artificiale in sanità
ABSTRACT
La ricerca clinica traslazionale richiede di integrare dati profondamente eterogenei: cartelle cliniche, sequenziamenti genomici, profili proteomici, immagini diagnostiche, referti non strutturati. Oggi questi dati risiedono in sistemi separati, con formati incompatibili e nomenclature non armonizzate. Ogni progetto parte da zero nella preparazione, con settimane di lavoro prima di qualsiasi analisi. Questo paradigma non scala e non preserva la conoscenza: quando un ricercatore lascia l’istituto, il lavoro di preparazione si perde.
La risposta è una AI Platform in cui l’intelligenza artificiale non è un componente accessorio, ma il principio architetturale fondante. Un agente AI autonomo interpreta le richieste del ricercatore in linguaggio naturale e orchestra automaticamente l’infrastruttura. Il ricercatore formula la domanda — ad esempio: “dataset genomici WES integrati con profili clinici di pazienti trattati con immunoterapia, pseudonimizzato per analisi di sopravvivenza” — e l’agente identifica i domini coinvolti, configura le pipeline, esegue le trasformazioni (normalizzazione, join genotipo-fenotipo, pseudonimizzazione, quality check) e pubblica il dataset con lineage completo.
L’architettura si articola in cinque layer AI-driven: Ingestion (flussi automatici da sorgenti HL7, DICOM, VCF, CSV, PDF), Processing (LLM on-premise per trasformare referti e note cliniche in dati strutturati con normalizzazione su ontologie ICD-O, SNOMED CT, LOINC, HGNC), Storage (Data Lake Raw → Curated → Trusted con versionamento), Access (workspace JupyterHub, Spark/Trino, pipeline MLOps) e Governance (lineage end-to-end, pseudonimizzazione automatica, accesso role-based, audit GDPR).
Tutti i modelli LLM operano on-premise su modelli open-source fine-tuned sulla terminologia clinica: nessun dato transita verso cloud esterni. Architettura conforme by design all’EU AI Act con explainability su ogni trasformazione.
La piattaforma abilita sette casi d’uso incrementali: correlazioni genotipo-fenotipo, analisi multi-omica, studi retrospettivi pseudonimizzati, radiomica integrata, pipeline MLOps, protocolli prospettici e condivisione FAIR multicentrica.
Ogni progetto arricchisce il patrimonio dati comune. Per i ricercatori: da settimane a ore, senza competenze tecniche. Per la governance: conformità GDPR automatica con audit trail nativo. Per l’istituto: patrimonio dati cumulativo e sovrano, dove la conoscenza resta nel sistema indipendentemente dal turnover.
La risposta è una AI Platform in cui l’intelligenza artificiale non è un componente accessorio, ma il principio architetturale fondante. Un agente AI autonomo interpreta le richieste del ricercatore in linguaggio naturale e orchestra automaticamente l’infrastruttura. Il ricercatore formula la domanda — ad esempio: “dataset genomici WES integrati con profili clinici di pazienti trattati con immunoterapia, pseudonimizzato per analisi di sopravvivenza” — e l’agente identifica i domini coinvolti, configura le pipeline, esegue le trasformazioni (normalizzazione, join genotipo-fenotipo, pseudonimizzazione, quality check) e pubblica il dataset con lineage completo.
L’architettura si articola in cinque layer AI-driven: Ingestion (flussi automatici da sorgenti HL7, DICOM, VCF, CSV, PDF), Processing (LLM on-premise per trasformare referti e note cliniche in dati strutturati con normalizzazione su ontologie ICD-O, SNOMED CT, LOINC, HGNC), Storage (Data Lake Raw → Curated → Trusted con versionamento), Access (workspace JupyterHub, Spark/Trino, pipeline MLOps) e Governance (lineage end-to-end, pseudonimizzazione automatica, accesso role-based, audit GDPR).
Tutti i modelli LLM operano on-premise su modelli open-source fine-tuned sulla terminologia clinica: nessun dato transita verso cloud esterni. Architettura conforme by design all’EU AI Act con explainability su ogni trasformazione.
La piattaforma abilita sette casi d’uso incrementali: correlazioni genotipo-fenotipo, analisi multi-omica, studi retrospettivi pseudonimizzati, radiomica integrata, pipeline MLOps, protocolli prospettici e condivisione FAIR multicentrica.
Ogni progetto arricchisce il patrimonio dati comune. Per i ricercatori: da settimane a ore, senza competenze tecniche. Per la governance: conformità GDPR automatica con audit trail nativo. Per l’istituto: patrimonio dati cumulativo e sovrano, dove la conoscenza resta nel sistema indipendentemente dal turnover.