AFFILIAZIONE
«intelligent digital agents research group, fondazione bruno kessler»
AUTORE PRINCIPALE
Dragoni Mauro
VALUTA IL CHALLENGE
login avvenuto
GRUPPO DI LAVORO
Sanna Leonardo «intelligent digital agents research group, fondazione bruno kessler»
Magnolini Simone «intelligent digital agents research group, fondazione bruno kessler»
Bellan Patrizio «intelligent digital agents research group, fondazione bruno kessler»
Ravizza Alice insideai srl
AREA TEMATICA
ABSTRACT
Nel nostro contesto applicativo, l’adozione di un modello RAG si è rivelata fondamentale per assicurare risposte che siano non solo corrette, ma anche allineate a specifiche linee guida cliniche, e basi documentali ufficiali, garantendo la conformità regolatoria. Tuttavia, per garantire la qualità del sistema, è essenziale implementare successivamente alla fase di definizione della Knowledge base un processo strutturato di validazione, articolato su tre assi principali.
Accuratezza: viene valutata la coerenza della risposta rispetto ai documenti di riferimento. Una risposta accurata deve essere fondata sui contenuti recuperati e interpretati correttamente, aderendo alle linee guida di dominio. La misurazione avviene attraverso benchmark manuali e automatizzati, includendo confronti con risposte umane e verifica delle fonti citate.
Robustezza: si testa la capacità del sistema di gestire input problematici o ambigui. Un modello robusto deve fornire risposte corrette anche in presenza di domande confondenti (es. formulazioni fuorvianti o incomplete), e bloccare in modo sicuro le risposte a input inappropriati, come richieste offensive, personali o fuori ambito. Tali casi vengono validati con scenari edge-case definiti da esperti clinici e tecnici e metriche specifiche sul comportamento difensivo del sistema.
Mitigazione degli impatti discriminatori o inappropriati: il modello deve evitare toni aggressivi, discriminatori o linguaggio eccessivamente complesso. Le risposte devono essere accessibili e inclusive, con un linguaggio chiaro, non giudicante e adatto al pubblico di riferimento. Il processo di validazione comprende analisi qualitative e l’uso di metriche NLP per la valutazione della leggibilità e della neutralità stilistica.
Attraverso questi tre pilastri di validazione, il sistema RAG può offrire un’interazione affidabile, sicura e rispettosa degli utenti, contribuendo in modo efficace alla diffusione di contenuti informativi precisi e accessibili.