GeMEB
GeMEB: Generative Models Empowering Businesses
Il progetto GeMEB si propone di implementare un framework per la consultazione di normative che sfrutti al meglio le
potenzialità dei modelli linguistici generativi e le più recenti tecniche di Natural Language Processing (NLP). Lo scopo
è quello di fornire uno strumento utile che faciliti, velocizzi e supporti la consultazione delle normative tecniche vigenti.
Data la loro importanza e la loro onnipresenza queste normative possono essere molto lunghe e complesse in quanto piene di
tabelle, grafici, immagini, e linguaggio altamente specializzato. Queste caratteristiche rende la loro consultazione, in
generale, un compito time-consuming anche per utenti molto esperti.
Nello specifico di questo progetto si concentra su una piccola serie di normative vigenti in ambito ferroviario,
come le CENELEC e le UNISIG, che vista la loro importanza nell'ambito dei prodotti safety-critical e la loro complessità
sono un esempio molto significativo delle difficoltà che caratterizzano questo problema e quindi consente di ottenere
un framework molto più robusto e più facilmente generalizzabile.
La parte centrale del framework sarà l'attività di ricerca nelle informazioni nel testo partendo da una domanda posta
dall'utente attraverso delle tecniche di “information retrieval” tipiche del mondo NLP. Poi queste informazioni dovranno
essere “pulite” e categorizzate in modo che solo quelle più pertinenti alla domanda siano usate come input di un modello
linguistico generativo, il cui compito sarà “assemblarle” al meglio per fornire una risposta corretta e quanto più possibile
simile a quella di una persona in carne e ossa.
Il framework è implementato in modo da garantire la massima trasparenza di utilizzo e la privacy dei dati forniti
dall'utente. Nello specifico, per ogni risposta ricevuta, l'utente ha la possibilità di visualizzare le parti del testo
usate per generarle e quindi valutarne l'affidabilità. Le informazioni contenute nelle domande, invece, sono scambiate
su interfacce sicure e su una rete locale e possono essere utilizzate per il continuo miglioramento del framework senza
alimentare risorse di terze parti come accade in molte soluzioni presenti on-line.
Implementazione e risultati
MeXage s.r.l. ha contribuito in modo sostanziale alla fase di test degli algoritmi progettati, concentrandosi in particolare sulla coerenza delle risposte fornite dal sistema e sulla qualità nella selezione delle fonti informative. Le attività di validazione svolte hanno permesso di individuare punti di forza e aree di miglioramento, offrendo un contributo concreto al perfezionamento delle prestazioni e all'efficacia dell'interfaccia di utilizzo.
Partnership e Finanziamento
Il progetto è stato co-finanziato dall'Unione Europea nell'ambito del piano NextGenerationEU, con un contributo di circa 30,5
mila euro sulla quota di costi sostenuti di circa 69 mila euro sul costo complessivo del progetto di circa 590 mila euro.
MeXage s.r.l. ha partecipato al progetto contribuendo con le proprie risorse e competenze nello sviluppo e nella validazione di soluzioni
software in ambito ferroviario, prendendo parte attiva al testing e all'analisi delle prestazioni del framework.
Il progetto si è avvalso inoltre del supporto di NIER Ingegneria, del consorzio BI-REX e del gruppo di intelligenza artificiale (IA) del
Dipartimento di Informatica - Scienza e Ingegneria (DISI) dell'Università degli Studi di Bologna i quali che si sono occupati delle fasi di progettazione
e implementazione del sistema.
Sviluppi futuri
Tra gli sviluppi futuri, oltre al continuo aggiornamento del framework ci sono la sua applicazione a normative in altri ambiti come il trasporto di sostanze pericolose (ad esempio la ADR), la gestione dei grandi rischi (D.Lgs. 105/2015), la classificazione delle sostanze pericolose (ad esempio la REACH) e la tutela ambientale (D.Lgs. 152/2006). Il progetto, quindi, rappresenta solo il primo passo verso un progetto trasversale di grande utilità in molti ambiti tecnici.