GeMEB - meXage - Engineering your ideas

GeMEB: Generative Models Empowering Businesses

Il progetto GeMEB si propone di implementare un framework per la consultazione di normative che sfrutti al meglio le potenzialità dei modelli linguistici generativi e le più recenti tecniche di Natural Language Processing (NLP). Lo scopo è quello di fornire uno strumento utile che faciliti, velocizzi e supporti la consultazione delle normative tecniche vigenti. Data la loro importanza e la loro onnipresenza queste normative possono essere molto lunghe e complesse in quanto piene di tabelle, grafici, immagini, e linguaggio altamente specializzato. Queste caratteristiche rende la loro consultazione, in generale, un compito time-consuming anche per utenti molto esperti.

Nello specifico di questo progetto si concentra su una piccola serie di normative vigenti in ambito ferroviario, come le CENELEC e le UNISIG, che vista la loro importanza nell'ambito dei prodotti safety-critical e la loro complessità sono un esempio molto significativo delle difficoltà che caratterizzano questo problema e quindi consente di ottenere un framework molto più robusto e più facilmente generalizzabile.

La parte centrale del framework sarà l'attività di ricerca nelle informazioni nel testo partendo da una domanda posta dall'utente attraverso delle tecniche di “information retrieval” tipiche del mondo NLP. Poi queste informazioni dovranno essere “pulite” e categorizzate in modo che solo quelle più pertinenti alla domanda siano usate come input di un modello linguistico generativo, il cui compito sarà “assemblarle” al meglio per fornire una risposta corretta e quanto più possibile simile a quella di una persona in carne e ossa.

Il framework è implementato in modo da garantire la massima trasparenza di utilizzo e la privacy dei dati forniti dall'utente. Nello specifico, per ogni risposta ricevuta, l'utente ha la possibilità di visualizzare le parti del testo usate per generarle e quindi valutarne l'affidabilità. Le informazioni contenute nelle domande, invece, sono scambiate su interfacce sicure e su una rete locale e possono essere utilizzate per il continuo miglioramento del framework senza alimentare risorse di terze parti come accade in molte soluzioni presenti on-line.

Implementazione e risultati

MeXage s.r.l. ha contribuito in modo sostanziale alla fase di test degli algoritmi progettati, concentrandosi in particolare sulla coerenza delle risposte fornite dal sistema e sulla qualità nella selezione delle fonti informative. Le attività di validazione svolte hanno permesso di individuare punti di forza e aree di miglioramento, offrendo un contributo concreto al perfezionamento delle prestazioni e all'efficacia dell'interfaccia di utilizzo.

Partnership e Finanziamento

Il progetto è stato co-finanziato dall'Unione Europea nell'ambito del piano NextGenerationEU, con un contributo di circa 30,5 mila euro sulla quota di costi sostenuti di circa 69 mila euro sul costo complessivo del progetto di circa 590 mila euro.
MeXage s.r.l. ha partecipato al progetto contribuendo con le proprie risorse e competenze nello sviluppo e nella validazione di soluzioni software in ambito ferroviario, prendendo parte attiva al testing e all'analisi delle prestazioni del framework. Il progetto si è avvalso inoltre del supporto di NIER Ingegneria, del consorzio BI-REX e del gruppo di intelligenza artificiale (IA) del Dipartimento di Informatica - Scienza e Ingegneria (DISI) dell'Università degli Studi di Bologna i quali che si sono occupati delle fasi di progettazione e implementazione del sistema.

Sviluppi futuri

Tra gli sviluppi futuri, oltre al continuo aggiornamento del framework ci sono la sua applicazione a normative in altri ambiti come il trasporto di sostanze pericolose (ad esempio la ADR), la gestione dei grandi rischi (D.Lgs. 105/2015), la classificazione delle sostanze pericolose (ad esempio la REACH) e la tutela ambientale (D.Lgs. 152/2006). Il progetto, quindi, rappresenta solo il primo passo verso un progetto trasversale di grande utilità in molti ambiti tecnici.