TLDR : Translated, un'azienda italiana specializzata in soluzioni linguistiche tramite IA, guiderà il progetto di ricerca europeo DVPS, finanziato con 29 milioni di euro da Horizon Europe. L'obiettivo del progetto è esplorare una nuova via di apprendimento per l'IA multimodale, basata sull'interazione diretta con il mondo fisico, combinando linguaggio, percezione spaziale, segnali sensoriali e visione.
Sommario
Translated, azienda con sede a Roma specializzata in soluzioni linguistiche e traduzione assistita da IA, guiderà il progetto di ricerca europeo DVPS, il cui lancio è previsto per il prossimo 1° luglio. Questo ambizioso programma, sostenuto con 29 milioni di euro nell'ambito di Horizon Europe, riunisce 20 partner provenienti da 9 paesi attorno a una visione comune: esplorare una nuova via di apprendimento per l'IA multimodale, basata sull'interazione diretta con il mondo fisico.
Far progredire la scienza e l'ingegneria dei modelli fondamentali multimodali
Il suo nome, DVPS, per "Diversibus viis plurima solvo", ovvero "Attraverso diversi percorsi, risolvo molti problemi", riflette questa ambizione. Dove i modelli attuali dipendono ancora da dati statici provenienti da testi, immagini o video, cioè rappresentazioni del mondo, DVPS intende compiere un ulteriore passo avanti. Incrociando linguaggio, percezione spaziale, segnali sensoriali e visione, il progetto cerca di avvicinare l'IA a una forma di comprensione più radicata nella realtà.
Marco Trombetti, co-fondatore e CEO di Translated, sottolinea:
"I grandi modelli di linguaggio hanno segnato una svolta, ma emergono i loro limiti: si basano su un'architettura statica e apprendono solo da contenuti statici creati dall'uomo nel mondo digitale. Per andare oltre, l'IA deve interagire con il mondo reale, in tempo reale. Con DVPS, diamo alle macchine la capacità di crescere attraverso l'esperienza diretta e di condividere istantaneamente ciò che apprendono tra loro".
I modelli fondamentali multimodali (MMFM) sviluppati nell'ambito del progetto introdurranno tre rotture metodologiche:
- Efficacia dell'etichettatura: grazie all'apprendimento per trasferimento e all'adattamento con pochi esempi, i modelli potranno essere addestrati con pochi dati annotati, riducendo così la dipendenza dai set di dati etichettati manualmente;
- Riutilizzo del calcolo: capitalizzando sul pre-addestramento su larga scala, permetteranno di ridurre il costo computazionale delle applicazioni a valle, aprendo la strada a uno sviluppo più sostenibile;
- Efficacia dell'ingegneria: l'automazione del design dei modelli ridurrà la necessità di competenze altamente specializzate per ogni nuovo compito o dominio.
Tre primi campi di applicazione: linguistica, cardiologia e geo-intelligence
Una delle sfide che il progetto si propone di affrontare è quella della comprensione contestuale in tempo reale in situazioni di traduzione simultanea che coinvolgono più interlocutori, in un ambiente rumoroso o non strutturato.
In questo tipo di configurazione, l'essere umano mobilita spontaneamente un fascio di indizi non verbali: direzione dello sguardo, spazializzazione della voce, orientamento del corpo. I sistemi attuali, invece, faticano a ricostruire questo contesto. Combinando visione artificiale, analisi del suono spaziale e interpretazione dei gesti, i modelli sviluppati da DVPS potrebbero aprire la strada ad assistenti linguistici capaci di adattarsi meglio alle situazioni reali.
Nel campo della salute, il progetto intende contribuire alla diagnosi precoce dei rischi cardiovascolari attraverso una modellazione 3D del cuore derivata da immagini mediche avanzate. Nel settore della gestione ambientale, ha l'obiettivo di migliorare la risposta alle catastrofi naturali, ad esempio mediante l'aggregazione di dati satellitari e terrestri per anticipare le inondazioni.
Un progetto strutturato attorno a strumenti chiave
L'obiettivo finale è creare basi scientifiche solide per la comunità di ricerca europea. Per sostenere questa visione, DVPS concepirà tre blocchi fondamentali:
- AutoDVPS: una toolbox open source per la progettazione e l'espansione dei MMFM. Sarà testata nei tre domini applicativi iniziali, nonché in due domini non definiti a questo stadio, una strategia destinata a valutare la capacità di generalizzazione dei modelli oltre le loro ipotesi di progettazione.;
- DVPSBench: una suite di analisi comparativa dedicata alla robustezza, alle prestazioni e alle considerazioni etiche di questi modelli;
- DVPS-FM: un modello fondamentale addestrato su un vasto insieme di modalità diverse.
Il progetto prevede anche la pubblicazione del manuale "Principi e pratiche del MMFM", accompagnato da un MOOC volto a formare più di 1.500 apprendenti. Al fine di stimolare l'innovazione e le sinergie, sono previste 15 collaborazioni con altre iniziative europee in IA, nonché la creazione di un laboratorio di co-innovazione che riunisca accademici e industriali.
Una dinamica collettiva al servizio della sovranità tecnologica europea
Il team fondatore di DVPS è composto da 70 scienziati europei di alto livello specializzati in IA e provenienti dai seguenti partner:
- Ricerca accademica: Università di Oxford, Istituto Alan Turing, École polytechnique fédérale de Lausanne, ETH Zurich, Imperial College London, Fondazione Bruno Kessler, Istituto di tecnologia di Karlsruhe, Università di Barcellona e Vlaamse Instelling voor Technologisch Onderzoek
- Partner specializzati: Ospedale universitario di Heidelberg, Vall d'Hebron Institut de Recerca, Amsterdam University Medical Centers, Deepset, Sistema, MEEO, Lynkeus, Data Valley e Pi School of AI
- Calcolo ad alte prestazioni: Cyfronet, centro nazionale polacco di calcolo ad alte prestazioni