Em resumo : Translated, uma empresa italiana especializada em soluções linguísticas por IA, liderará o projeto de pesquisa europeu DVPS, financiado com 29 milhões de euros pelo Horizon Europe. O objetivo do projeto é explorar um novo caminho de aprendizado para a IA multimodal, baseado na interação direta com o mundo físico, combinando linguagem, percepção espacial, sinais sensoriais e visão.
Índice
Translated, empresa sediada em Roma especializada em soluções linguísticas e tradução assistida por IA, liderará o projeto de pesquisa europeu DVPS, cujo lançamento está previsto para o próximo dia 1º de julho. Este ambicioso programa, apoiado com um financiamento de 29 milhões de euros no âmbito do Horizon Europe, reúne 20 parceiros de 9 países em torno de uma visão comum: explorar um novo caminho de aprendizado para a IA multimodal, baseado na interação direta com o mundo físico.
Avançando a ciência e engenharia de modelos fundamentais multimodais
Seu nome, DVPS, para "Diversibus viis plurima solvo", ou "Através de diferentes caminhos, resolvo múltiplos problemas", reflete essa ambição. Onde os modelos atuais dependem de dados estáticos provenientes de textos, imagens ou vídeos, ou seja, representações do mundo, o DVPS pretende dar um passo adiante. Ao cruzar linguagem, percepção espacial, sinais sensoriais e visão, o projeto busca aproximar a IA de uma forma de compreensão mais enraizada no real.
Marco Trombetti, cofundador e CEO da Translated, destaca:
"Os grandes modelos de linguagem marcaram uma ruptura, mas suas limitações aparecem: eles se baseiam em uma arquitetura fixa e aprendem apenas a partir de conteúdos estáticos criados pelo homem no mundo digital. Para ir além, a IA deve interagir com o mundo real, em tempo real. Com o DVPS, damos às máquinas a capacidade de crescer por meio da experiência direta, e de compartilhar instantaneamente o que aprendem entre si".
Os modelos fundamentais multimodais (MMFM) desenvolvidos no âmbito do projeto introduzirão três rupturas metodológicas:
- Eficiência de rotulagem: graças ao aprendizado por transferência e à adaptação em poucos exemplos, os modelos poderão ser treinados com poucos dados anotados, reduzindo assim a dependência de conjuntos de dados rotulados manualmente;
- Reutilização de cálculo: ao capitalizar no pré-treinamento em larga escala, permitirão reduzir o custo computacional das aplicações a jusante, o que abre caminho para um desenvolvimento mais sustentável;
- Eficiência de engenharia: a automação do design de modelos reduzirá a necessidade de expertise altamente especializada para cada nova tarefa ou domínio.
Três primeiros campos de aplicação: linguística, cardiologia e geo-inteligência
Um dos desafios que o projeto se propõe a enfrentar é o da compreensão contextual em tempo real em situações de tradução simultânea envolvendo vários falantes, em um ambiente barulhento ou não estruturado.
Nesse tipo de configuração, o ser humano mobiliza espontaneamente um conjunto de pistas não-verbais: direção do olhar, espacialização da voz, orientação do corpo. Os sistemas atuais, por sua vez, têm dificuldade em reconstruir esse contexto. Ao combinar visão computacional, análise de som espacial e interpretação de gestos, os modelos desenvolvidos pelo DVPS poderiam abrir caminho para assistentes linguísticos capazes de se adaptar melhor a situações reais.
No campo da saúde, o projeto pretende contribuir para a detecção precoce de riscos cardiovasculares com o uso de modelagem 3D do coração a partir de imagens médicas avançadas. No campo da gestão ambiental, o objetivo é melhorar a resposta a desastres naturais, por exemplo, através da agregação de dados de satélite e de campo para antecipar inundações.
Um projeto estruturado em torno de ferramentas-chave
O objetivo final é constituir bases científicas sólidas para a comunidade de pesquisa europeia. Para apoiar essa visão, o DVPS conceberá três blocos fundamentais:
- AutoDVPS: uma caixa de ferramentas open source para a concepção e expansão dos MMFM. Será testada nos três domínios aplicativos iniciais, bem como em dois domínios ainda não definidos, uma estratégia destinada a avaliar a capacidade de generalização dos modelos além de suas hipóteses de concepção.;
- DVPSBench: uma suíte de análise comparativa dedicada à robustez, desempenho e considerações éticas desses modelos;
- DVPS-FM: um modelo fundamental formado em um conjunto massivo de modalidades diversas.
O projeto também prevê a publicação do manual "Princípios e práticas do MMFM", acompanhado de um MOOC visando formar mais de 1.500 aprendizes. Para estimular a inovação e as sinergias, são previstas 15 colaborações com outras iniciativas europeias em IA, bem como a criação de um laboratório de co-inovação reunindo acadêmicos e industriais.
Uma dinâmica coletiva a serviço da soberania tecnológica europeia
A equipe fundadora do DVPS é composta por 70 cientistas europeus de alto nível especializados em IA e provenientes dos seguintes parceiros:
- Pesquisa acadêmica : Universidade de Oxford, Instituto Alan Turing, Escola Politécnica Federal de Lausanne, ETH Zurich, Imperial College London, Fondazione Bruno Kessler, Instituto de Tecnologia de Karlsruhe, Universidade de Barcelona e tilaamse Instelling voor Technologisch Onderzoek
- Parceiros especializados: Hospital Universitário de Heidelberg, Vall d'Hebron Institut de Recerca, Amsterdam University Medical Centers, Deepset, Sistema, MEEO, Lynkeus, Data Valley e Pi School of AI
- Cálculo de alto desempenho : Cyfronet, centro nacional polonês de cálculo de alto desempenho