Prochain numéro du magazine ActuIA le 15 octobre
Actualité LipNet va au-delà des logiciels de reconnaissance vocale

Pour approfondir le sujet

Interview de Jodie Wallis, Directrice générale, Intelligence artificielle d’Accenture pour le Canada

Le développement de l'intelligence artificielle et de ses multiples applications n'a pas échappé à Accenture, l’une des plus importantes entreprises de services professionnels au monde....

Le Québec, nouvel eldorado de l’intelligence artificielle?

'Fortune' a récemment mis à l'honneur la ville de Montréal et le Québec. Selon le magazine américain, il s'agit désormais de l’un des endroits...

Focus sur le partenariat industriel-universitaire machine learning et big data entre Twin Solutions, l’IMAG et le LIRMM du CNRS

L'ESN Twin Solutions collabore avec des chercheurs rattachés au CNRS via les unités de recherches de l'IMAG et du LIRMM pour développer ses outils...

Les Trophées MediaRH, un concours ouvert aux start-up visant à optimiser les RH

AtoS France et MediaRh.com ont lancé les Trophées MediaRH 2017 qui récompenseront les start-up proposant des solutions RH novatrices. Il s'agit de la première édition...

LipNet va au-delà des logiciels de reconnaissance vocale

Les chercheurs de DeepMind, la filiale de Google rachetée en 2014, conjointement avec les scientifiques de l’université d’Oxford ont mis au point LipNet, une intelligence artificielle permettant de lire les mouvements de vos lèvres pour les convertir en texte. Les applications scientifiques et commerciales possibles de ce programme sont nombreuses et il a déjà suscité de nombreux intérêts.

Les chercheurs et les scientifiques ayant participé au développement de ce programme se montrent quant à eux évidemment très optimistes quant à ses applications:

Une machine capable de lire sur les lèvres ouvre la voie à de multiples applications comme la dictée d’instructions, la dictée de message à un téléphone dans un environnement bruyant, la transcription et le doublage de films sans son, la compréhension de discours où plusieurs personnes s’expriment et, plus largement, l’amélioration de la performance de la reconnaissance vocale.

Le programme LipNet se veut la référence absolue dans son domaine et a déjà supplanté les spécialistes humains. Les tests réalisés par les chercheurs de DeepMind et de l’université d’Oxford montrent en effet que le professionnel en lecture des lèvres humain qui a servi de témoin a obtenu un taux de réussite de 23,8%, alors que le programme a atteint 46,9% de réussite en reconnaissance des phrases prononcées.

Pour obtenir de tels résultats, LipNet est passé par une phase d’apprentissage intense au cours de laquelle il a du écouter près de 5000 heures d’émissions de la BBC. L’intelligence artificielle dépasse même la simple reconnaissance labiale puisqu’elle peut prédire des phrases entières, à l’inverse des logiciels existants qui ne travaillaient que sur des mots isolés.

Johanna Diaz

Partager l'article

8 startups et PME françaises lauréates de l’appel à projets EUREKA – Challenge international COVID-19

Bpifrance a annoncé ce jour les lauréats du Challenge international Covid-19. Suite à l'appel à projets ouvert du 15 avril au 15 mai 2020,...

Une approche européenne de l’intelligence artificielle : EIT Digital fait part de ses recommandations

EIT Digital a présenté son troisième rapport de sa série Policy Perspective. Il aborde la manière dont l'Europe devrait gérer l'intelligence artificielle et fournit...

Replay – Conférence 1re Pierre : Cité de l’Intelligence Artificielle organisée par le département des Alpes-Maritimes et l’Institut EuropIA

Le lundi 14 septembre 2020 s'est déroulé le troisième #IADATES organisé par le département des Alpes-Maritimes et l’Institut EuropIA. Intitulée "1re Pierre : Cité...

reciTAL, spécialiste du TAL, lève 3,5 M€ auprès de Breega

Paris, le 10 septembre 2020 - reciTAL, start-up IA spécialisée dans les solutions de Document Intelligence, effectue une première levée de fonds de 3,5 M€...