Intelligence artificielle LipNet va au-delà des logiciels de reconnaissance vocale

Pour approfondir le sujet

Sur le même thème :

Le salon AI Paris se tiendra les 6 et 7 juin prochains à la Cité universitaire internationale de Paris

La Cité universitaire internationale accueillera les 6 et 7 juin prochains la AI Paris. Il s'agit de la première édition française de cet événement...

Google numéro 1 de la course à l’intelligence artificielle

L'intelligence artificielle est un domaine qui attire de plus en plus d'entreprises et d'investisseurs. Depuis quelques années on assiste en effet à une course...

Constructeurs automobiles, intelligence artificielle et véhicule autonome: une course acharnée

Après les annonces, la semaine dernière, de Daimler-Benz et de Baidu concernant le développement de leurs projets en intelligence artificielle, il semble plus qu'évident...

Google cherche à se réinventer dans “l’ère de l’intelligence artificielle”

A l'occasion de la conférence annuelle des développeurs, la Google I/O, qui a commencé ce mercredi 17 mai à Mountain View aux Etats-Unis,...

LipNet va au-delà des logiciels de reconnaissance vocale

Les chercheurs de DeepMind, la filiale de Google rachetée en 2014, conjointement avec les scientifiques de l’université d’Oxford ont mis au point LipNet, une intelligence artificielle permettant de lire les mouvements de vos lèvres pour les convertir en texte. Les applications scientifiques et commerciales possibles de ce programme sont nombreuses et il a déjà suscité de nombreux intérêts.

Les chercheurs et les scientifiques ayant participé au développement de ce programme se montrent quant à eux évidemment très optimistes quant à ses applications:

Une machine capable de lire sur les lèvres ouvre la voie à de multiples applications comme la dictée d’instructions, la dictée de message à un téléphone dans un environnement bruyant, la transcription et le doublage de films sans son, la compréhension de discours où plusieurs personnes s’expriment et, plus largement, l’amélioration de la performance de la reconnaissance vocale.

Le programme LipNet se veut la référence absolue dans son domaine et a déjà supplanté les spécialistes humains. Les tests réalisés par les chercheurs de DeepMind et de l’université d’Oxford montrent en effet que le professionnel en lecture des lèvres humain qui a servi de témoin a obtenu un taux de réussite de 23,8%, alors que le programme a atteint 46,9% de réussite en reconnaissance des phrases prononcées.

Pour obtenir de tels résultats, LipNet est passé par une phase d’apprentissage intense au cours de laquelle il a du écouter près de 5000 heures d’émissions de la BBC. L’intelligence artificielle dépasse même la simple reconnaissance labiale puisqu’elle peut prédire des phrases entières, à l’inverse des logiciels existants qui ne travaillaient que sur des mots isolés.

 
Johanna Diaz

Partager l'article

Découvrez ActuIA n°8, le nouveau numéro du magazine de l’intelligence artificielle

L’été est bien là et c’est déjà l’heure du nouveau numéro d’ActuIA, votre magazine de l’intelligence artificielle ! Pour ce n°8 d’ActuIA, disponible dès...

Victor Schmidt, doctorant sous la direction de Yoshua Bengio, est le lauréat de la 6ème bourse Antidote en TAL

Druide informatique a annoncé fin mai la nomination du lauréat de la 6e Bourse Antidote en traitement automatique de la langue (TAL). Victor Schmidt,...

Retour sur le lauréat du Prix CNIL-INRIA pour la protection de la vie privée

Fin mai, François Pelligrini et Mathieu Cunche, co-présidents du Jury du Prix CNIL-Inria, ont remis le prix pour la protection de la vie privée...

La Lufthansa s’appuie sur le logiciel « Virtual Aviation Training » de NMY pour former ses équipes de cabine

La pandémie a fortement impacté les compagnies aériennes. Depuis la levée des restrictions sanitaires, elles doivent affronter un autre problème : malgré une forte...
Recevoir une notification en cas d'actualité importante    OK Non merci