Actualité Données vocales : Le Voice Lab et Datafunding lancent une campagne de...

Pour approfondir le sujet

Pénurie des semi-conducteurs : Intel évoque ses prévisions et présente sa stratégie pour limiter les dégâts

À l'heure actuelle, l'industrie de l'informatique traverse une crise particulière : une pénurie de semi-conducteurs, essentiels dans la production de certains composants ou au...

Espagne : un projet de centre européen pour l’intelligence artificielle pour rivaliser avec les infrastructures européennes

En Espagne, un projet ambitieux autour de l'IA tend à se mettre en place. Un groupe d'investisseurs privés, dirigé par les propriétaires du téléopérateur...

L’apprentissage supervisé et par renforcement pour aider les robots à s’adapter à tout type d’environnement

A travers Rapid Motor Adaptation (RMA), Facebook progresse dans l'adaptation des robots à leur environnement, afin de développer leur motricité. Adapter les robots à un...

Cinéma et Deepfake : zoom sur la synchronisation des lèvres avec le doublage en langue étrangère

Le deepfake est une technique reposant sur l'intelligence artificielle qui permet de superposer des fichiers audio ou vidéos sur d'autres fichiers déjà existants pour...

Données vocales : Le Voice Lab et Datafunding lancent une campagne de data funding

Les technologies vocales ont connu un grand boom ces dernières années avec des solutions innovantes, des projets de recherche avec de nombreuses applications mais aussi la question de la protection des données. C’est dans ce cadre que le Voice Lab et Datafunding ont lancé une campagne de data funding avec pour principal objectif de collecter 2 000 heures de données vocales.

Cette initiative invite les Français à faire don de leurs données vocales afin de co-construire les technologies vocales de demain, ouvertes et au service de tous et mettre la voix au service d’une intelligence artificielle citoyenne. Au travers de cette collecte disponible sur le site de Datafunding, les utilisateurs peuvent partager leurs données vocales et aider ainsi la recherche, ainsi que l’ensemble de l’écosystème numérique de la voix et l’innovation en France, en Europe et dans le monde francophone.

« Le Message que nous souhaitons transmettre aux utilisateurs de Google Home, Alexa ou Siri l’appel suivant : les données de votre assistant vocal vous appartiennent. Faites-en don à la recherche française ! », explique Karel Bourgois, Président du Voice Lab.

« Aujourd’hui, de plus en plus de personnes souhaitent bénéficier d’appareils avec lesquels elles peuvent réellement communiquer naturellement. Pour développer de tels systèmes il est nécessaire d’accéder à des données vocales libres. C’est pourquoi nous lançons une campagne de data funding citoyen dans le respect des données personnelles. Chaque participant est invité à partager les données vocales stockées chez les GAFAM dans une marketplace française ! Celles-ci permettront à l’écosystème vocal français de développer des technologies souveraines indépendantes des géants du numérique que sont les GAFAM et BATX. Cet acte citoyen permettra de soutenir l’écosystème vocal français et le développement d’une technologie vocale diverse, dynamique et souveraine. »

Les données utilisateurs ont de la valeur. Le Voice Lab souhaite sensibiliser les citoyens sur la pleine propriété qu’ils gardent sur les données recueillies par les différents services d’Assistants Vocaux tels que Google Home, Alexa ou Siri. Le Voice Lab permet aujourd’hui aux citoyens de décider qui peut disposer de leurs données vocales et pour quels objectifs.

Devenus incontournables, les assistants vocaux sur enceintes connectées ou sur d’autres canaux vocaux comme le téléphone, reposent sur des moteurs de reconnaissance de la parole entraînés sur de très grands jeux de données récoltées auprès des utilisateurs lors de leurs interactions et auxquels seules quelques grandes entreprises ont accès. Grâce à l’opération de Data funding du Voice Lab, les utilisateurs peuvent dorénavant partager leurs données vocales et aider ainsi la recherche, ainsi que l’ensemble de l’écosystème numérique de la voix et l’innovation en France, en Europe et dans le monde francophone.

Le Voice Lab et Datafunding ont mis en place un site web qui permet très simplement à chaque utilisateur de donner son consentement au Voice Lab afin que celui-ci puisse récupérer ses données vocales auprès des éditeurs des assistants vocaux. Cet outil permet de gérer les consentements et de les révoquer automatiquement, si l’utilisateur décide d’arrêter sa contribution au Voice Lab.

Une fois récoltées les données sont anonymisées et normalisées pour contribuer aux corpus et créer des modèles de transcription indépendants et contributifs.

L’objectif principal est bien de mutualiser les données et de concevoir des modèles de reconnaissance vocale en langue française pour alimenter différents services de transcription automatique de la parole, entre autres open source. Les moteurs permettent ainsi aux différents acteurs – académiques, privés ou publics – de créer des services ou des produits vocaux en toute indépendance des GAFAM. Les laboratoires Français pourront ainsi lever de nombreux verrous, en particulier liés au volume et à la diversité des données disponibles.

La mission du Voice Lab est de créer une alternative aux solutions et aux modèles économiques existants, afin de garantir d’un côté le respect de la vie privée des utilisateurs et de l’autre de prévenir une dépendance économique aux GAFA et BATX sur les interfaces vocales qui seront les interfaces du futur.

Le Voice Lab (levoicelab.org) précise que ces données seront hébergées dans le strict respect de la vie privée et du droit relatif à la protection des données personnelles et que l’objectif est avant tout degarantir que les données des utilisateurs seront utilisées en respectant les valeurs de l’IA éthique by design, telles que le respect, la transparence, la loyauté, la sécurité, l’équité et la maîtrise.

Cette campagne est l’occasion de communiquer auprès du grand public et de faire connaître cette initiative auprès des citoyens.

Quelques exemples de produits et services qui pourront être créés par les membres du Voice Lab grâce à ces données :

  • Des applications de la reconnaissance vocale qui s’imposent dans de nombreux domaines métiers et sont par ailleurs à la base d’avancées en termes d’accessibilités (handicap visuel et auditif, illectronisme) ;
  • Création d’assistants vocaux embarqué ;
  • Compréhension des conversations téléphoniques avec un téléconseiller ;
  • Création d’assistants vocaux pour téléphone ou enceinte connectée ;
  • Aide aux malentendants ;
  • Sous-titrage et veille médias.


1ère Marketplace de l'IA et de la transformation numérique vous recommande :
 
Thomas Calvi

Partager l'article

Pénurie des semi-conducteurs : Intel évoque ses prévisions et présente sa stratégie pour limiter les dégâts

À l'heure actuelle, l'industrie de l'informatique traverse une crise particulière : une pénurie de semi-conducteurs, essentiels dans la production de certains composants ou au...

Espagne : un projet de centre européen pour l’intelligence artificielle pour rivaliser avec les infrastructures européennes

En Espagne, un projet ambitieux autour de l'IA tend à se mettre en place. Un groupe d'investisseurs privés, dirigé par les propriétaires du téléopérateur...

L’apprentissage supervisé et par renforcement pour aider les robots à s’adapter à tout type d’environnement

A travers Rapid Motor Adaptation (RMA), Facebook progresse dans l'adaptation des robots à leur environnement, afin de développer leur motricité. Adapter les robots à un...

Cinéma et Deepfake : zoom sur la synchronisation des lèvres avec le doublage en langue étrangère

Le deepfake est une technique reposant sur l'intelligence artificielle qui permet de superposer des fichiers audio ou vidéos sur d'autres fichiers déjà existants pour...