Intelligence artificielle Données vocales : Le Voice Lab et Datafunding lancent une campagne de...

Pour approfondir le sujet

Sur le même thème :

Le Voice Lab lève 4,7 millions d’euros pour développer une marketplace de solutions vocales

Le Voice Lab, une association française dédiée à la voix, a annoncé avoir obtenu une aide de 4,7 millions d'euros auprès de la Bpifrance, ...

Risques en matière de cybersécurité dans les véhicules autonomes : l’ENISA formule ses recommandations

Le Centre commun de recherche (CCR) de la Commission et l'Agence de l'UE pour la cybersécurité (ENISA) a publié cette semaine un rapport sur les risques en...

Chine : l’intelligence artificielle utilisée pour concevoir des bases de données linguistiques

Dans le cadre d'un vaste programme de protection des ressources linguistiques nationales, la Chine a lancé la seconde phase de son projet. Le pays...

Réglementation européenne sur l’IA : Le CEPD exprime sa réserve sur la reconnaissance faciale

La semaine dernière, la Commission européenne dévoilait sa réglementation sur l'usage de l'intelligence artificielle au sein des entreprises et institutions européennes. Le Contrôleur Européen...

Données vocales : Le Voice Lab et Datafunding lancent une campagne de data funding

Les technologies vocales ont connu un grand boom ces dernières années avec des solutions innovantes, des projets de recherche avec de nombreuses applications mais aussi la question de la protection des données. C’est dans ce cadre que le Voice Lab et Datafunding ont lancé une campagne de data funding avec pour principal objectif de collecter 2 000 heures de données vocales.

Cette initiative invite les Français à faire don de leurs données vocales afin de co-construire les technologies vocales de demain, ouvertes et au service de tous et mettre la voix au service d’une intelligence artificielle citoyenne. Au travers de cette collecte disponible sur le site de Datafunding, les utilisateurs peuvent partager leurs données vocales et aider ainsi la recherche, ainsi que l’ensemble de l’écosystème numérique de la voix et l’innovation en France, en Europe et dans le monde francophone.

« Le Message que nous souhaitons transmettre aux utilisateurs de Google Home, Alexa ou Siri l’appel suivant : les données de votre assistant vocal vous appartiennent. Faites-en don à la recherche française ! », explique Karel Bourgois, Président du Voice Lab.

« Aujourd’hui, de plus en plus de personnes souhaitent bénéficier d’appareils avec lesquels elles peuvent réellement communiquer naturellement. Pour développer de tels systèmes il est nécessaire d’accéder à des données vocales libres. C’est pourquoi nous lançons une campagne de data funding citoyen dans le respect des données personnelles. Chaque participant est invité à partager les données vocales stockées chez les GAFAM dans une marketplace française ! Celles-ci permettront à l’écosystème vocal français de développer des technologies souveraines indépendantes des géants du numérique que sont les GAFAM et BATX. Cet acte citoyen permettra de soutenir l’écosystème vocal français et le développement d’une technologie vocale diverse, dynamique et souveraine. »

Les données utilisateurs ont de la valeur. Le Voice Lab souhaite sensibiliser les citoyens sur la pleine propriété qu’ils gardent sur les données recueillies par les différents services d’Assistants Vocaux tels que Google Home, Alexa ou Siri. Le Voice Lab permet aujourd’hui aux citoyens de décider qui peut disposer de leurs données vocales et pour quels objectifs.

Devenus incontournables, les assistants vocaux sur enceintes connectées ou sur d’autres canaux vocaux comme le téléphone, reposent sur des moteurs de reconnaissance de la parole entraînés sur de très grands jeux de données récoltées auprès des utilisateurs lors de leurs interactions et auxquels seules quelques grandes entreprises ont accès. Grâce à l’opération de Data funding du Voice Lab, les utilisateurs peuvent dorénavant partager leurs données vocales et aider ainsi la recherche, ainsi que l’ensemble de l’écosystème numérique de la voix et l’innovation en France, en Europe et dans le monde francophone.

Le Voice Lab et Datafunding ont mis en place un site web qui permet très simplement à chaque utilisateur de donner son consentement au Voice Lab afin que celui-ci puisse récupérer ses données vocales auprès des éditeurs des assistants vocaux. Cet outil permet de gérer les consentements et de les révoquer automatiquement, si l’utilisateur décide d’arrêter sa contribution au Voice Lab.

Une fois récoltées les données sont anonymisées et normalisées pour contribuer aux corpus et créer des modèles de transcription indépendants et contributifs.

L’objectif principal est bien de mutualiser les données et de concevoir des modèles de reconnaissance vocale en langue française pour alimenter différents services de transcription automatique de la parole, entre autres open source. Les moteurs permettent ainsi aux différents acteurs – académiques, privés ou publics – de créer des services ou des produits vocaux en toute indépendance des GAFAM. Les laboratoires Français pourront ainsi lever de nombreux verrous, en particulier liés au volume et à la diversité des données disponibles.

La mission du Voice Lab est de créer une alternative aux solutions et aux modèles économiques existants, afin de garantir d’un côté le respect de la vie privée des utilisateurs et de l’autre de prévenir une dépendance économique aux GAFA et BATX sur les interfaces vocales qui seront les interfaces du futur.

Le Voice Lab (levoicelab.org) précise que ces données seront hébergées dans le strict respect de la vie privée et du droit relatif à la protection des données personnelles et que l’objectif est avant tout degarantir que les données des utilisateurs seront utilisées en respectant les valeurs de l’IA éthique by design, telles que le respect, la transparence, la loyauté, la sécurité, l’équité et la maîtrise.

Cette campagne est l’occasion de communiquer auprès du grand public et de faire connaître cette initiative auprès des citoyens.

Quelques exemples de produits et services qui pourront être créés par les membres du Voice Lab grâce à ces données :

  • Des applications de la reconnaissance vocale qui s’imposent dans de nombreux domaines métiers et sont par ailleurs à la base d’avancées en termes d’accessibilités (handicap visuel et auditif, illectronisme) ;
  • Création d’assistants vocaux embarqué ;
  • Compréhension des conversations téléphoniques avec un téléconseiller ;
  • Création d’assistants vocaux pour téléphone ou enceinte connectée ;
  • Aide aux malentendants ;
  • Sous-titrage et veille médias.


1ère Marketplace de l'IA et de la transformation numérique vous recommande :
 
Thomas Calvi

Partager l'article

United Robotics envisagerait l’achat de Pepper, division française de Softbank.

Selon Reuters, Softbank, après avoir donné un coup d'arrêt à la production des robots Peppers créés en 2014, a engagé des pourparlers avec United...

800 millions du plan France 2030 consacrés à la Robotique.

Lundi 25 octobre dernier, lors de la Visite du groupe Siléane à Saint-Etienne, Emmanuel Macron a annoncé que le plan d'investissement France 2030 allait...

Le nouveau GPU d’ARM, doté d’une puissance de calcul 30% supérieure à celle du Mali-G710 arrive en 2022

Les puces de conception ARM sont utilisées dans les domaines allant de l'Intelligence Artificielle à la 5G (pratiquement tous le smartphones en sont équipés)....

États-Unis : pluie de critiques sur la création éventuelle d’un centre de recherche national dédié à l’intelligence artificielle

La course à l'intelligence artificielle continue et les États-Unis cherchent à renforcer leur leadership dans le domaine face à une Chine qui aspire à dominer...