Intelligence artificielle Une équipe de l'Université de Columbia a développé un algorithme d'IA pour...

Pour approfondir le sujet

Sur le même thème :

Angela Fan, chercheuse chez META AI, veut générer des biographies des groupes marginalisés grâce à l’IA

Environ 20 % seulement des biographies sur le site en anglais de Wikipédia, l'un des sites web les plus consultés au monde, concernent des...

Deep learning : des chercheurs de l’Université Johns Hopkins présentent une nouvelle approche pour la prédiction des crises cardiaques dues à l’arythmie cardiaque

Les applications d'intelligence artificielle dans le domaine de la santé sont nombreuses, la prévention des crises cardiaques est notamment au cœur de nombreuses recherches. Une...

Docaposte annonce la création d’un pôle en data et intelligence artificielle

Docaposte, filiale numérique du groupe La Poste, ambitionne de devenir le référent français des solutions de confiance numérique. Dans cet objectif, elle a annoncé,...

Intelligence artificielle : Un algorithme pourrait prédire les risques de crise cardiaque

Des chercheurs du Cedars-Sinai Medical Center, un des plus importants hôpitaux de Los Angeles, ont développé un algorithme capable de mesurer avec précision les...

Une équipe de l’Université de Columbia a développé un algorithme d’IA pour lutter contre les microphones indiscrets

Il arrive que nous recevions des publicités sur un produit ou un service alors que nous en avons discuté peu de temps avant avec des amis ou en famille tranquillement à la maison. On peut s’interroger sur cette étrange coïncidence : serions-nous espionnés par l’assistant vocal que nous possédons, par certaines applications de notre smartphone, notre ordinateur, notre montre connectée ? Si cet espionnage n’est pas prouvé, il est techniquement possible. Une équipe de trois experts en deep learning de l’Université Columbia a mis au point un algorithme qui génère des sons, quasiment inaudibles pour l’humain, qui viennent brouiller les fréquences et ainsi empêcher nos propres appareils de nous espionner. Ils ont présenté leur recherche intitulée « Real-Time Neural Voice Camouflage » lors de la dernière ICLR, (Conférence Internationale sur les Représentations de l’Apprentissage, dédiée au deep learning).

Le natural language processing (NLP), ou traitement automatique des langues (TALN), est une branche de l’intelligence artificielle qui permet aux machines d’analyser la voix humaine pour la transcrire en texte, la comprendre, de formuler une demande ou répondre à un interlocuteur, comme Siri ou Alexa. Les algorithmes d’IA sont principalement divisés en deux groupes : la reconnaissance et la génération. Dans le cas du NLP, la  reconnaissance consiste à analyser et comprendre le son tandis que la génération effectue la synthèse. Les travaux de Mia Chiquier, Chengzhi Mao et Carl Vondrick, informaticiens à l’Université Columbia, portent sur ces deux domaines. Leur approche est innovante car ils y ont introduit les attaques prédictives.

La méthode Neural Voice Camouflage

Les modèles de reconnaissance vocale automatique intégrés dans presque tous les appareils intelligents ont le potentiel d’écouter les conversations. Au cours de la dernière décennie, des travaux ont démontré que les modèles de réseaux de neurones sont vulnérables aux petites perturbations additives, au bruit ambiant… Cependant, le streaming audio est un domaine particulièrement difficile à perturber car le calcul doit être effectué en temps réel et les logiciels développés jusque là pour contrecarrer l’espionnage n’étaient pas suffisamment efficaces.

Les altérations du signal sonore rendent presque impossible pour une machine de suivre le rythme du discours d’une personne. Les enjeux majeurs pour l’équipe ont été l’optimisation et la rapidité : leur algorithme pour être efficient devait pouvoir prédire un changement de ton ou de vitesse de la parole et s’y adapter.

Les attaques prédictives pour empêcher les écoutes intrusives

L’équipe a introduit des attaques prédictives capables de perturber n’importe quel mot que les modèles de reconnaissance automatique de la parole sont entraîner à transcrire.

Il s’agit en fait d’un signal diffusé à l’aide d’un ordinateur, dont les fréquences hertziennes  varient en fonction des caractéristiques vocales de l’orateur, à une fréquence d’environ 16 kHz, qui ressemble au bruit d’un climatiseur silencieux en arrière-plan selon les chercheurs.

L’algorithme de deep learning, entraîné à partir d’un ensemble de données de parole étiquetées à grande échelle, prédit ce qui va suivre. Ensuite, il va générer un modèle de bruit adapté à la prédiction, qui va rendre le discours à venir incompréhensible pour un outil de reconnaissance automatique de la parole.

Mia Chiquier, professeure adjoint d’informatique, première autrice de cette étude, déclare :

« Notre algorithme parvient à empêcher un microphone malveillant de saisir correctement vos paroles dans 80 % des cas. Il fonctionne même lorsque nous ne savons rien du microphone malveillant, comme son emplacement ou même le logiciel qui l’utilise. »

L’algorithme n’en est qu’au stade de prototype, l’équipe qui poursuit ses travaux, aimerait le proposer sous forme d’une application à télécharger dans diverses langues.

Sources de l’article :
Real-Time Neural Voice Camouflage
Mia Chiquier, Chengzhi Mao, Carl Vondrick
Columbia University
ICLR 2022 (Oral)


1ère Marketplace de l'IA et de la transformation numérique vous recommande :
 
Thomas Calvi

Partager l'article

Quel rôle l’intelligence artificielle joue-t-elle dans la lutte contre les incendies de forêt ?

Le Maroc, l'Espagne et la France connaissent actuellement une vague de chaleur très importante qui surprend les météorologues car elle arrive précocement. Avec le...

L’UMONS introduit 40 portefeuilles projets FEDER-FSE+ pour un budget de plus de 280 millions d’euros

Le FEDER (Fonds Européen de Développement Régional) et le FSE (Fonds Social Européen Plus) ont pour objectif de renforcer la cohésion sociale et économique...

Yoshua Bengio fait son entrée dans le dictionnaire Larousse

Nouveau signe de la popularisation de l'intelligence artificielle, le directeur scientifique de Mila et professeur à l’Université de Montréal, Yoshua Bengio, intègre le Petit...

METAFORA biosystems lance METAflow, logiciel cloud d’analyse numérique de cytométrie en flux

METAFORA Biosystems, une société qui a développé une plateforme de cytométrie en flux alimentée par l'IA pour générer des diagnostics in vitro (DIV) plus...
Recevoir une notification en cas d'actualité importante    OK Non merci