Name: Voix et Intelligence artificielle : Deep Voice Paris se tiendra du 23 au 24 juin
Start: 2021-06-23T00:00
End: 2021-06-24T23:59
Location: SCAI IRCAM

Voix et Intelligence artificielle : Deep Voice Paris se tiendra du 23 au 24 juin

Johanna Diaz

23 juin 2021

Voix et Intelligence artificielle : Deep Voice Paris se tiendra du 23 au 24 juin

Chargement de la carte…

Date / Heure
Date(s) - 23/06/2021 - 24/06/2021
Toute la journée

Emplacement
SCAI IRCAM

Catégories

Organisé du 23 au 24 juin 2012 par par SCAI et l’Ircam, Deep Voice est l’événement parisien dédié à la voix et à l’intelligence artificielle. Son objectif est de réunir l’expertise technique et l’innovation business/entrepreneuriale durant 2 jours. Au programme : une présentation keynote, deux ateliers pratiques, une table ronde thématique et des moments de networking afin de favoriser l’échange et la collaboration entre tous les participants. Inscriptions via eventbrite.

Le 23 juin

10h – Keynote – Text-to-Speech neuronal expressif – Thomas Drugman (Amazon)

Les progrès récents de la synthèse vocale basée sur l’apprentissage profond ont rendu les voix artificielles presque indiscernables de la parole humaine dans les contenus neutres et courts. Cependant, il existe encore une lacune importante lorsqu’il s’agit de savoir comment les systèmes basés sur l’IA sont capables de rendre les émotions. Cet exposé se concentrera sur nos efforts, chez Amazon, pour combler ce fossé en rendant nos modèles génératifs plus expressifs et plus humains. Nous verrons comment ce progrès technologique a amélioré des produits tels qu’Amazon Alexa ou AWS Polly.

14h – Atelier #1 – Synthèse neuronale de la parole – Nicolas Obin (Ircam)

Le 24 juin

10h – Table ronde – Assistants, emo/co-bots et réalité virtuelle : comment la simulation des émotions va-t-elle modifier notre rapport affectif aux machines et notre immersion dans un monde social artificiel ?

Susana Sánchez Restrepo (SoftBank Robotics), Nadia Guerouaou (CHRU Lille), Catherine Pelachaud (Sorbonne Université), Jean-Julien Aucouturier (CNRS), Serge Tisseron (Université de Paris, Académie des technologies) / Nicolas Obin (modérateur)

14h – Atelier #2 – Vocodeur neuronal – Axel Röbel (Ircam)

Les 2 ateliers présenteront le fonctionnement des deux blocs essentiels d’un TTS neuronal à l’exemple du Tacotron 2.

Le premier atelier introduira aux concepts de linguistique générale, de la communication parlée, et du traitement automatique de la parole, puis présentera les détails de l’architecture Tacotron et de ses évolutions. Le second atelier expliquera le fonctionnement des réseaux post-net (WavNet et autres) utilisés pour reconstruire un signal de parole à partir d’une représentation en Mel-spectrogramme.

Le public visé par ces ateliers sont des ingénieurs ayant une bonne connaissance en deep learning et connaissant les environnements de programmation dédiés désireux de monter en compétences sur les architectures spécifiques en traitement automatique du langage et de la parole.

Voix et Intelligence artificielle : Deep Voice Paris se tiendra du 23 au 24 juin

Egalement dans l'actualité de l'intelligence artificielle

Anthropic lance le protocole MCP : une avancée majeure pour connecter...

Agents IA, Azure AI Foundry : les innovations Microsoft présentées à...

Nomination de Clara Chappaz : La voie vers une nouvelle mission...

ActuIA n°17 : ce que vous réserve le nouveau numéro du...

Clara Chappaz nommée à la tête du nouveau Secrétariat d’État chargé...

Performance et santé : le sport à l’ère de l’intelligence artificielle

Dernières contributions d'experts

Après ChatGPT : bilan de la SNIA au 7 décembre 2024

L’IA au service de la croissance : de l’accélération à la...

Smart manufacturing : libérer le potentiel de l’IA en repensant le...

Ajouter ActuIA à votre écran d'accueil