Tutoriels intelligence artificielle Apprentissage par renforcement #8 : Les dangers de son application dans le...

Pour approfondir le sujet

Sur le même thème :

Google élabore un modèle d’apprentissage par renforcement pour fabriquer des puces plus rapidement

En mai dernier, Google a annoncé dans son édition 2021 du Google I/O, la quatrième génération de ses puces TPU (TPUv4). Une équipe de...

Intelligence artificielle : démonstration en direct des nouvelles performances de DeepMind

DeepMind présentera aujourd'hui à 19H heure française les nouvelles performances de son intelligence artificielle sur l'environnement de StarCraft II dans un live stream. Pourquoi DeepMind...

DeepMind dévoile une expérimentation d’apprentissage par renforcement

DeepMind a dévoilé une nouvelle recherche axée 'Intelligence artificielle' intitulée Emergence of Locomotion Behaviours in Rich Environments. Les chercheurs se sont centrés sur l'apprentissage...

Graphcore: Un processeur qui enthousiasme OpenAI, Demis Hassabis, Uber, Dell ou encore Bosch

Graphcore vient d'annoncer une levée de fonds de 30 millions de dollars. Ce nouveau financement va permettre à la société spécialisée en machine intelligence...

Apprentissage par renforcement #8 : Les dangers de son application dans le monde réel

Suite de la série de vidéos de formation à l’apprentissage par renforcement. Cette vidéo introduisant aux dangers de son application dans le monde réel a été captée lors d’une intervention à FrenchData.

Apprentissage par renforcement

Partie 1 – Introduction
Partie 2 – Exploration et exploitation
Partie 3 – Fonction de valeur
Partie 4 – Premier jeu
Partie 5 – Introduction au Q Learning
Partie 6 – Apprentissage par renforcement avec Q Learning
Partie 7 – Créer une intelligence artificielle sur le moteur de Starcraft II
Partie 8 – Apprentissage par renforcement : les dangers de son application
Partie 9 – Jouer à un jeu d’arcade

Contributeur expert

Thibault Neveu

Thibault Neveu est un entrepreneur, ingénieur de recherche spécialisé dans l’apprentissa

Partager l'article

Sora Turbo : l’IA générative de vidéos d’OpenAI est désormais disponible

En février dernier, OpenAI dévoilait son premier modèle text-to-video, Sora, depuis lors en preview. La société a annoncé ce 9 décembre le déploiement de...

Deux ans après l’arrivée de ChatGPT, comment la GenAI transforme la recherche en ligne et le marketing

Alors que ChatGPT vient de fêter son second anniversaire et compte aujourd'hui plus de 300 millions d'utilisateurs hebdomadaires, le rapport "Online Search After ChatGPT:...

Llama 3.3 70B : Meta dévoile son dernier ajout à la famille Llama 3, un modèle particulièrement efficace

Alors que Meta prépare le lancement des premiers modèles Llama 4 pour le début de l'année prochaine, l'entreprise a dévoilé en fin de semaine...

AgentLab, un framework open source pour le développement et l’évaluation des agents Web

Lancé par ServiceNow, AgentLab est un framework open source visant à faciliter le développement et l'évaluation d'agents Web. Son objectif principal est de soutenir...