Tutoriels intelligence artificielle Apprentissage par renforcement #5 : Introduction au Q-Learning

Pour approfondir le sujet

Sur le même thème :

Robotique : Des chercheurs de l’ETH Zürich et d’Intel présentent leur approche d’entraînement mixte

Des chercheurs de l'ETH Zürich et d'Intel ont travaillé sur le robot ANYmal et développé un processus d'entraînement mêlant le réel et la simulation....

DeepMind présente une solution de génération automatique d’algorithmes d’apprentissage par renforcement

Les chercheurs de DeepMind ont présenté le 17 juillet dernier dans un article sur Arxiv une étude sur les algorithmes d’apprentissage par renforcement. Junhyuk Oh,...

Intelligence artificielle : démonstration en direct des nouvelles performances de DeepMind

DeepMind présentera aujourd'hui à 19H heure française les nouvelles performances de son intelligence artificielle sur l'environnement de StarCraft II dans un live stream. Pourquoi DeepMind...

Google élabore un modèle d’apprentissage par renforcement pour fabriquer des puces plus rapidement

En mai dernier, Google a annoncé dans son édition 2021 du Google I/O, la quatrième génération de ses puces TPU (TPUv4). Une équipe de...

Apprentissage par renforcement #5 : Introduction au Q-Learning

Série de vidéos consacrée à l’apprentissage par renforcement. Dans cette vidéo, nous explorons l’algorithme du Q-Learning, très utilisé dans l’apprentissage par renforcement.

Le code : Github

Apprentissage par renforcement

Partie 1 – Introduction
Partie 2 – Exploration et exploitation
Partie 3 – Fonction de valeur
Partie 4 – Premier jeu
Partie 5 – Introduction au Q Learning
Partie 6 – Apprentissage par rnforcement avec Q Learning
Partie 7 – Créer une intelligence artificielle sur le moteur de Starcraft II
Partie 8 – Apprentissage par renforcement : les dangers de son application
Partie 9 – Jouer à un jeu d’arcade

Contributeur expert

Thibault Neveu

Thibault Neveu est un entrepreneur, ingénieur de recherche spécialisé dans l’apprentissa

Partager l'article

Deux ans après l’arrivée de ChatGPT, comment la GenAI transforme la recherche en ligne et le marketing

Alors que ChatGPT vient de fêter son second anniversaire et compte aujourd'hui plus de 300 millions d'utilisateurs hebdomadaires, le rapport "Online Search After ChatGPT:...

Llama 3.3 70B : Meta dévoile son dernier ajout à la famille Llama 3, un modèle particulièrement efficace

Alors que Meta prépare le lancement des premiers modèles Llama 4 pour le début de l'année prochaine, l'entreprise a dévoilé en fin de semaine...

AgentLab, un framework open source pour le développement et l’évaluation des agents Web

Lancé par ServiceNow, AgentLab est un framework open source visant à faciliter le développement et l'évaluation d'agents Web. Son objectif principal est de soutenir...

Pleias : des modèles de langages ouverts pour une IA éthique et transparente

Pleias, une start-up française, annonce le lancement de sa première famille de grands modèles de langage (LLM), définissant de nouvelles références en matière...