Tutoriels intelligence artificielle Starcraft II : Apprendre à un agent à se déplacer

Pour approfondir le sujet

Sur le même thème :

Prédictions Kaspersky : détournement de l’IA, open source et hacktivisme, à quoi s’attendre des APT en 2025 ?

La Global Research and Analysis Team (GReAT) de Kaspersky, un acteur mondial de la cybersécurité, a récemment publié ses prédictions pour 2025 en matière...

Sora Turbo : l’IA générative de vidéos d’OpenAI est désormais disponible

En février dernier, OpenAI dévoilait son premier modèle text-to-video, Sora, depuis lors en preview. La société a annoncé ce 9 décembre le déploiement de...

Deux ans après l’arrivée de ChatGPT, comment la GenAI transforme la recherche en ligne et le marketing

Alors que ChatGPT vient de fêter son second anniversaire et compte aujourd'hui plus de 300 millions d'utilisateurs hebdomadaires, le rapport "Online Search After ChatGPT:...

Llama 3.3 70B : Meta dévoile son dernier ajout à la famille Llama 3, un modèle particulièrement efficace

Alors que Meta prépare le lancement des premiers modèles Llama 4 pour le début de l'année prochaine, l'entreprise a dévoilé en fin de semaine...

Starcraft II : Apprendre à un agent à se déplacer

Cette nouvelle vidéo de la série dédiée à la création d’agents pour Starcraft II permet de mettre en application la notion de policy gradient apprise dans le cadre de la série de vidéos sur l’apprentissage par renforcement.

Accéder au début de la série consacrée à l’apprentissage par renforcement
Accéder à l’épisode de la série apprentissage par renforcement introduisant la notion de policy gradient.

Le code de la grille: https://github.com/thibo73800/aihub/blob/master/rl/policy_gradient.py

Le code du premier level: https://github.com/thibo73800/starcraft-reinforcement-learning

Contributeur expert

Thibault Neveu

Thibault Neveu est un entrepreneur, ingénieur de recherche spécialisé dans l’apprentissa

Partager l'article

Prédictions Kaspersky : détournement de l’IA, open source et hacktivisme, à quoi s’attendre des APT en 2025 ?

La Global Research and Analysis Team (GReAT) de Kaspersky, un acteur mondial de la cybersécurité, a récemment publié ses prédictions pour 2025 en matière...

Sora Turbo : l’IA générative de vidéos d’OpenAI est désormais disponible

En février dernier, OpenAI dévoilait son premier modèle text-to-video, Sora, depuis lors en preview. La société a annoncé ce 9 décembre le déploiement de...

Deux ans après l’arrivée de ChatGPT, comment la GenAI transforme la recherche en ligne et le marketing

Alors que ChatGPT vient de fêter son second anniversaire et compte aujourd'hui plus de 300 millions d'utilisateurs hebdomadaires, le rapport "Online Search After ChatGPT:...

Llama 3.3 70B : Meta dévoile son dernier ajout à la famille Llama 3, un modèle particulièrement efficace

Alors que Meta prépare le lancement des premiers modèles Llama 4 pour le début de l'année prochaine, l'entreprise a dévoilé en fin de semaine...