Home Tags Apprentissage par renforcement

apprentissage par renforcement

L’apprentissage par renforcement sur les TPU Google Cloud

L’apprentissage par renforcement (reinforcement learning ou RL) a de nombreuses applications : robot, voiture autonome, chatbot… Cependant, son adoption pour les applications du monde réel est entravée par des défis d’ingénierie majeurs. Les pods TPU de Google C...

Un joueur de go amateur se sert des failles de l’IA Katago pour la vaincre

En 2016, AlphaGo, développé par Google DeepMind, se mesurait à Lee Sedol, l’un des meilleurs joueurs de go au monde et remportait la victoire par 4 jeux à 1, ce qui laissait toutefois penser qu’il n’était pas totalement infaillible. Kellin Pelrine, un joueur américain qui e...

Robotique et apprentissage par renforcement : focus sur ReLMM, le système développé par les chercheurs de BAIR

L’apprentissage par renforcement (Reinforcement Learning) est une méthode de machine learning qui nécessite la plupart du temps une supervision et une instrumentation approfondies pour le monde réel. Des chercheurs de BAIR (Berkeley AI Research) l’ont appliqué à la robotiqu...

Nebuly présente ChatLLaMA, un nouveau concurrent de ChatGPT, basé sur LLaMA, le grand modèle de langage de Meta

Seulement quelques jours après la publication de LLaMA, la collection de grands modèles de langage fondamentaux de Meta, allant de 7 à 65 milliards de paramètres, Nebuly présentait la première implémentation open-source de LLaMA basée sur l’apprentissage par renforcement à partir...

OpenAI officialise une nouvelle version pour son modèle de langage GPT-3

L’entreprise de recherche et de déploiement d’IA OpenAI officialise son nouveau modèle ‘text-davinci-003’ qui s’ajoute à la famille de modèles GPT-3 et qui s’appuie sur les précédents modèles InstructGPT. Ce dernier permet d’apporter un comportement amélioré dans le rendu obtenu ...

Meta AI présente CICERO, un agent d’IA capable de négocier et coopérer avec les humains

Meta a récemment présenté CICERO, une IA qui atteint des performances de niveau humain dans la version en ligne de Diplomacy, un jeu de stratégie dans lequel il a communiqué et négocié en langage naturel avec des joueurs humains sans que ceux-ci ne sachent qu’ils avaient af...

Deepmind AI présente « DeepNash », l’agent autonome RL sans modèle, expert du jeu « Classic Stratego »

Pour les IA, les jeux de société sont de formidables terrains d’apprentissage, ce qui leur a permis de battre les humains au jeu de Go, aux échecs, au poker, au backgammon… Stratego est l’un des jeux de société que l’IA n’a pas encore maîtrisé, des c...

Instant NeRF de NVIDIA : transformer des images 2D en scènes 3D en un temps record

C’est lors d’une session de NVIDIA GTC, en mars dernier, que Instant NeRF, technologie basée sur un réseau de neurones capable de transformer un ensemble de photos 2D en scènes 3D haute résolution en quelques secondes a été présentée. Selon l’équipe NVIDIA Resea...

Découvrez les profils des cinq membres du Mila nommés titulaires d’une chaire en IA CANADA-CIFAR

Le CIFAR, organisme mondial de recherche, a nommé en ce mois de décembre cinq chercheuses et chercheurs du Mila, l’Institut québécois d’intelligence artificielle, titulaires d’une chaire en IA. Ces derniers recevront un financement à long terme pour soutenir leurs travaux d...

PyTorch : La librairie SaLinA expliquée par Ludovic Denoyer (FAIR)

Le mois dernier, FAIR présentait SaLinA, une librairie légère utilisant notamment une approche basée sur des agents pour mettre en œuvre des modèles de décision séquentiels, y compris (mais pas seulement) des algorithmes reinforcement learning. Pour en savoir plus, nous avons éch...

Google élabore un modèle d’apprentissage par renforcement pour fabriquer des puces plus rapidement

En mai dernier, Google a annoncé dans son édition 2021 du Google I/O, la quatrième génération de ses puces TPU (TPUv4). Une équipe de recherche de la firme de Mountain View a développé un modèle de machine learning, et plus précisément, d’apprentissage par renforcement, cap...

Samsung, IBM, Nvidia, Google : l’intelligence artificielle dans le processus de conception des composants électroniques

Alors que la pénurie des composants électroniques fait rage partout dans le monde, cela n’empêche pas certains grands groupes technologiques d’innover et d’explorer de nouveaux modes de conception. C’est le cas de Samsung qui a annoncé avoir intégré le mod...

L’apprentissage supervisé et par renforcement pour aider les robots à s’adapter à tout type d’environnement

A travers Rapid Motor Adaptation (RMA), Facebook progresse dans l’adaptation des robots à leur environnement, afin de développer leur motricité. Adapter les robots à un environnement tout comme un humain peut le faire au quotidien Les humains peuvent marcher avec une relati...

Microsoft propose gratuitement une formation en ligne autour du machine learning sur GitHub

En Europe, les cours en ligne autour de l’intelligence artificielle tendent à se démocratiser : la Finlande a lancé Elements of AI dans le but de former les citoyens européens aux bases de l’IA et l’Institut Montaigne propose son programme de formation OpenClass...

Deepmind lance AndroidEnv, une librairie d’apprentissage par renforcement pour Android

DeepMind, la filiale spécialisée dans l’intelligence artificielle de Google, a annoncé le développement de son nouvel outil AndroidEnv. Il s’agit d’une plateforme open source d’apprentissage par renforcement (RL) pour l’écosystème Android. Elle perme...

Un modèle d’intelligence artificielle permet de réfuter certaines conjectures mathématiques

En mathématiques, une conjecture est un résultat qui semble vrai, mais pour lequel aucune démonstration n’a été trouvée : c’est ce qui la diffère du théorème ou de la propriété qui peut être prouvé dans tous les cas où elle est applicable. Un postdoctorant de l’...

Recevez le numéro 4 d’ActuIA, le magazine de l’intelligence artificielle !

Le numéro 4 d’ActuIA, le magazine de l’intelligence artificielle, arrive en kiosques et en version numérique le 18 mai 2021 ! Recevez-le directement chez vous ou au travail en vous abonnant dès aujourd’hui. Au programme des dossiers, des analyses sur l’IA ...

ThreeDWorld Transport Challenge : un défi pour tester l’interaction des robots dans un environnement

Dans le cadre d’une étude, plusieurs chercheurs d’IBM, du Massachussetts Institute of Technology (MIT) et de l’Université de Stanford se sont associés pour lancer le “ThreeDWorld Transport Challenge”. Son objectif est d’évaluer la capacité des ...

Microsoft présente BioMed Search, un outil permettant d’effectuer des recherches d’informations dans la littérature biomédicale

Microsoft a présenté en ce mois de mars Microsoft Biomedical Search, un outil aux chercheurs permettant d’effectuer des recherches dans toute la littérature biomédicale avec des requêtes en langage naturel plutôt que des mots-clés. Ce prototype est le résultat des efforts e...

DeepMind présente une solution de génération automatique d’algorithmes d’apprentissage par renforcement

Les chercheurs de DeepMind ont présenté le 17 juillet dernier dans un article sur Arxiv une étude sur les algorithmes d’apprentissage par renforcement. Junhyuk Oh, Matteo Hessel, Wojciech M. Czarnecki, Zhongwen Xu, Hado van Hasselt, Satinder Singh et David Silver ont travaillé su...

Replay Dataquitaine : Processus de Décision Markovien et Apprentissage par Renforcement

Dataquitaine propose en replay son Atelier-Webinaire Data Science, organisé par Digital Aquitaine, le 30 juin 2020. Ce séminaire était dédié à la thématique “Processus de Décision Markovien et Apprentissage par Renforcement” avec Emmanuel Hyon. Les problèmes liés à l’...

LightOn lance son service LightOn Cloud 2.0 avec des OPUs Aurora dernière génération

Spécialiste des technologies photoniques d’accélération de l’IA, LightOn annonce ce jour une mise à jour majeure de son service LightOn Cloud. Avec l’ajout de nouvelles fonctionnalités et une disponibilité pour l’ensemble de la communauté internationale en intelligenc...

L’EDF Lab Paris-Saclay accueillera le laboratoire de recherche en intelligence artificielle d’EDF, Thales et Total

EDF, Thales et Total ont lancé ce 7 février leur premier laboratoire commun de recherche en intelligence artificielle. Intégré dans les locaux d’EDF Lab Paris-Saclay, il s’inscrit dans la stratégie AI For Humanity et développera une IA de confiance au service des systèmes c...

Robotique : Des chercheurs de l’ETH Zürich et d’Intel présentent leur approche d’entraînement mixte

Des chercheurs de l’ETH Zürich et d’Intel ont travaillé sur le robot ANYmal et développé un processus d’entraînement mêlant le réel et la simulation. Cette approche mixte est présentée dans la revue « Science Robotics ». Les robots quadrupèdes pourraient avoir d...

Intelligence artificielle : démonstration en direct des nouvelles performances de DeepMind

DeepMind présentera aujourd’hui à 19H heure française les nouvelles performances de son intelligence artificielle sur l’environnement de StarCraft II dans un live stream. Pourquoi DeepMind s’intéresse autant aux jeux ? On ne présente plus DeepMind, véritable réf...

Apprentissage par renforcement #9 : Jouer à un jeu d’arcade

Dans cette nouvelle vidéo sur l’apprentissage par renforcement, nous voyons comment implémenter un agent capable de jouer à un jeu d’arcade. Apprentissage par renforcement Partie 1 – Introduction Partie 2 – Exploration et exploitation Partie 3 – Fonc...

Apprentissage par renforcement #8 : Les dangers de son application dans le monde réel

Suite de la série de vidéos de formation à l’apprentissage par renforcement. Cette vidéo introduisant aux dangers de son application dans le monde réel a été captée lors d’une intervention à FrenchData. Apprentissage par renforcement Partie 1 – Introduction Part...

Tutoriel : créer une intelligence artificielle sur Starcraft II

Apprenez comment créer une intelligence artificielle avec apprentissage par renforcement sur Starcraft 2 grâce au wrapper Pysc2 publié par DeepMind. DeepMind et Blizzard, éditeur du jeu Starcraft II, ont collaboré afin de faire du moteur du jeu un environnement de recherche sur l...

Amazon lance DeepRacer, une mini-voiture autonome pour s’initier à l’apprentissage par renforcement

Amazon vient d’annoncer DeepRacer, une mini-voiture autonome à l’échelle 1/18e permettant de s’initier à l’apprentissage par renforcement. Amazon n’en est pas à son premier produit destiné aux développeurs voulant s’essayer à l’intelligen...

DeepMind publie des vidéos de cours sur le Deep Learning et l’apprentissage par renforcement

DeepMind, startup phare dans le domaine de l’intelligence artificielle, qui est notamment à l’origine d’AlphaGo vient de publier une nouvelle série de cours en vidéo. Cette série de cours est disponible en anglais sur youtube. DeepMind avait déjà publié en mai 2...

Apprentissage par renforcement #5 : Introduction au Q-Learning

Série de vidéos consacrée à l’apprentissage par renforcement. Dans cette vidéo, nous explorons l’algorithme du Q-Learning, très utilisé dans l’apprentissage par renforcement. Le code : Github Apprentissage par renforcement Partie 1 – Introduction Partie 2 ...

Apprentissage par renforcement #4 : Premier jeu

Série de vidéos consacrée à l’apprentissage par renforcement. Dans cette vidéo, nous créons notre premier jeu en se basant sur les concepts présentés dans les vidéos précédentes. Le code : https://github.com/thibo73800/aihub/blob/master/rl/sticks.py Apprentissage par renfor...

Apprentissage par renforcement : le concept de fonction de valeur

Nous abordons dans cette vidéo le concept de fonction de valeur. Apprentissage par renforcement Partie 1 – Introduction Partie 2 – Exploration et exploitation Partie 3 – Fonction de valeur Partie 4 – Premier jeu Partie 5 – Introduction au Q Learning ...

Apprentissage par renforcement : exploration et exploitation

Découvrez les concepts d’exploration et exploitation en apprentissage par renforcement. Apprentissage par renforcement Partie 1 – Introduction Partie 2 – Exploration et exploitation Partie 3 – Fonction de valeur Partie 4 – Premier jeu Partie 5 –...

L’apprentissage par renforcement

Dans cette nouvelle série de vidéos, Thibault Neveu propose une introduction à l’apprentissage par renforcement (reinforcement learning). Apprentissage par renforcement Partie 1 – Introduction Partie 2 – Exploration et exploitation Partie 3 – Fonction de v...

Télécom Evolution lance le Certificat d’Etudes Spécialisées (CES) Intelligence artificielle

Télécom Evolution lance le Certificat d’Etudes Spécialisées (CES) Intelligence artificielle. Conçu et réalisé par Télécom ParisTech et ENSTA ParisTech, et placé sous la responsabilité de Florence D’Alche-Buc, il formera les professionnels à différentes techniques de l...

Appel à papiers pour la conférence sur l’Apprentissage Automatique CAp 2018

La conférence sur l’Apprentissage Automatique CAp se tiendra du 20 au 22 juin prochain. Organisée par l’INSA de Rouen, elle se veut un rassemblement interdisciplinaire de chercheurs à l’intersection du machine learning, des mathématiques appliquées et des domain...

Grâce au Lifelong Learning et au projet LIHLITH, Synapse cherche à améliorer les capacités d’auto-apprentissage des IA

Machine learning, Deep learning, apprentissage supervisé ou non-supervisé, de nombreux projets cherchent à améliorer les techniques d’apprentissage des intelligences artificielles. La start-up toulousaine Synapse Développement a décidé de se lancer dans un très intéressant ...

« Comment les machines peuvent-elle apprendre aussi efficacement que les animaux et les hommes? » Yann LeCun, Brown University

Dans le cadre des Brown Statistics, NESS Seminar and Charles K. Colver Lectureship Series, l’Université Brown a accueilli le 27 novembre dernier Yann LeCun pour une conférence sur l’intelligence artificielle intitulée “How Could Machines Learn as Efficiently as ...

Facebook ouvre un nouveau laboratoire laboratoire de recherche en intelligence artificielle et investit à Montréal

En 2015, Facebook avait créé à Paris le FAIR, son laboratoire de recherche en intelligence artificielle, dirigé par Yann LeCun. C’est désormais à Montréal que le géant des réseaux sociaux a décidé de se développer. Un second laboratoire dans un pôle attractif Le Canada, et ...

DeepLoco: un modèle informatique bipède entrainé par apprentissage à renforcement hiérarchique

Des chercheurs de l’Université Nationale de Singapour et de l’Université de Colombie-Britannique travaillent sur un modèle informatique bipède capable de se déplacer et d’effectuer des trajets sur des terrains difficiles. L’apprentissage de la capacité de ...

Graphcore: Un processeur qui enthousiasme OpenAI, Demis Hassabis, Uber, Dell ou encore Bosch

Graphcore vient d’annoncer une levée de fonds de 30 millions de dollars. Ce nouveau financement va permettre à la société spécialisée en machine intelligence de lancer la commercialisation de son premier processeur IPU. Hermann Hauser, co-fondateur et associé d’Amadeu...

DeepMind dévoile une expérimentation d’apprentissage par renforcement

DeepMind a dévoilé une nouvelle recherche axée ‘Intelligence artificielle’ intitulée Emergence of Locomotion Behaviours in Rich Environments. Les chercheurs se sont centrés sur l’apprentissage par renforcement. Évoluer dans des environnements complexes et inconn...

L’apprentissage par renforcement au centre de l’IA d’Apple

Ruslan Salakhutdinov, directeur de recherche sur l’intelligence artificielle chez Apple arrivé en octobre dernier, a parlé d’une partie des recherches en cours au sein de la firme, dans le domaine de l’intelligence artificielle, à l’occasion de la conférence EmT...