Dossiers DeepLoco: un modèle informatique bipède entrainé par apprentissage à renforcement hiérarchique

Pour approfondir le sujet

Découvrez Muzeek, la startup lancée par André Manoukian et Philippe Guillaud

Quelle meilleure occasion que ce 21 juin 2019 pour vous présenter Muzeek ? La startup, lancée par André Manoukian et Philippe Guillaud. L'idée à l'origine de...

CES Las Vegas : La Région Occitanie sélectionne 16 start-ups sur l’Eureka Park

À l'occasion du CES Las Vegas en janvier prochain, la région Occitanie a sélectionné 16 entreprises pour être accompagnées sur l'espace Eureka Park. Du 7 au...

Renault s’associe à Oktal pour créer ‘Autonomous Vehicle Simulation’

Renault a annoncé vouloir créer avec Oktal une coentreprise. Baptisée AVS ("Autonomous Vehicle Simulation"), ce projet devrait leur permettre d'avancer dans le domaine de...

LightOn lance son service LightOn Cloud 2.0 avec des OPUs Aurora dernière génération

Spécialiste des technologies photoniques d’accélération de l'IA, LightOn annonce ce jour une mise à jour majeure de son service LightOn Cloud. Avec l'ajout de...

DeepLoco: un modèle informatique bipède entrainé par apprentissage à renforcement hiérarchique

Des chercheurs de l’Université Nationale de Singapour et de l’Université de Colombie-Britannique travaillent sur un modèle informatique bipède capable de se déplacer et d’effectuer des trajets sur des terrains difficiles.

L’apprentissage de la capacité de locomotion

Baptisé DeepLoco, ce projet mené par Xue Bin Peng, Glen Berseth, KangKang Yin et Michiel van de Panne vise à parvenir à faire se déplacer un modèle bipède dans un environnement dont il serait conscient, en lui ayant fourni au préalable peu de connaissances.

D’autres projets de recherche se focalisent sur un apprentissage préalable des formes afin que le modèle informatique puisse se repérer. DeepLoco privilégie quant à lui le contrôle hiérarchique.

Le Hierarchical Reinforcement Learning

Pour ce faire, l’équipe de chercheurs a utilisé le Hierarchical Reinforcement Learning et un framework de contrôle hiérarchique à deux niveaux. La combinaison de contrôleurs bas niveau et haut niveau permet la simulation du bipède 3D de cette vidéo. Ces deux types de contrôleurs sont entraînés par deep reinforcement learning.

Les contrôleurs haut niveau permettent au modèle de prendre des décisions, de suivre les chemins, d’éviter les obstacles, etc. Les contrôleurs bas niveau visent quant à eux à développer le rythme de déplacement, les mouvements et la robustesse en fonction notamment du terrain.

Source:

DeepLoco: Dynamic Locomotion Skills Using Hierarchical Deep Reinforcement Learning ; Xue Bin Peng, Glen Berseth, KangKang Yin et Michiel van de Panne ; ACM Transactions on Graphics (Proc. SIGGRAPH 2017) ;
vol. 36, n°4, article 41, 2017.

Johanna Diaz

Partager l'article

Replay : Le “droit” des robots, réalité ou abus de langage ? avec Nathalie Nevejans et Serge Tisseron

Dans le cadre de son émission Matières à penser, Serge Tisseron avait reçu en 2018 Nathalie Nevejans, maîtresse de conférences en droit privé à...

Le Comité économique et social européen rend son Avis sur le Livre blanc sur l’Intelligence artificielle

À l'occasion de la session plénière du 16 juillet dernier, le Comité économique et social européen (CESE) a rendu son avis sur le Livre...

Données, intelligence artificielle et edge computing : Orange et Google Cloud annoncent un partenariat stratégique

Orange souhaite accélérer sa transformation digitale et annonce avoir signé un partenariat stratégique avec Google Cloud. Cet accord permettra notamment au groupe de développer...

Une équipe de chercheurs présente une intelligence artificielle différenciant les oiseaux d’une même espèce

Une équipe de scientifiques CNRS/ Université de Montpellier/ Université Paul-Valéry-Montpellier/ IRD/ EPHE/ CIBIO à l’Université de Porto ont présenté les résultats de leurs recherches sur...