Dossiers DeepLoco: un modèle informatique bipède entrainé par apprentissage à renforcement hiérarchique

Pour approfondir le sujet

Sur le même thème :

Appel à papiers pour la conférence sur l’Apprentissage Automatique CAp 2018

La conférence sur l'Apprentissage Automatique CAp se tiendra du 20 au 22 juin prochain. Organisée par l'INSA de Rouen, elle se veut un rassemblement...

L’EDF Lab Paris-Saclay accueillera le laboratoire de recherche en intelligence artificielle d’EDF, Thales et Total

EDF, Thales et Total ont lancé ce 7 février leur premier laboratoire commun de recherche en intelligence artificielle. Intégré dans les locaux d’EDF Lab...

Facebook ouvre un nouveau laboratoire laboratoire de recherche en intelligence artificielle et investit à Montréal

En 2015, Facebook avait créé à Paris le FAIR, son laboratoire de recherche en intelligence artificielle, dirigé par Yann LeCun. C'est désormais à Montréal...

DeepMind présente une solution de génération automatique d’algorithmes d’apprentissage par renforcement

Les chercheurs de DeepMind ont présenté le 17 juillet dernier dans un article sur Arxiv une étude sur les algorithmes d’apprentissage par renforcement. Junhyuk Oh,...

DeepLoco: un modèle informatique bipède entrainé par apprentissage à renforcement hiérarchique

Des chercheurs de l’Université Nationale de Singapour et de l’Université de Colombie-Britannique travaillent sur un modèle informatique bipède capable de se déplacer et d’effectuer des trajets sur des terrains difficiles.

L’apprentissage de la capacité de locomotion

Baptisé DeepLoco, ce projet mené par Xue Bin Peng, Glen Berseth, KangKang Yin et Michiel van de Panne vise à parvenir à faire se déplacer un modèle bipède dans un environnement dont il serait conscient, en lui ayant fourni au préalable peu de connaissances.

D’autres projets de recherche se focalisent sur un apprentissage préalable des formes afin que le modèle informatique puisse se repérer. DeepLoco privilégie quant à lui le contrôle hiérarchique.

Le Hierarchical Reinforcement Learning

Pour ce faire, l’équipe de chercheurs a utilisé le Hierarchical Reinforcement Learning et un framework de contrôle hiérarchique à deux niveaux. La combinaison de contrôleurs bas niveau et haut niveau permet la simulation du bipède 3D de cette vidéo. Ces deux types de contrôleurs sont entraînés par deep reinforcement learning.

Les contrôleurs haut niveau permettent au modèle de prendre des décisions, de suivre les chemins, d’éviter les obstacles, etc. Les contrôleurs bas niveau visent quant à eux à développer le rythme de déplacement, les mouvements et la robustesse en fonction notamment du terrain.

Source:

DeepLoco: Dynamic Locomotion Skills Using Hierarchical Deep Reinforcement Learning ; Xue Bin Peng, Glen Berseth, KangKang Yin et Michiel van de Panne ; ACM Transactions on Graphics (Proc. SIGGRAPH 2017) ;
vol. 36, n°4, article 41, 2017.


1ère Marketplace de l'IA et de la transformation numérique vous recommande :
 
Johanna Diaz

Partager l'article

Levée de fonds de 6 millions d’euros de la fintech lyonnaise Mon Petit Placement

Mon Petit Placement, start-up lancée en 2017, a bouclé en ce mois de novembre sa troisième levée de fonds pour un montant de 6...

Lutte contre la cybercriminalité : l’exemple du défi IA lancé par le gouvernement canadien aux petites entreprises

Comme les autres organismes de police canadiens, la Gendarmerie royale du Canada (GRC) peine à accéder aux données chiffrées saisies lors d'enquêtes criminelles. C'est...

Continuity annonce une levée de fonds de 5 millions d’euros auprès d’Elaia Partners, Bpifrance et Kamet Ventures

Continuity a levé 5 millions d’euros en Seed auprès d'Elaia Partners, Bpifrance et Kamet Ventures a annoncé la jeune pousse cette semaine. La start-up...

ADAM9, un gène potentiellement impliqué dans les formes graves de Covid-19 identifié par l’intelligence artificielle

Pourquoi certains patients atteints de Covid-19 sont-ils asymptomatiques alors que d'autres développent des formes graves, notamment le SDRA (syndrome de détresse respiratoire aigüe) ?...
Recevoir une notification en cas d'actualité importante    OK Non merci