Robotique : Des chercheurs de l’ETH Zürich et d’Intel présentent leur approche d’entraînement mixte

Robotique : Des chercheurs de l’ETH Zürich et d’Intel présentent leur approche d’entraîne
Actu IA

Des chercheurs de l’ETH Zürich et d’Intel ont travaillé sur le robot ANYmal et développé un processus d’entraînement mêlant le réel et la simulation. Cette approche mixte est présentée dans la revue « Science Robotics ».

Les robots quadrupèdes pourraient avoir de nombreuses fonctions comme l’ont mis en avant les chercheurs de l’École polytechnique fédérale de Zürich et d’Intel :

« [Ils] pourraient un jour secourir des gens dans les forêts et les montagnes, monter des escalier pour transporter des charges utiles sur des chantiers, inspecter des cavités souterraines, et explorer d’autres planètes. »

Cependant l’entraînement de tels robots dans le monde réel en partant de zéro peut être problématique : durée d’itérations, risque de casse et coût des prototypes. Une piste intéressante que nous évoquions récemment est l’apprentissage mixte, composé d’une phase de pré-apprentissage sur simulation suivie de nouvelles étapes d’apprentissage dans le monde réel permettant d’affiner le comportement du robot.

Le passage de la simulation au monde réel est cependant perçu comme étant d’une grande difficulté du fait qu’il est impossible de modéliser un environnement virtuel parfaitement fidèle à la réalité de notre monde physique.

Les chercheurs de l’ETH Zürich et d’Intel indiquent ne pas avoir été limités par le fossé de la réalité. Une fois l’entraînement virtuel réalisé, le robot a été testé dans le monde réel. Les données d’erreur ont par la suite été traitées par un second logiciel afin d’effectuer des ajustements. Cette combinaison de systèmes et d’itérations a permis à ANYmal d’atteindre une vitesse de 4,32 km/h. Il peut également se relever seul s’il tombe sur le sol.

Si l’apport de la réalité semble rester indispensable, la combinaison des systèmes et l’intégration des itérations permet d’accélérer et optimiser le processus d’entraînement.  Cela permet notamment de confronter le robot à une diversité de configurations de lieux difficilement reproduisible en conditions réelles. Cette approche devrait donc naturellement se généraliser.