A travers Rapid Motor Adaptation (RMA), Facebook progresse dans l'adaptation des robots à leur environnement, afin de développer leur motricité.
Jusqu'à présent, les robots à pattes étaient soit entièrement codés à la main pour les environnements qu'ils côtoyaient, soit les experts faisaient en sorte qu'ils apprennent à naviguer dans leurs environnements grâce à une combinaison de techniques de codage manuel et de machine learning.
Adapter les robots à un environnement tout comme un humain peut le faire au quotidien
Les humains peuvent marcher avec une relative facilité sur les rochers, dans la boue, monter et descendre des collines, ou encore sauter sur des trampolines ou garder l'équilibre sur une surface plutôt molle. Cela est possible grâce à nos muscles puissants et flexibles à la fois qui s'adaptent aux conditions de l'environnement dans lequel nous nous trouvons. Une équipe de recherche composée d'experts de FAIR, de l'Université de Berkley et de l'Université Carnegie Mellon sont partis de ce constat chez les humains pour concevoir un modèle d'IA intitulé Rapid Motor Adaptation (RMA) et qui permet aux robots dotés de jambes de s'adapter en temps réel à des environnements divers et variés.
Jusqu'à présent, les robots à pattes étaient soit entièrement codés à la main pour les environnements qu'ils côtoyaient, soit les experts faisaient en sorte qu'ils apprennent à naviguer dans leurs environnements grâce à une combinaison de techniques de codage manuel et de machine learning.
Un modèle d'adaptation conçu grâce à l'apprentissage par renforcement et l'apprentissage supervisé
Le RMA utilise la combinaison de deux méthodes liées à l'IA afin de fonctionner :- Premier module - L'apprentissage par renforcement : l'outil exploite l'apprentissage par renforcement en utilisant des informations qu'il sélectionne sur les différents environnements qu'il peut côtoyer (la friction, le poids et la forme de la charge utile, etc.). Le robot s'adapte à l'adhérence du sol comme à son inclinaison.
- Second module - Module d'adaptation : il n'était pas possible, selon les chercheurs, de se baser uniquement sur l'apprentissage par renforcement, car on ne peut pas connaître à l'avance les éléments réels que le robot pourrait rencontrer sur son chemin. L'apprentissage supervisé a été exploité par l'équipe de recherche comme "module d'adaptation" afin que le robot puisse justement s'adapter à ces aléas. Ce module a été formé à l'aide de l'apprentissage supervisé.