Unitree publie UnifoLM-VLA-0, un modèle vision-langage-action ouvert pour piloter son robot humanoïde G1 par le langage
Le 29 janvier 2026, le fabricant chinois Unitree Robotics a publié UnifoLM-VLA-0, un modèle vision-langage-action dont le code, les poids et le code d'entraînement sont mis à disposition sous licence Creative Commons non commerciale (CC BY-NC-SA 4.0). Construit sur le modèle Qwen2.5-VL-7B et entraîné sur environ 340 heures de données réelles de manipulation, il permet au robot humanoïde G1 d'exécuter une douzaine de catégories de tâches de manipulation à partir de commandes en langage naturel. Sur le banc d'essai LIBERO, Unitree revendique un score moyen de 98,7, qu'elle présente comme le plus élevé parmi les VLA publics, devant des modèles comme OpenVLA et π0.


