Pour un directeur R&D automobile, le modèle Alpamayo 2 Super que Nvidia présente comme la nouvelle brique fondatrice de sa pile robotaxi pose d'emblée une question opérationnelle: le modèle complet à 32 milliards de paramètres n'est pas directement déployable dans un véhicule. Il s'agit d'un teacher pensé pour être distillé en students compressés destinés aux plateformes embarquées DRIVE Hyperion et DRIVE AGX Thor - et à la date de l'annonce, aucune métrique de performance de ces students sur ces calculateurs n'a été publiée. C'est sur ce trou de mesure que les constructeurs sont invités à arbitrer. Le contexte: Nvidia a annoncé Alpamayo 2 Super, un modèle de type vision-language-action (VLA), le 1er juin 2026 à la GTC Taipei, comme l'a rapporté TechMonitor. Le modèle, présenté comme une brique fondatrice pour le développement de robotaxis et de véhicules autonomes de niveau 4, porte le nombre de paramètres de 10 milliards à 32 milliards par rapport à la génération précédente - la première montée en puissance majeure de la famille Alpamayo lancée au CES début 2026.
Une pile technique étoffée, des résultats embarqués absents
Le 32B opère sur l'ensemble de la chaîne de conduite. Alpamayo 2 Super intègre une perception à 360 degrés, en élargissant la portée des capteurs frontaux à une couverture omnidirectionnelle, et inclut des capacités de décision de haut niveau appelées Meta-Actions, couvrant des manœuvres telles que la cession de priorité, les changements de voie et l'arrêt. Les planificateurs aval reçoivent les trajectoires assorties de traces de chaîne-de-causation (CoC), un format de sortie qui rend chaque décision réinterprétable plutôt que de la laisser opaque. Trois briques open source accompagnent la sortie: AlpaGym, un environnement d'apprentissage par renforcement open source pour l'entraînement en boucle fermée, OmniDreams, un modèle de monde génératif permettant la création de scénarios photoréalistes en boucle fermée, et un pipeline d'auto-étiquetage CoC. Selon le communiqué Nvidia, la pile aval bénéficie d'un raisonnement et d'une perception de meilleure qualité à partir d'une publication unique, sans que chaque constructeur ait à tout reconstruire. L'arrière-plan académique reste celui posé par le paper fondateur Alpamayo-R1 (arXiv 2511.00088), qui reconnaît que les performances restent fragiles dans les scénarios long-tail critiques pour la sécurité où le signal de supervision est rare - c'est précisément le terrain que le 32B promet de couvrir.
Distillation maîtrisée par la recherche, métrique Nvidia muette
La littérature récente atteste que la distillation peut transférer une part substantielle des capacités d'un VLA vers un modèle compressé pour l'inférence embarquée. Les travaux Drive-KD (arXiv 2601.21288) publiés en janvier 2026 documentent qu'un student d'un milliard de paramètres peut dépasser un teacher de 78 milliards sur le benchmark DriveBench, les auteurs résumant le résultat ainsi: «le modèle InternVL3-1B distillé atteint de meilleures performances globales que le modèle 78B pré-entraîné de la même famille sur DriveBench, avec 42 fois moins de mémoire GPU et 11,4 fois plus de débit» (traduction libre). Un travail Nvidia distinct sur la quantification NVFP4 (arXiv 2601.20088) nuance parallèlement la transition vers l'embarqué: «pour les petits LLM, la dégradation de précision due à la quantification post-entraînement est souvent non négligeable» (traduction libre), les auteurs proposant une voie de récupération documentée. Une étude indépendante d'edge IA automobile (arXiv 2604.26857) renverse partiellement l'objection en mesurant que le student compressé peut mieux résister à la contrainte INT8 que son teacher, avec une perte de 5,6 % de mAP contre 23 % côté teacher en conditions réelles - signal que la compression maîtrisée peut, dans certains régimes, améliorer la robustesse à la quantification embarquée plutôt que la dégrader.
Reste que ces résultats publiés concernent d'autres familles de modèles. Les métriques des students Alpamayo spécifiquement sur DRIVE AGX Thor - taux d'erreur sur scénarios long-tail, latence d'inférence, conservation des Meta-Actions et des traces CoC après compression - ne figurent dans aucun document accessible à la date de l'annonce. Le pipeline n'est pas publié; la perte de qualité tolérable n'est pas chiffrée. Les constructeurs reçoivent un teacher documenté et une promesse de descente vers l'embarqué.
Un teacher documenté à 32 milliards de paramètres - et une promesse de descente vers l'embarqué
Alpamayo 2 Super est conçu comme modèle enseignant : la pile AV qui en hérite récupère raisonnement et perception en une seule publication ouverte, sans que chaque constructeur ait à reconstruire depuis zéro - à condition que la distillation vers DRIVE Hyperion et DRIVE AGX Thor tienne ses promesses.
Open-weight au niveau du teacher, dépendance stack au niveau du déploiement
Alpamayo 2 Super sera disponible à l'été 2026 via GitHub (code d'inférence) et Hugging Face (poids du modèle) - un geste d'ouverture qui s'inscrit dans le sillage des modèles VLA open-weight déjà identifiés par ActuIA, comme SmolVLA chez Hugging Face, et qui permet à un laboratoire académique ou à un constructeur d'auditer le teacher sans signer un contrat de licence. La liberté est réelle à ce niveau. Elle se referme cependant à l'étape de l'inférence: la distillation est recommandée vers les plateformes embarquées NVIDIA DRIVE Hyperion et DRIVE AGX Thor, ce qui transforme un modèle ouvert au sommet en chaîne de déploiement liée à l'écosystème calculateurs Nvidia.
Le second communiqué Nvidia GTC Taipei consolide cette architecture en annonçant quatre nouveaux engagements DRIVE Hyperion:
- Foxconn étend sa collaboration stratégique avec Nvidia pour accélérer le développement et le déploiement prévu de flottes de robotaxis de niveau 4 sur DRIVE Hyperion, à partir de Kaohsiung, avec un lancement de service de robotaxi annoncé en Taïwan pour 2028.
- VinFast et la société israélienne Autobrains visent l'Asie du Sud-Est.
- HUMAIN, le véhicule industriel saoudien adossé au fonds souverain PIF (Public Investment Fund), porte le déploiement en Arabie saoudite.
- Uber et Autobrains lancent un programme robotaxi à Munich.
Le calendrier compte: le vote final du WP.29 sur les systèmes de conduite automatisée Level 4+ est prévu du 23 au 29 juin 2026, soit moins de quatre semaines après l'annonce, et conditionnera l'homologation des véhicules sur les marchés sous accord UNECE.
[!warning] Ces métriques ne concernent pas Alpamayo
Les gains de distillation cités dans la littérature récente (Drive-KD, Edge AI Auto) portent sur d'autres familles de modèles, dans d'autres contextes applicatifs. Aucune métrique publiée ne documente ce que donne la distillation d'Alpamayo 2 Super sur DRIVE AGX Thor - ni en débit, ni en précision résiduelle. La promesse d'embarquement reste à ce stade un engagement d'architecture, pas un résultat mesuré.
Le Level 4 ne se joue pas seulement sur la pile DRIVE
À quelques jours de l'annonce GTC Taipei, trois signaux rappellent que le segment robotaxi se développe en partie en dehors de la plateforme Nvidia. Le 28 mai 2026, Waymo a annoncé le déploiement de son robotaxi «Ojai», co-développé avec le constructeur chinois Zeekr, pour des trajets commerciaux en Californie et en Arizona - une approche matérielle propriétaire qui reste hors écosystème DRIVE. L'éditeur californien sert déjà des trajets commerciaux dans plusieurs villes, comme ActuIA le documentait pour Austin. Le 29 mai 2026, BYD a dévoilé ce qu'il présente comme la puce embarquée pour la conduite autonome «la plus puissante de Chine» - affirmation auto-déclarée par le constructeur de Shenzhen, qui s'inscrit dans une stratégie d'internalisation du silicium parmi les OEM chinois. Xiaomi a publié de son côté son propre VLA, UniDriveVLA (arXiv 2604.02190), confirmant qu'au moins trois grandes familles de modèles VLA pour la conduite coexistent. Pour les constructeurs encore en phase d'évaluation de leur pile autonome, la question opérationnelle reste donc précise: quelle est la performance d'un student Alpamayo distillé sur DRIVE AGX Thor - taux d'erreur sur scénarios long-tail, latence, conservation des traces CoC - mesurée par un tiers indépendant. Cette métrique n'a pas été publiée à la date du 1er juin 2026.
