Alternative prometteuse au Chain-Of-Thought : Sapient mise sur une architecture hiérarchique

Alternative prometteuse au Chain-Of-Thought : Sapient mise sur une architecture hiérarchique

En bref : La start-up Sapient Intelligence développe une approche innovante de l'IA générale, basée sur un modèle de raisonnement hiérarchique (HRM). Ce modèle se distingue par sa performance sur des tâches complexes, et pourrait trouver des applications dans des domaines comme le diagnostic médical ou la prévision climatique.

La jeune start-up singapourienne Sapient Intelligence s'est donnée pour objectif d'atteindre ce que beaucoup considèrent comme le Graal de l'IA : l'IAG, ou Intelligence Artificielle Générale. Pour y parvenir, elle mise sur une architecture radicalement innovante : la Hierarchical Reasoning Model (HRM). Son modèle surpasse des LLMs bien plus volumineux comme OpenAI o3-mini, Claude 3.7 8K ou DeepSeek R1 dans des tâches de raisonnement réputées ardues, avec seulement 27 millions de paramètres et environ 1 000 exemples d’entraînement, et ce, sans pré-entraînement.
Sapient Intelligence compte dans son équipe des anciens de Google DeepMind, DeepSeek, Anthropic et xAI, ainsi que des chercheurs provenant d'universités de premier plan. L'architecture qu'ils ont développée, inspirée de la façon dont le cerveau humain traite l’information, repose sur une structure hiérarchique et un traitement multi-échelles temporelles.

Une architecture inspirée de la biologie

Contrairement aux grands modèles de langage (LLM), qui reposent majoritairement sur l’incitation par chaîne de pensée (CoT), une méthode sujette à des décompositions fragiles des tâches, le modèle HRM introduit une approche fondamentalement différente. 
Le modèle s’appuie sur une architecture hiérarchique bi-niveaux : un réseau récurrent de haut niveau gère la planification abstraite et lente, tandis qu’un second, à bas niveau, traite l'exécution rapide et détaillée.
Cette organisation lui permet de jongler entre raisonnement rapide et intuitif et analyse lente et délibérée dans une seule passe de calcul.


Crédit Sapiens. HRM dispose de deux réseaux récurrents fonctionnant à des échelles de temps différentes pour résoudre des tâches complexes de manière collaborative
.
Guan Wang, fondateur et PDG de Sapient Intelligence, commente :

"L’IAG consiste vraiment à donner aux machines une intelligence de niveau humain, et éventuellement au-delà de l’humain. CoT permet aux modèles d’imiter le raisonnement humain en jouant les probabilités, et ce n’est qu’une solution de contournement. Chez Sapient, nous partons de zéro avec une architecture inspirée du cerveau, car la nature a déjà passé des milliards d’années à la perfectionner. Notre modèle pense et raisonne comme une personne, et ne se contente pas d’analyser les probabilités pour obtenir des points de repère. Nous pensons qu’elle atteindra, puis dépassera, l’intelligence humaine, et c’est à ce moment-là que la conversation AGI deviendra réelle".

Performances

Malgré sa taille modeste, HRM surpasse des modèles comme OpenAI o3-mini, Claude 3.7 8K ou DeepSeek R1 sur des tâches réputées particulièrement difficiles.
Il atteint notamment 5 % sur la version 2 d'ARC-AGI (Abstraction and Reasoning Corpus), l'un des benchmarks les plus exigeants pour l’intelligence inductive. Dans les puzzles Sudoku complexes et la recherche de chemin optimale dans les labyrinthes 30x30, il est le seul à réussir.

Quels usages concrets ?

L’efficacité du raisonnement du modèle et sa faible dépendance aux données ouvrent des perspectives dans des domaines où les grands jeux de données sont limités, mais où l’exactitude et l’interprétabilité sont essentielles.
Les cas d’usage évoqués par Sapient Intelligence concernent par exemple celui de la santé où il est testé pour aider au diagnostic de maladies rares. Pour les prévisions climatiques saisonnières, l’équipe annonce des taux de précision de 97 %. Grâce à sa légèreté computationnelle, HRM peut être embarqué sur des robots opérant en temps réel, dans des environnements dynamiques.

Le code source est disponible sur GitHub à l’adresse https://github.com/sapientinc/HRM.