Aramis-2B : explorer l’équilibre entre performance et frugalité en IA

Aramis-2B, un Small Language Model open‑weights développé par Jonathan Pacifico (Cellenza) sur une base Microsoft Research, utilise des poids ternaires entraînés nativement pour réduire significativement la consommation énergétique sans sacrifier la qualité des résultats. Il atteint 51,62 en zero‑shot sur ARC‑Challenge et est publié sur Hugging Face en formats GGUF (inférence) et BF16 (réentraînement), pertinent pour des déploiements frugaux et des usages multi‑agents.

MAMarie-Claude Benoit ·8 sept. 2025 ·Mis à jour le 19 juin 2026 ·2 min

L’équation entre performance et durabilité est l’un des grands défis de l’intelligence artificielle. Alors que de nombreux projets s’appuient sur des modèles de grande taille pour des tâches simples, générant des coûts élevés et une consommation énergétique importante, Aramis-2B s’inscrit dans la dynamique croissante autour des Small Language Models (SLM). Développé par Jonathan Pacifico, Data Scientist chez Cellenza, ce modèle open weights constitue une étape supplémentaire dans la recherche d’un compromis entre puissance de raisonnement, efficacité énergétique et intégration agentique.

Construit en post-training sur BitNet-b1.58-2B-4T de Microsoft Research, Aramis-2B tire parti de l'utilisation native de poids ternaires (-1, 0, +1) de ce dernier. Contrairement à la quantification a posteriori, cette approche permet de concevoir des modèles plus légers dès l’entraînement, avec une consommation énergétique jusqu’à 20 fois inférieure par token sur CPU, sans compromis sur la qualité des résultats.

Des capacités renforcées pour l’agentique

Jonathan Pacifico a orienté Aramis-2B vers les usages multi‑agents et l’interaction utilisateur en renforçant trois dimensions :

les capacités de raisonnement ;
la compréhension du langage et du contexte ;
le suivi d'instructions sur plusieurs tours de dialogue.

La méthode mobilisée combine un fine-tuning DPO bilingue (FR/EN) et un model merging itératif. Cette démarche permet de stabiliser les performances tout en conservant la diversité des atouts acquis à chaque cycle d’entraînement.

Des résultats probants

Sur ARC-Challenge, référence en matière de raisonnement scientifique, Aramis-2B atteint 51,62 en zéro-shot, franchissant le seuil symbolique des 50 points, une première pour un modèle open source de moins de 2,5 milliards de paramètres. Il dépasse non seulement son modèle de base, mais également plusieurs concurrents récents de même catégorie, tels qu’IBM Granite, DeepSeek, Qwen ou MiniCPM. Des progrès notables sont également observés sur IFEval, Winogrande, TriviaQA et MMLU.

Le modèle est publié en open weights sur Hugging Face, en deux formats :

GGUF (1.58-bit), optimisé pour l’inférence avec bitnet.cpp ;
BF16, destiné au réentraînement.

Jonathan Pacifico invite la communauté à tester Aramis-2B et à lui faire part de ses retours

Retrouvez Aramis-2B sur Hugging Face

Marie-Claude Benoit

Rédaction ActuIA — actualités, données et analyses sur l'intelligence artificielle pour les décideurs.

Aramis-2B : explorer l’équilibre entre performance et frugalité en IA

Des capacités renforcées pour l’agentique

Des résultats probants

OpenAI renoue avec l'ouverture avec deux modèles open-weight : GPT-OSS-120B et GPT-OSS-20B

IBM dévoile Granite 3.2 : une IA multimodale aux capacités de raisonnement avancées

Orange et OpenAI : une alliance stratégique pour une IA souveraine et responsable