Obiecująca alternatywa dla Chain-Of-Thought: Sapient stawia na architekturę hierarchiczną

Obiecująca alternatywa dla Chain-Of-Thought: Sapient stawia na architekturę hierarchiczną

W skrócie : La start-up Sapient Intelligence développe une approche innovante de l'IA générale, basée sur un modèle de raisonnement hiérarchique (HRM). Ce modèle se distingue par sa performance sur des tâches complexes, et pourrait trouver des applications dans des domaines comme le diagnostic médical ou la prévision climatique.

Młoda singapurska start-up Sapient Intelligence postawiła sobie za cel osiągnięcie tego, co wielu uważa za Święty Graal AI: IAG, czyli Ogólną Inteligencję Sztuczną. Aby to osiągnąć, stawia na radykalnie innowacyjną architekturę: Hierarchical Reasoning Model (HRM). Jej model przewyższa znacznie większe LLM takie jak OpenAI o3-mini, Claude 3.7 8K czy DeepSeek R1 w zadaniach uznawanych za trudne w rozumowaniu, mając jedynie 27 milionów parametrów i około 1000 przykładów treningowych, i to bez wstępnego treningu.
Sapient Intelligence zatrudnia byłych pracowników Google DeepMind, DeepSeek, Anthropic i xAI oraz badaczy z czołowych uniwersytetów. Opracowana przez nich architektura, inspirowana sposobem, w jaki ludzki mózg przetwarza informacje, opiera się na strukturze hierarchicznej i przetwarzaniu wieloskalowym czasowym.

Architektura inspirowana biologią

W przeciwieństwie do dużych modeli językowych (LLM), które opierają się głównie na incitation par chaîne de pensée (CoT), metodzie podatnej na kruche dekompozycje zadań, model HRM wprowadza fundamentalnie inne podejście. 
Model opiera się na dwupoziomowej hierarchicznej architekturze: sieć rekurencyjna wyższego poziomu zarządza abstrakcyjnym i wolnym planowaniem, podczas gdy druga, na niższym poziomie, zajmuje się szybką i szczegółową realizacją.
Ta organizacja pozwala mu balansować między szybkim i intuicyjnym rozumowaniem a powolną i rozważną analizą w jednym obliczeniu.

Kredyt Sapiens. HRM posiada dwie sieci rekurencyjne działające na różnych skalach czasowych, aby rozwiązywać skomplikowane zadania w sposób wspólny
.
Guan Wang, założyciel i CEO Sapient Intelligence, komentuje:
"IAG naprawdę polega na nadaniu maszynom inteligencji na poziomie ludzkim, a nawet poza ludzkim. CoT pozwala modelom naśladować ludzkie rozumowanie, grając na prawdopodobieństwach, i to tylko obejście problemu. W Sapient zaczynamy od zera z architekturą inspirowaną mózgiem, ponieważ natura spędziła już miliardy lat na jej doskonaleniu. Nasz model myśli i rozumuje jak człowiek, a nie tylko analizuje prawdopodobieństwa, aby uzyskać punkty odniesienia. Uważamy, że osiągnie, a następnie przekroczy, ludzką inteligencję, a wtedy rozmowa o AGI stanie się rzeczywistością".

Wydajność

Mimo skromnych rozmiarów, HRM przewyższa modele takie jak OpenAI o3-mini, Claude 3.7 8K czy DeepSeek R1 w zadaniach uznawanych za szczególnie trudne.
Osiąga między innymi 5% w wersji 2 ARC-AGI (Abstraction and Reasoning Corpus), jednym z najbardziej wymagających benchmarków dla inteligencji indukcyjnej. W skomplikowanych łamigłówkach Sudoku i optymalnym wyszukiwaniu ścieżek w labiryntach 30x30, jest jedynym, który odnosi sukces.

Jakie konkretne zastosowania?

Efektywność rozumowania modelu i jego niewielkie uzależnienie od danych otwierają perspektywy w dziedzinach, gdzie duże zbiory danych są ograniczone, ale gdzie dokładność i interpretowalność są kluczowe.
Przypadki użycia wspomniane przez Sapient Intelligence obejmują na przykład zdrowie, gdzie testowany jest do wspomagania diagnostyki rzadkich chorób. W prognozach klimatycznych sezonowych zespół ogłasza wskaźniki dokładności na poziomie 97%. Dzięki swojej lekkości obliczeniowej, HRM może być zastosowany w robotach operujących w czasie rzeczywistym, w dynamicznych środowiskach.
Kod źródłowy jest dostępny na GitHub pod adresem pod adresem https://github.com/sapientinc/HRM.