Alternativa promettente al Chain-Of-Thought: Sapient punta su un'architettura gerarchica

Alternativa promettente al Chain-Of-Thought: Sapient punta su un'architettura gerarchica

TLDR : La start-up Sapient Intelligence sviluppa un approccio innovativo di AI generale, basato su un modello di ragionamento gerarchico (HRM). Questo modello eccelle su compiti complessi e potrebbe essere applicabile in settori come la diagnosi medica o le previsioni climatiche.

La giovane start-up singaporiana Sapient Intelligence si è data l'obiettivo di raggiungere ciò che molti considerano il Santo Graal dell'IA: l'IAG, o Intelligenza Artificiale Generale. Per riuscirci, punta su un'architettura radicalmente innovativa: il Hierarchical Reasoning Model (HRM). Il suo modello supera LLM molto più voluminosi come OpenAI o3-mini, Claude 3.7 8K o DeepSeek R1 in compiti di ragionamento considerati difficili, con solo 27 milioni di parametri e circa 1.000 esempi di addestramento, senza pre-addestramento.
Sapient Intelligence conta nel suo team ex membri di Google DeepMind, DeepSeek, Anthropic e xAI, oltre a ricercatori provenienti da università di primo piano. L'architettura che hanno sviluppato, ispirata al modo in cui il cervello umano elabora le informazioni, si basa su una struttura gerarchica e un elaborazione multi-scala temporale.

Un'architettura ispirata alla biologia

Contrariamente ai grandi modelli di linguaggio (LLM), che si basano principalmente sull'incitamento per catena di pensiero (CoT), un metodo soggetto a decomposizioni fragili dei compiti, il modello HRM introduce un approccio fondamentalmente diverso. 
Il modello si appoggia su un'architettura gerarchica a due livelli: una rete ricorrente di alto livello gestisce la pianificazione astratta e lenta, mentre una seconda, a basso livello, si occupa dell'esecuzione rapida e dettagliata.
Questa organizzazione gli permette di destreggiarsi tra ragionamento rapido e intuitivo e analisi lenta e deliberata in un unico passaggio di calcolo.

Credito Sapiens. HRM dispone di due reti ricorrenti che operano su scale temporali diverse per risolvere compiti complessi in modo collaborativo
.
Guan Wang, fondatore e CEO di Sapient Intelligence, commenta:
"L'IAG consiste realmente nel dare alle macchine un'intelligenza di livello umano, e eventualmente oltre l'umano. CoT permette ai modelli di imitare il ragionamento umano giocando le probabilità, e questa è solo una soluzione di ripiego. Da Sapient, partiamo da zero con un'architettura ispirata al cervello, perché la natura ha già trascorso miliardi di anni a perfezionarla. Il nostro modello pensa e ragiona come una persona, e non si limita ad analizzare le probabilità per ottenere punti di riferimento. Crediamo che raggiungerà, e poi supererà, l'intelligenza umana, e sarà in quel momento che la conversazione sull'AGI diventerà reale".

Prestazioni

Nonostante le sue dimensioni modeste, HRM supera modelli come OpenAI o3-mini, Claude 3.7 8K o DeepSeek R1 in compiti considerati particolarmente difficili.
Raggiunge in particolare il 5% sulla versione 2 di ARC-AGI (Abstraction and Reasoning Corpus), uno dei benchmark più esigenti per l'intelligenza induttiva. Nei puzzle Sudoku complessi e nella ricerca del percorso ottimale nei labirinti 30x30, è l'unico a riuscirci.

Quali usi concreti?

L'efficienza del ragionamento del modello e la sua bassa dipendenza dai dati aprono prospettive in settori dove i grandi set di dati sono limitati, ma dove l'accuratezza e l'interpretabile sono essenziali.
I casi d'uso menzionati da Sapient Intelligence riguardano ad esempio la salute, dove è testato per aiutare nella diagnosi di malattie rare. Per le previsioni climatiche stagionali, il team annuncia tassi di precisione del 97%. Grazie alla sua leggerezza computazionale, HRM può essere integrato su robot che operano in tempo reale, in ambienti dinamici.
Il codice sorgente è disponibile su GitHub all'indirizzo l’indirizzo https://github.com/sapientinc/HRM.