În scurt : Start-up-ul Sapient Intelligence dezvoltă o abordare inovatoare a AI-ului general, bazată pe un model de raționament ierarhic (HRM). Acest model se distinge prin performanța sa în sarcini complexe și ar putea găsi aplicații în domenii precum diagnosticul medical sau prognoza climatică.
Sumar
Start-up-ul tânăr singaporez Sapient Intelligence și-a propus să atingă ceea ce mulți consideră a fi Graalul AI-ului: IAG, sau Inteligența Artificială Generală. Pentru a realiza acest lucru, se bazează pe o arhitectură radical inovatoare: Hierarchical Reasoning Model (HRM). Modelul său depășește LLM-uri mult mai voluminoase precum OpenAI o3-mini, Claude 3.7 8K sau DeepSeek R1 în sarcini de raționament considerate dificile, având doar 27 de milioane de parametri și aproximativ 1.000 de exemple de antrenament, și asta fără pre-antrenament.
Sapient Intelligence are în echipă foști membri de la Google DeepMind, DeepSeek, Anthropic și xAI, precum și cercetători din universități de top. Arhitectura pe care au dezvoltat-o, inspirată de modul în care creierul uman procesează informațiile, se bazează pe o structură ierarhică și un proces multi-scară temporală.
O arhitectură inspirată din biologie
Spre deosebire de modelele mari de limbaj (LLM), care se bazează în mare parte pe inducția prin lanț de gândire (CoT), o metodă predispusă la descompuneri fragile ale sarcinilor, modelul HRM introduce o abordare fundamental diferită.
Modelul se bazează pe o arhitectură ierarhică cu două niveluri: o rețea recurentă de nivel înalt gestionează planificarea abstractă și lentă, în timp ce o alta, de nivel jos, se ocupă de execuția rapidă și detaliată.
Această organizare îi permite să jongleze între raționamentul rapid și intuitiv și analiza lentă și deliberată într-o singură trecere de calcul.

Credit Sapiens. HRM dispune de două rețele recurente care funcționează la scări de timp diferite pentru a rezolva sarcini complexe în mod colaborativ
.
Guan Wang, fondator și CEO al Sapient Intelligence, comentează:
"IAG constă cu adevărat în a oferi mașinilor o inteligență de nivel uman și, eventual, dincolo de uman. CoT permite modelelor să imite raționamentul uman jucând pe probabilități, și nu este decât o soluție de ocolire. La Sapient, pornim de la zero cu o arhitectură inspirată de creier, deoarece natura a petrecut deja miliarde de ani perfecționând-o. Modelul nostru gândește și raționează ca o persoană, și nu se limitează la analiza probabilităților pentru a obține puncte de reper. Credem că va atinge, apoi va depăși, inteligența umană, și în acel moment conversația despre AGI va deveni reală".
Performanțe
În ciuda dimensiunii sale modeste, HRM depășește modele precum OpenAI o3-mini, Claude 3.7 8K sau DeepSeek R1 în sarcini considerate deosebit de dificile.
În special, atinge 5% pe versiunea 2 a ARC-AGI (Abstraction and Reasoning Corpus), unul dintre cele mai exigente benchmark-uri pentru inteligența inductivă. În puzzle-urile Sudoku complexe și căutarea drumului optim în labirinturile 30x30, este singurul care reușește.

Ce utilizări concrete?
Eficiența raționamentului modelului și dependența sa redusă de date deschid perspective în domenii unde seturile mari de date sunt limitate, dar unde acuratețea și interpretabilitatea sunt esențiale.
Cazurile de utilizare menționate de Sapient Intelligence includ, de exemplu, cel al sănătății, unde este testat pentru a ajuta la diagnosticarea bolilor rare. Pentru prognozele climatice sezoniere, echipa anunță rate de precizie de 97%. Datorită ușurinței sale computaționale, HRM poate fi integrat pe roboți care operează în timp real, în medii dinamice.
Codul sursă este disponibil pe GitHub la adresa https://github.com/sapientinc/HRM .