Alternativa Promissora ao Chain-Of-Thought: Sapient aposta em uma arquitetura hierárquica

Alternativa Promissora ao Chain-Of-Thought: Sapient aposta em uma arquitetura hierárquica

Em resumo : A start-up Sapient Intelligence desenvolve uma abordagem inovadora de IA geral, baseada em um modelo de raciocínio hierárquico (HRM). Este modelo se destaca por seu desempenho em tarefas complexas e pode encontrar aplicações em áreas como diagnóstico médico ou previsão climática.

A jovem start-up de Singapura, Sapient Intelligence, estabeleceu como objetivo alcançar o que muitos consideram o Santo Graal da IA: a IAG, ou Inteligência Artificial Geral. Para isso, aposta em uma arquitetura radicalmente inovadora: o Hierarchical Reasoning Model (HRM). Seu modelo supera LLMs muito mais volumosos como OpenAI o3-mini, Claude 3.7 8K ou DeepSeek R1 em tarefas de raciocínio conhecidas por serem difíceis, com apenas 27 milhões de parâmetros e cerca de 1.000 exemplos de treinamento, sem pré-treinamento.
A equipe da Sapient Intelligence inclui ex-membros da Google DeepMind, DeepSeek, Anthropic e xAI, bem como pesquisadores de universidades de primeira linha. A arquitetura desenvolvida por eles, inspirada na forma como o cérebro humano processa informações, baseia-se em uma estrutura hierárquica e processamento em múltiplas escalas temporais.

Uma arquitetura inspirada na biologia

Ao contrário dos grandes modelos de linguagem (LLM), que dependem principalmente da incitação por cadeia de pensamento (CoT), um método sujeito a decomposições frágeis das tarefas, o modelo HRM introduz uma abordagem fundamentalmente diferente. 
O modelo apoia-se em uma arquitetura hierárquica de dois níveis: uma rede recorrente de alto nível gerencia o planejamento abstrato e lento, enquanto outra, de baixo nível, trata da execução rápida e detalhada.
Essa organização permite que ele alterne entre raciocínio rápido e intuitivo e análise lenta e deliberada em uma única passagem de cálculo.

Crédito Sapiens. O HRM possui duas redes recorrentes que funcionam em diferentes escalas de tempo para resolver tarefas complexas de forma colaborativa
.
Guan Wang, fundador e CEO da Sapient Intelligence, comenta:
"A IAG realmente consiste em dar às máquinas uma inteligência de nível humano, e eventualmente além do humano. CoT permite que os modelos imitem o raciocínio humano jogando com probabilidades, e isso é apenas uma solução paliativa. Na Sapient, começamos do zero com uma arquitetura inspirada no cérebro, pois a natureza já passou bilhões de anos aperfeiçoando-o. Nosso modelo pensa e raciocina como uma pessoa, e não se contenta em analisar probabilidades para obter pontos de referência. Acreditamos que ela alcançará, e depois superará, a inteligência humana, e é nesse momento que a conversa sobre AGI se tornará real".

Desempenho

Apesar de seu tamanho modesto, o HRM supera modelos como o OpenAI o3-mini, Claude 3.7 8K ou DeepSeek R1 em tarefas conhecidas por serem particularmente difíceis.
Ele atinge notavelmente 5% na versão 2 do ARC-AGI (Abstraction and Reasoning Corpus), um dos benchmarks mais exigentes para inteligência indutiva. Nos quebra-cabeças de Sudoku complexos e na busca pelo caminho ótimo em labirintos 30x30, ele é o único a ter sucesso.

Quais são os usos concretos?

A eficácia do raciocínio do modelo e sua baixa dependência de dados abrem perspectivas em áreas onde grandes conjuntos de dados são limitados, mas onde a exatidão e a interpretabilidade são essenciais.
Os casos de uso mencionados pela Sapient Intelligence incluem, por exemplo, a saúde, onde está sendo testado para ajudar no diagnóstico de doenças raras. Para previsões climáticas sazonais, a equipe anuncia taxas de precisão de 97%. Graças à sua leveza computacional, o HRM pode ser embarcado em robôs que operam em tempo real, em ambientes dinâmicos.
O código-fonte está disponível no GitHub em o endereço https://github.com/sapientinc/HRM.