TLDR : Sapient Intelligence는 계층적 추론 모델(HRM)을 기반으로 한 혁신적인 일반 인공지능(IAG) 접근 방식을 개발하고 있습니다. 이 모델은 복잡한 작업에서의 성능을 자랑하며, 의료 진단이나 기후 예측 같은 분야에서 활용될 수 있습니다.
목록
싱가포르의 신생 스타트업 Sapient Intelligence는 많은 사람들이 AI의 성배로 여기는 일반 인공지능(IAG)을 달성하는 것을 목표로 하고 있습니다. 이를 위해 그들은 혁신적인 아키텍처를 기반으로 한 Hierarchical Reasoning Model (HRM)을 사용합니다. 이 모델은 OpenAI o3-mini, Claude 3.7 8K 또는 DeepSeek R1과 같은 대형 LLM보다 어려운 추론 작업에서 우수한 성능을 발휘하며, 단 2,700만 개의 매개변수와 약 1,000개의 훈련 예시만을 사용하여 사전 훈련 없이 성과를 거두고 있습니다.
Sapient Intelligence의 팀에는 Google DeepMind, DeepSeek, Anthropic 및 xAI와 같은 회사 출신과 일류 대학의 연구자들이 포함되어 있습니다. 이들이 개발한 아키텍처는 인간의 뇌가 정보를 처리하는 방식에서 영감을 받아 계층적 구조와 다중 시간 척도 처리를 기반으로 합니다.
생물학에서 영감을 얻은 아키텍처
대형 언어 모델(LLM)은 주로 연쇄 사고 유도(CoT)에 의존하며, 이는 작업의 취약한 분해를 초래할 수 있는 방법입니다. HRM 모델은 근본적으로 다른 접근 방식을 도입합니다.
이 모델은 두 수준의 계층적 아키텍처를 기반으로 하며, 상위 레벨의 순환 네트워크는 추상적이고 느린 계획을 처리하고, 하위 레벨은 빠르고 세부적인 실행을 처리합니다.
이 조직은 계산의 한 번의 통과에서 빠르고 직관적인 추론과 느리고 신중한 분석을 조화롭게 수행할 수 있게 합니다.

Crédit Sapiens. HRM은 서로 다른 시간 척도에서 작동하는 두 개의 순환 네트워크를 통해 복잡한 작업을 협력적으로 해결합니다.
.
Guan Wang, Sapient Intelligence의 창립자 겸 CEO는 다음과 같이 말합니다:
"IAG는 기계에 인류 수준의 지능을 부여하는 것이며, 결국 인류를 넘어서는 것입니다. CoT는 모델이 확률을 통해 인간의 추론을 모방하게 하지만, 이는 단지 우회로일 뿐입니다. Sapient에서 우리는 뇌에서 영감을 받은 아키텍처로 새롭게 시작합니다. 자연은 이미 수십억 년에 걸쳐 이를 완성해 왔습니다. 우리의 모델은 사람처럼 생각하고 추론하며, 단순히 확률을 분석하여 기준점을 찾는 데 그치지 않습니다. 우리는 이것이 인간의 지능을 달성하고 이를 넘어설 것이라고 믿으며, 이때 AGI에 대한 논의가 진정한 현실이 될 것입니다."
성능
그 크기는 작지만, HRM은 OpenAI o3-mini, Claude 3.7 8K 또는 DeepSeek R1과 같은 모델을 어려운 작업에서 능가합니다.
특히 ARC-AGI(Abstraction and Reasoning Corpus) 버전 2에서 5%를 기록하며, 이는 도입 추론을 위한 가장 까다로운 벤치마크 중 하나입니다. 복잡한 스도쿠 퍼즐과 30x30 미로에서 최적의 경로 검색에 유일하게 성공합니다.

구체적인 사용 사례?
모델의 추론 효율성과 데이터에 대한 낮은 의존성은 대규모 데이터 세트가 제한적이지만 정확성과 해석 가능성이 중요한 분야에서의 전망을 엽니다.
Sapient Intelligence가 언급한 사용 사례는 희귀 질환 진단을 돕기 위해 테스트되는 의료 분야를 포함합니다. 계절별 기후 예측의 경우, 팀은 97%의 정확도를 발표합니다. 계산의 경량성 덕분에 HRM은 실시간으로 작동하는 로봇에 탑재되어 역동적인 환경에서 작동할 수 있습니다.
소스 코드는 GitHub에서 확인할 수 있습니다 주소 https://github.com/sapientinc/HRM .