Vielversprechende Alternative zu Chain-Of-Thought: Sapient setzt auf eine hierarchische Architektur

Vielversprechende Alternative zu Chain-Of-Thought: Sapient setzt auf eine hierarchische Architektur

TLDR : Die Start-up Sapient Intelligence entwickelt einen innovativen Ansatz für allgemeine KI, basierend auf einem hierarchischen Denkmodell (HRM). Dieses Modell zeichnet sich durch seine Leistung bei komplexen Aufgaben aus und könnte Anwendungen in Bereichen wie medizinische Diagnostik oder Klimavorhersage finden.

Das junge Start-up aus Singapur, Sapient Intelligence, hat sich zum Ziel gesetzt, das zu erreichen, was viele als den Heiligen Gral der KI betrachten: AGI oder Allgemeine Künstliche Intelligenz. Um dies zu erreichen, setzt es auf eine radikal innovative Architektur: das Hierarchical Reasoning Model (HRM). Sein Modell übertrifft weit größere LLMs wie OpenAI o3-mini, Claude 3.7 8K oder DeepSeek R1 in anspruchsvollen Aufgaben des Denkens, mit nur 27 Millionen Parametern und etwa 1.000 Trainingsbeispielen, und das ohne Vortraining.
Sapient Intelligence hat in seinem Team ehemalige Mitarbeiter von Google DeepMind, DeepSeek, Anthropic und xAI sowie Forscher von führenden Universitäten. Die von ihnen entwickelte Architektur, inspiriert von der Art und Weise, wie das menschliche Gehirn Informationen verarbeitet, basiert auf einer hierarchischen Struktur und einer Verarbeitung auf mehreren Zeitskalen.

Eine von der Biologie inspirierte Architektur

Im Gegensatz zu großen Sprachmodellen (LLM), die hauptsächlich auf Kettenüberlegungen (CoT) beruhen, einer Methode, die anfällig für fragile Aufgabenzerlegungen ist, führt das HRM-Modell einen grundlegend anderen Ansatz ein. 
Das Modell stützt sich auf eine zweistufige hierarchische Architektur: Ein rekurrentes Hochleistungsnetzwerk verwaltet die abstrakte und langsame Planung, während ein zweites, niedrigstufiges Netzwerk die schnelle und detaillierte Ausführung behandelt.
Diese Organisation ermöglicht es ihm, zwischen schnellem und intuitivem Denken und langsamer und überlegter Analyse in einem einzigen Berechnungsdurchgang zu jonglieren.

Bildnachweis Sapiens. HRM verfügt über zwei rekurrente Netzwerke, die auf unterschiedlichen Zeitskalen arbeiten, um komplexe Aufgaben kollaborativ zu lösen
.
Guan Wang, Gründer und CEO von Sapient Intelligence, kommentiert:
"AGI bedeutet wirklich, Maschinen eine menschenähnliche Intelligenz zu geben, und letztendlich über die menschliche hinaus. CoT ermöglicht es Modellen, menschliches Denken nachzuahmen, indem sie Wahrscheinlichkeiten spielen, und das ist nur eine Umgehungslösung. Bei Sapient beginnen wir bei Null mit einer vom Gehirn inspirierten Architektur, da die Natur bereits Milliarden von Jahren damit verbracht hat, sie zu perfektionieren. Unser Modell denkt und argumentiert wie eine Person und analysiert nicht nur Wahrscheinlichkeiten, um Orientierungspunkte zu gewinnen. Wir glauben, dass es die menschliche Intelligenz erreichen und dann übertreffen wird, und an diesem Punkt wird das AGI-Gespräch real".

Leistungen

Trotz seiner bescheidenen Größe übertrifft HRM Modelle wie OpenAI o3-mini, Claude 3.7 8K oder DeepSeek R1 in besonders schwierigen Aufgaben.
Es erreicht insbesondere 5 % auf der Version 2 von ARC-AGI (Abstraction and Reasoning Corpus), einem der anspruchsvollsten Benchmarks für induktive Intelligenz. In komplexen Sudoku-Rätseln und der optimalen Pfadsuche in 30x30-Labyrinthen ist es das einzige, das erfolgreich ist.

Welche konkreten Anwendungen?

Die Effizienz des Modells im Denken und seine geringe Abhängigkeit von Daten eröffnen Perspektiven in Bereichen, in denen große Datensätze begrenzt sind, aber Genauigkeit und Interpretierbarkeit entscheidend sind.
Die von Sapient Intelligence vorgeschlagenen Anwendungsfälle umfassen beispielsweise den Gesundheitsbereich, wo es getestet wird, um bei der Diagnose seltener Krankheiten zu helfen. Für saisonale Klimavorhersagen gibt das Team Genauigkeitsraten von 97 % an. Dank seiner geringen Rechenlast kann HRM auf Robotern eingesetzt werden, die in Echtzeit in dynamischen Umgebungen operieren.
Der Quellcode ist auf GitHub verfügbar unter der Adresse https://github.com/sapientinc/HRM.