Kısa : La start-up Sapient Intelligence développe une approche innovante de l'IA générale, basée sur un modèle de raisonnement hiérarchique (HRM). Ce modèle se distingue par sa performance sur des tâches complexes, et pourrait trouver des applications dans des domaines comme le diagnostic médical ou la prévision climatique.
İçindekiler
Singapur merkezli genç girişim Sapient Intelligence, birçok kişinin Yapay Genel Zeka (IAG) olarak tanımladığı yapay zekanın kutsal kasesine ulaşmayı hedefleyerek, kökten yenilikçi bir mimariye, Hiyerarşik Akıl Yürütme Modeli (HRM) üzerine yatırım yapmaktadır. Modeli, yalnızca 27 milyon parametre ve yaklaşık 1.000 eğitim örneği ile, daha büyük Dil Modelleri (LLM) olan OpenAI o3-mini, Claude 3.7 8K veya DeepSeek R1'i, hiçbir ön eğitim olmadan, zor bilinen akıl yürütme görevlerinde geride bırakarak üstün başarı göstermektedir.
Sapient Intelligence, ekibinde Google DeepMind, DeepSeek, Anthropic ve xAI'den eski çalışanlar ile önde gelen üniversitelerden araştırmacıları barındırmaktadır. İnsan beyninin bilgi işleme biçiminden ilham alan ve hiyerarşik bir yapıya ve çok ölçekli zaman işleme yetisine dayanan bir mimari geliştirmişlerdir.
Biyolojiden İlham Alan Bir Mimari
Büyük dil modellerinden (LLM) farklı olarak, büyük ölçüde kırılgan görev parçalanmalarına neden olan düşünce zinciri teşvikine (CoT) dayanan HRM modeli, temel olarak farklı bir yaklaşım sunmaktadır.
Model, iki seviyeli hiyerarşik bir mimariye dayanmaktadır: üst seviyede bir tekrarlayan ağ, soyut ve yavaş planlamayı yönetirken, alt seviyede bir ağ hızlı ve detaylı yürütmeyi ele alır.
Bu organizasyon, tek bir hesaplama geçişinde hızlı ve sezgisel akıl yürütme ile yavaş ve kasıtlı analizi dengelemeyi mümkün kılar.

Kaynak Sapiens. HRM, karmaşık görevleri işbirliği içinde çözmek için farklı zaman ölçeklerinde çalışan iki tekrarlayan ağa sahiptir
.
Sapient Intelligence'ın kurucusu ve CEO'su Guan Wang şunları yorumlamaktadır:
"IAG, makineleri insan seviyesinde ve hatta insanın ötesinde bir zekayla donatmakla ilgilidir. CoT, modellerin olasılıkları oynayarak insan akıl yürütmesini taklit etmesine izin verir, ancak bu sadece bir geçici çözümdür. Sapient'te, doğanın milyarlarca yıl mükemmelleştirdiği beyin ilhamlı bir mimariyle sıfırdan başlıyoruz. Modelimiz bir kişi gibi düşünüp akıl yürütüyor ve sadece referans noktaları almak için olasılıkları analiz etmekle yetinmiyor. İnanıyoruz ki, bu model insan zekasını aşacak ve o zaman IAG tartışması gerçek olacak."
Performanslar
Modest boyutuna rağmen HRM, özellikle zor bilinen görevlerde OpenAI o3-mini, Claude 3.7 8K veya DeepSeek R1 gibi modelleri geride bırakmaktadır.
Özellikle, zorlu bir endüktif zeka ölçütü olan ARC-AGI'nin (Soyutlama ve Akıl Yürütme Korpusu) 2. versiyonunda %5 başarıya ulaşmaktadır. Karmaşık Sudoku bulmacalarında ve 30x30 labirentlerde en iyi yol bulmada tek başarılı olan modeldir.

Hangi Somut Kullanımlar?
Modelin akıl yürütme etkinliği ve veriye az bağımlılığı, büyük veri setlerinin sınırlı olduğu ancak doğruluk ve yorumlanabilirliğin önemli olduğu alanlarda fırsatlar sunmaktadır.
Sapient Intelligence tarafından belirtilen kullanım durumları, örneğin nadir hastalıkların tanısına yardımcı olmak için sağlık alanında test edilmesini içermektedir. Mevsimlik iklim tahminlerinde, ekip %97 doğruluk oranları bildirmektedir. Hesaplama hafifliği sayesinde HRM, dinamik ortamlarda gerçek zamanlı çalışan robotlara entegre edilebilir.
Kaynak kodu GitHub'da şu adreste mevcuttur: https://github.com/sapientinc/HRM .