Chain-Of-Thought'a Umut Veren Alternatif: Sapient Hiyerarşik Bir Mimariye Yatırım Yapıyor

Kısa : La start-up Sapient Intelligence développe une approche innovante de l'IA générale, basée sur un modèle de raisonnement hiérarchique (HRM). Ce modèle se distingue par sa performance sur des tâches complexes, et pourrait trouver des applications dans des domaines comme le diagnostic médical ou la prévision climatique.

Singapur merkezli genç girişim Sapient Intelligence, birçok kişinin Yapay Genel Zeka (IAG) olarak tanımladığı yapay zekanın kutsal kasesine ulaşmayı hedefleyerek, kökten yenilikçi bir mimariye, Hiyerarşik Akıl Yürütme Modeli (HRM) üzerine yatırım yapmaktadır. Modeli, yalnızca 27 milyon parametre ve yaklaşık 1.000 eğitim örneği ile, daha büyük Dil Modelleri (LLM) olan OpenAI o3-mini, Claude 3.7 8K veya DeepSeek R1'i, hiçbir ön eğitim olmadan, zor bilinen akıl yürütme görevlerinde geride bırakarak üstün başarı göstermektedir.

Sapient Intelligence, ekibinde Google DeepMind, DeepSeek, Anthropic ve xAI'den eski çalışanlar ile önde gelen üniversitelerden araştırmacıları barındırmaktadır. İnsan beyninin bilgi işleme biçiminden ilham alan ve hiyerarşik bir yapıya ve çok ölçekli zaman işleme yetisine dayanan bir mimari geliştirmişlerdir.

Biyolojiden İlham Alan Bir Mimari

Büyük dil modellerinden (LLM) farklı olarak, büyük ölçüde kırılgan görev parçalanmalarına neden olan düşünce zinciri teşvikine (CoT) dayanan HRM modeli, temel olarak farklı bir yaklaşım sunmaktadır.

Model, iki seviyeli hiyerarşik bir mimariye dayanmaktadır: üst seviyede bir tekrarlayan ağ, soyut ve yavaş planlamayı yönetirken, alt seviyede bir ağ hızlı ve detaylı yürütmeyi ele alır.

Bu organizasyon, tek bir hesaplama geçişinde hızlı ve sezgisel akıl yürütme ile yavaş ve kasıtlı analizi dengelemeyi mümkün kılar.

Kaynak Sapiens. HRM, karmaşık görevleri işbirliği içinde çözmek için farklı zaman ölçeklerinde çalışan iki tekrarlayan ağa sahiptir

Sapient Intelligence'ın kurucusu ve CEO'su Guan Wang şunları yorumlamaktadır:

"IAG, makineleri insan seviyesinde ve hatta insanın ötesinde bir zekayla donatmakla ilgilidir. CoT, modellerin olasılıkları oynayarak insan akıl yürütmesini taklit etmesine izin verir, ancak bu sadece bir geçici çözümdür. Sapient'te, doğanın milyarlarca yıl mükemmelleştirdiği beyin ilhamlı bir mimariyle sıfırdan başlıyoruz. Modelimiz bir kişi gibi düşünüp akıl yürütüyor ve sadece referans noktaları almak için olasılıkları analiz etmekle yetinmiyor. İnanıyoruz ki, bu model insan zekasını aşacak ve o zaman IAG tartışması gerçek olacak."

Performanslar

Modest boyutuna rağmen HRM, özellikle zor bilinen görevlerde OpenAI o3-mini, Claude 3.7 8K veya DeepSeek R1 gibi modelleri geride bırakmaktadır.

Özellikle, zorlu bir endüktif zeka ölçütü olan ARC-AGI'nin (Soyutlama ve Akıl Yürütme Korpusu) 2. versiyonunda %5 başarıya ulaşmaktadır. Karmaşık Sudoku bulmacalarında ve 30x30 labirentlerde en iyi yol bulmada tek başarılı olan modeldir.

Hangi Somut Kullanımlar?

Modelin akıl yürütme etkinliği ve veriye az bağımlılığı, büyük veri setlerinin sınırlı olduğu ancak doğruluk ve yorumlanabilirliğin önemli olduğu alanlarda fırsatlar sunmaktadır.

Sapient Intelligence tarafından belirtilen kullanım durumları, örneğin nadir hastalıkların tanısına yardımcı olmak için sağlık alanında test edilmesini içermektedir. Mevsimlik iklim tahminlerinde, ekip %97 doğruluk oranları bildirmektedir. Hesaplama hafifliği sayesinde HRM, dinamik ortamlarda gerçek zamanlı çalışan robotlara entegre edilebilir.

Kaynak kodu GitHub'da şu adreste mevcuttur: https://github.com/sapientinc/HRM.

Çeviri kaynağı Alternative prometteuse au Chain-Of-Thought : Sapient mise sur une architecture hiérarchique

Chain-Of-Thought'a Umut Veren Alternatif: Sapient Hiyerarşik Bir Mimariye Yatırım Yapıyor

İçindekiler

Biyolojiden İlham Alan Bir Mimari

Performanslar

Hangi Somut Kullanımlar?