ExpGraph Ön Baskısı, LLM Temelli Ajanlar İçin Kendi Kendine Evrimleşen Bir Grafik Belleği Öneriyor

29 Mayıs 2026 tarihinde arXiv'e yüklenen ve ExpGraph adı verilen bir ön baskı, büyük dil modellerine dayalı bir ajanın, yürütücü modelin parametreleri değiştirilmeden yeniden kullanılabilir deneyim biriktirebileceğini savunuyor - bu model dondurulmuş ve değiştirilebilir olarak kalıyor. Tez, yapay zeka bütçesi sorusunu şu şekilde değiştiriyor: Daha güçlü bir modele mi, yoksa bir yürütücüden diğerine seyahat eden taşınabilir bir dış bellek katmanına mı yatırım yapmalı? Çerçeve, Illinois Üniversitesi Urbana-Champaign, Nanyang Teknolojik Üniversitesi ve Meta Monetization AI'ye bağlı on bir araştırmacı tarafından imzalanmış. Makale, arXiv'de otomatik dil işleme (cs.CL) kategorisinde sınıflandırılmış olup, çevrimiçi olarak yayınlandığı tarihte henüz akran değerlendirmesine sunulmamıştır; sonuçlar yazarlar tarafından beyan edilmektedir.

Grafik Yayılımı ve RL Yardımcısı: ExpGraph Mekanizması

ExpGraph, bir ajanın tarihi yörüngelerini yeniden kullanılabilir beceriler ve başarısızlık dersleri olarak özetleyerek, bunları kendi kendine evrimleşen bir deneyim grafiği içinde düğümler olarak organize ediyor. Geri çağırma, bir grafik yayılımını ve yardımcı bir RL (pekiştirmeli öğrenme) tarafından eğitilmiş hafif bir yardımcıyı kullanarak gerçekleştiriliyor; bu yardımcı, yürütücünün performans farkını ödül sinyali olarak kullanarak enjekte edilecek deneyimleri seçiyor. Yazarlar arasında GraphSAGE ve Open Graph Benchmark'ın tanınmış uzmanı Jiaxuan You'nun bulunması, çerçevenin grafik yayılımı bileşeni için teknik bir güvenilirlik işareti olarak kabul ediliyor. Ampirik olarak, yazarlar ön baskıda yürütücü boyutuna göre statik görevlerde %12,2 ve %4,7 ve ALFWorld dahil olmak üzere, bir değerlendirme standardı haline gelmiş olan ev simülasyon ortamlarında %21,4 ve %12,7'lik kazanımlar beyan ediyorlar (diğer ortamların detayları özetten erişilebilir değil). Ancak değerlendirme, yazarlar tarafından tasarlanmış bir benchmark olan ExpSuite üzerine dayanıyor ve özet içinde belirtilmiş bir karşılaştırma baz çizgisi bulunmuyor - sadece tam metnin okunması bu parçaları çerçeveleyebilir.

Ev Yapımı Benchmark, Adı Belirtilmeyen Baz Çizgisi
ExpGraph tarafından iddia edilen performans kazanımları, makale yazarları tarafından tasarlanmış bir değerlendirme protokolü olan ExpSuite üzerinde ölçülüyor. Ön baskıda karşılaştırma için kullanılan baz çizgisi belirtilmemiş. Bu sonuçlar henüz akran değerlendirmesinden geçmemiştir - genel bir değerlendirme yapılmadan önce dikkatli olunmalıdır.

Aktif Bir Akademik Soy, Çoktan Akran Değerlendirmesinden Geçmiş

ExpGraph, LLM ajanlarının deneyimsel öğrenimi üzerine bir dizi çalışmanın bir parçası olarak konumlanıyor, bunların birçoğu zaten akran değerlendirmesini geçmiş durumda. ICLR 2026'da kabul edilen iki makale - makine öğreniminin üç büyük uluslararası konferansından biri - özellikle karşılaştırılabilir. NAVER LABS Europe, Meylan'da yayımlanan Retrieval-Augmented LLM Agents: Learning to Learn from Experience, genelci ajanlar için "bilinmeyen görevlere karşı sağlam genellemenin hala büyük bir meydan okuma olduğunu" (serbest çeviri) ortaya koyuyor. Aynı konferans, "ajan merkezli çok katmanlı, eğitilebilir bir grafik bellek çerçevesi" (serbest çeviri) öneren From Experience to Strategy adlı çalışmayı da kabul etti. Düz deneyim listesinden - önceki çerçevelerle tarihsel olarak ilişkilendirilen paradigma, ExpeL (AAAI 2024) dahil - grafik yapısına geçiş bu nedenle yeni değil; zaten akademik değerlendirmeler tarafından aletlendirilmiş ve doğrulanmış durumda. Alan boş değil: ExpGraph, bir varyant olarak ekleniyor, bir kopuş olarak değil, ve şimdilik üçünden yalnızca biri dış doğrulama almamış durumda.

Üç Çağdaş Ajan Bellek Çalışması

Makale	Kurum	Durum	Bellek Yaklaşımı
Retrieval-Augmented LLM Agents	NAVER LABS Europe	ICLR 2026 - akran değerlendirmesi yapılmış	Deneyimsel RAG
From Experience to Strategy	Belirtilmemiş	ICLR 2026 - akran değerlendirmesi yapılmış	Grafik bellek eğitilebilir (RL)
ExpGraph	UIUC + NTU + Meta Monetization AI	arXiv ön baskısı - akran değerlendirmesi yapılmamış	Yapılandırılmış deneyim grafiği

Dış Bellek mi, Daha Yetkin Model mi: Aynı Şeyi Söylemeyen İki Bahis

UIUC, NTU ve Meta Monetization AI ekibi tarafından imzalanan ExpGraph önerisi, yazarlar tarafından savunulan bir mimari tez içeriyor: toplanmış deneyimler üzerinde ince ayar, yeniden kullanımı elbette iyileştirir, ancak daha güçlü veya daha iyi uyarlanmış bir yürütücü ortaya çıkar çıkmaz esnekliğini yitirir. Ön baskıda savunulan sonuç, biriktirilmiş bilginin model dışında yaşaması gerektiğidir, böylece model değiştiğinde taşınabilir kalabilir. Anthropic'in yolu, zıt bir bahsi temsil ediyor: modelin güçlendirilmesi, ajanın kazanımlarının onunla birlikte seyahat etmesini sağlar - programlama için optimize edilmiş Claude ajanlarınden 28 Mayıs 2026'da duyurulan Claude Opus 4.8'e kadar, varsayılan bir sınırlama ile: bu kazanımlar modelin değiştirilmesiyle hayatta kalmaz. Üçüncü bir varyant, daha marjinal, modelin kendi kendini iyileştirme mimarilerine doğru ağırlık merkezini daha da kaydırıyor, endüstriyel laboratuvarlarda hala keşif aşamasında. Bugün yayınlanmış hiçbir ampirik çalışma anlaşmazlığı çözmüyor: üç yaklaşım bir arada var oluyor ve mimari yer değiştirme konusundaki açık soru, şu an için bağımsız bir test yatağı sonucu yerine rekabet eden makaleler için bir argüman olarak kalıyor.

Üretim yığını zaten mevcut, ancak farklı ilkeler üzerine

Akademik yolun yanı sıra, ajanlar için bellek üretim ekosistemi 2025'te zaten sağlamlaştı. Mem0, Y Combinator, Peak XV ve Basis Set'ten 24 milyon dolar topladı Ekim ayında, turuna göre 41.000 GitHub yıldızını ve on üç milyon Python paket indirmesini aşmış durumda ve Letta ve Supermemory ile birlikte geliştiriciler tarafından benimsenmiş çerçeveler arasında yer alıyor. Mem0 tarafından öne çıkarılan rakamlara göre, API çağrıları yaklaşık 35 milyondan 2025'in ilk üç çeyreğinde 186 milyona sıçrarken, bu yığınlar ExpGraph ile modelleri değiştirmeyen dış bellek felsefesini paylaşsalar da, bir grafik yayılımı ve pekiştirmeli öğrenme tarafından yönlendirilen kendi kendine evrimleşen bir grafiğe dayanmıyorlar. Fark önemsiz değil: üretim yığını bugün oturumlar arasında taşınabilirlik ve kalıcılık arıyor; akademik yığın bilinmeyen görevlere genelleme hedefliyor. 2026 sonuna kadar gözlemlenebilir sinyal: ExpGraph kazanımlarının ExpSuite dışında, üçüncü taraf bir ajan benchmark'ında yeniden üretilebilirliği ve Mem0'nun API çağrılarının yörüngesi - bu, üretim yığınının kendi kendine evrimleşen grafik ilkelini içerip içermediğini gösterecek.

Üç çeyrekte 35 milyondan 186 milyona API çağrısı
Mem0'nun 2025'in ilk dokuz ayındaki ilerlemesi, endüstriyel gerçek talebi, optimal mimari üzerindeki akademik tartışmalardan bağımsız olarak, dış bellek katmanları için göstermektedir.

Stephane Nachez

ActuIA yayın kurulu — karar vericiler için yapay zeka üzerine haberler, veriler ve analizler.