ChatGPT Agent sınırlarıyla karşı karşıya: vaatkar bir araç, ancak 'talep üzerine iş gücü' olmaktan uzak

Kısa : OpenAI tarafından kısa süre önce piyasaya sürülen ChatGPT Agent, web'de gezinme ve karmaşık görevleri yerine getirme yeteneğine sahip bir yapay zeka aracıdır. Yenilikçi olmasına rağmen, etkileşimlerini sınırlayan güvenli bir sandbox tarafından etkinliği sınırlıdır. Karşısında, Future AGI'nin Manus'u daha cesur bir yaklaşım sunuyor, ancak az erişilebilir kalıyor.

Temmuz 2025'in ortasında piyasaya sürülen ChatGPT Agent, OpenAI'nin web'de gezinebilen, betikleri çalıştırabilen ve baştan sona karmaşık görevleri gerçekleştirebilen otonom asistanlar geliştirme niyetini gösteriyor. 'Talep üzerine iş gücü' olarak sunulan bu araç, ilk kullanıcı geri bildirimlerine göre hem heyecan hem de hayal kırıklığı yaratıyor.

Gerçek yetenekler ama karışık performanslar

Kağıt üzerinde, ChatGPT Agent, bir görevin adımlarını takip etme yeteneği ile etkileyici: çevrimiçi bilgi toplama, organizasyon ve sentez, doküman üretimi (raporlar, sunumlar, elektronik tablolar), araç birkaç aydır platformda mevcut olan Operator ve DeepResearch işlevlerini birleştiriyor. Yapılandırılmış ve belirsizliği az olan görevlerde, birkaç test kullanıcısı, aracın bazı araştırmalar ve teslimat hazırlıklarında gereken süreyi yarıya, hatta daha fazla indirdiğini bildirerek önemli bir zaman tasarrufu sağladığını belirtiyor.
Ancak, görevler daha karmaşık hale geldiğinde sınırlar hızla ortaya çıkıyor. Reddit ve LinkedIn'de birçok geri bildirim, belirgin bir yavaşlık, tekrarlayan eylem döngüleri ve bazı web etkileşimlerinde yüksek hata oranı olduğuna dikkat çekiyor.

Sandbox: güvenlik mi yoksa kısıtlama mı?

ChatGPT Agent'in çalışması bir sandbox üzerine kuruludur: OpenAI tarafından barındırılan sanal bir ortam, bir tarayıcı ve sanal bir masaüstü içerir. Bu yaklaşım, güvenlik risklerini sınırlamayı ve ajanın eylemleri üzerinde kontrol sağlamayı amaçlıyor, ancak yeteneklerini ciddi şekilde kısıtlıyor.

Birçok site, erişimi engelliyor veya ajanı bir bot olarak algılıyor, rezervasyonları, alışverişleri veya karmaşık etkileşimleri engelliyor.

Ajan, dinamik formlar, çok etkileşimli siteler, CAPTCHA veya Cloudflare gibi hizmetlerle düzenli olarak başarısız oluyor....onu kağıt üzerindeki en çekici vaatlerin çoğunu yerine getiremeyecek hale getiriyor.

Bu koruyucu yaklaşım, ajanın araştırma ve sentezler için kullanılabilir olmasını sağlıyor, ancak gelişmiş veya kritik web eylemleri için güvenilmez kılıyor.

Manus'a yetişme girişimi

ChatGPT Agent karşısında, Future AGI tarafından geliştirilen Manus, daha cesur bir yaklaşım sunuyor. Çoklu ajan mimarisi (planlama, yürütme, doğrulama) ve daha kapsamlı bir sandbox ortamı (gelişmiş tarayıcı, terminal, çok modlu üretim) kullanan Manus, bazıları tarafından karmaşık görevler ve otonom iş akışlarında daha performanslı olarak algılanıyor.

Ancak, Manus hala az erişilebilir (kısıtlı erişim, kredi maliyetleri yüksek, sınırlı kullanılabilirlik), bu da benimsenmesini sınırlandırıyor. Kullanıcı geri bildirimleri sık hatalar ve başarısızlık durumunda önemli bir kredi tüketimi konusunda şikayet ediyor, bu da hayal kırıklığı yaratıyor. Otonomisi, gerçek zamanlı kontrolü azaltıyor, bu da ajan beklenmedik bir yöne gittiğinde sapmalara yol açabiliyor.

Tarayıcıya entegre ajanlar mı?

Bir başka yol, bazı sınırlamaları hafifletebilir: ajanı kullanıcı tarayıcısına bir uzantı veya yerel bir modül aracılığıyla taşımak.

Böyle bir model şunları sunabilir:

Sanalizasyondan bağımsız daha hızlı bir yürütme.
Yerel araçlar ve verilerle doğrudan entegrasyon (CRM, mesajlaşmalar, belgeler).
Modern sitelerle daha iyi uyumluluk, çünkü gerçek bir insan tarayıcısı gibi davranır.

Ama bu seçim iki büyük zorluk yaratabilir:

Güvenlik: çerezlere, hesaplara ve yerel verilere erişimi olan bir ajan, istismar için tercih edilen bir hedef haline gelebilir.
Pazarlama konumlandırması: yerel bir ajan, daha çok kişisel otomasyon aracı gibi görünebilir, bu da OpenAI'nin ticari vaadini değiştirir.

Hala geliştirme aşamasında bir ürün

Mevcut haliyle, ChatGPT Agent yenilikçi ama olgunlaşmamış bir araç olarak kalıyor: iyi tanımlanmış bazı görevleri hızlandırmak için yararlı, daha iddialı görevler için sınırlı. 'AI iş gücü' vizyonu, teknik bir gerçeklikten ziyade daha çok bir pazarlama vaadi olarak kalıyor.

AI ajanları pazarının evrimi, hibrit bir uzlaşma ile ilerleyebilir: güvenli bir ortamda çalışabilen, ancak bazı etkileşimleri yerel tarayıcıya devredebilen, artan kontrol ve güvenlik önlemleri ile ajanlar.

Bu arada, kullanıcılar ChatGPT Agent'ı test aşamasında bir akıllı asistan olarak görmeli, insan çalışanların gerçek bir yerine geçeni olarak değil.

Ajanlar karşısında web'in geleceği ne olacak?

İnternet her zaman yazılımların ve bilgisayar sistemlerinin birbirleriyle iletişim kurmasını sağlamıştır. Çoğu web sitesi, en az bir veya birkaç API, yazılımlar arası iletişim arayüzü uygular. Bugün, ajanlar, insanlar tarafından kullanılabilen web'in görünen kısmını, doğal dilde yazılım arayüzlerine dönüştürmeyi hedefliyor.

Soru, teknik kapasitelere sahip olup olmadıkları değil, yayıncıların içeriklerini yazılımlara erişilebilir hale getirip getirmemeleri ile ilgilidir. Ajanların teorik vaatleri, ajanların her şeye erişimi olduğu bir dünyaya dayanmaktadır. İlk açık sonuçlardan biri, zaten başlamış olan reklam modelinin çöküşünün hızlanması olacaktır.

Bu aynı zamanda pazar yerlerinde, özellikle pazar yerlerindeki değişikliklerle ilgili sorular da doğurabilir: bireyler için tasarlanmış ilan sitelerinin, Le bon coin veya Vinted gibi, sistematik olarak birkaç aktör tarafından tamamen ele geçirilmemesini nasıl sağlamalıyız?

Hepimiz aynı fiyat karşılaştırıcısını kullanırsak rekabet ve teklif çeşitliliği ne olur? Yayıncılar, kullanım politikalarının etrafından dolanılması ve görünmezleşme arasında sıkışıp kalmaktadır.

Çeviri kaynağı ChatGPT Agent face à ses limites : un outil prometteur, mais encore loin de la “workforce à la demande”