Зміст
Запущений у середині липня 2025 року, ChatGPT Agent є частиною прагнення OpenAI зробити крок уперед до автономних асистентів, здатних навігації в Інтернеті, виконання скриптів і виконання складних завдань від початку до кінця. Представлений як «робоча сила на вимогу», цей інструмент викликав як захоплення, так і розчарування, судячи з відгуків перших користувачів.
Реальні можливості, але змішані результати
На папері ChatGPT Agent вражає своєю здатністю виконувати етапи місії: збір інформації в Інтернеті, організація та синтез, створення документів (звітів, презентацій, електронних таблиць), інструмент поєднує функціональні можливості Operator і DeepResearch, які вже доступні на платформі протягом кількох місяців. Для структурованих і не двозначних завдань кілька тестувальників повідомляють про значну економію часу, коли агент здатний скоротити вдвічі, а то й більше, час, необхідний для певних досліджень і підготовки матеріалів.
Однак обмеження з'являються швидко, коли завдання стають складнішими. Багато відгуків на Reddit і LinkedIn підкреслюють помітну повільність, повторювані цикли дій і високий рівень невдач у деяких веб-взаємодіях.
Пісочниця: безпека чи обмеження?
Функціонування ChatGPT Agent базується на пісочниці: віртуальному середовищі, розміщеному OpenAI, яке інтегрує браузер і віртуальний робочий стіл. Такий підхід спрямований на зниження ризиків безпеки та підтримання контролю над діями агента, але він значно обмежує його можливості.
Багато сайтів блокують доступ або виявляють агента як бота, заважаючи бронюванням, покупкам або складним взаємодіям.
Агент часто не справляється з динамічними формами, дуже інтерактивними сайтами, захищеними CAPTCHA або такими сервісами, як Cloudflare, що робить його непридатним для виконання більшості найпривабливіших обіцянок на папері.
Цей захисний підхід робить агента придатним для досліджень і синтезу, але ненадійним для просунутих або критичних веб-дій.
Спроба наздогнати Manus
На противагу ChatGPT Agent, Manus, розроблений Future AGI, пропонує більш сміливий підхід. Використовуючи багатогентну архітектуру (планування, виконання, перевірка) та більш повне середовище пісочниці (просунутий браузер, термінал, мультимодальне генерування), Manus вважається деякими більш продуктивним у складних завданнях і автономних робочих процесах.
Однак, Manus залишається мало доступним (обмежений доступ, високі витрати на кредити, обмежена доступність), що обмежує його прийняття. Відгуки користувачів свідчать про часті помилки та значне споживання кредитів у разі невдачі, що викликає розчарування. Його автономність передбачає менший контроль у реальному часі, що може призвести до відхилень, коли агент йде в непередбачуваному напрямку.
До агентів, інтегрованих у браузер?
Інший шлях міг би зняти частину обмежень: перемістити агента у браузер користувача через розширення або локальний модуль.
Такий підхід міг би запропонувати:
- Швидше виконання завдяки відсутності віртуалізації.
- Пряму інтеграцію з локальними інструментами та даними (CRM, месенджери, документи).
- Кращу сумісність із сучасними сайтами, оскільки він вів би себе як справжній людський браузер.
Але цей вибір поставив би два основних виклики:
- Безпека: агент, що має доступ до cookies, облікових записів і локальних даних, став би пріоритетною ціллю для зловживань.
- Маркетингове позиціонування: локальний агент більше нагадував би інструмент для особистої автоматизації, ніж «зовнішню робочу силу», змінюючи комерційну обіцянку OpenAI.
Продукт, що ще розвивається
На даний момент ChatGPT Agent залишається інноваційним, але недосконалим інструментом: корисним для прискорення деяких чітко визначених завдань, обмеженим для більш амбіційних місій. Бачення «штучної робочої сили» більше нагадує маркетингову обіцянку, ніж технічну реальність.
Еволюція ринку AI-агентів може проходити через гібридний компроміс: агенти, здатні працювати в безпечному середовищі, одночасно делегуючи певні взаємодії локальному браузеру, з підвищеним контролем і запобіжними заходами.
Поки що користувачі повинні розглядати ChatGPT Agent як інтелектуального асистента в стадії тестування, а не як справжню заміну людським співробітникам.
Яке майбутнє вебу перед агентами?
Інтернет завжди дозволяв програмному забезпеченню та комп'ютерним системам взаємодіяти між собою. Більшість веб-сайтів реалізують щонайменше один або кілька API, інтерфейсів для комунікації між програмами. Сьогодні агенти прагнуть перетворити видиму частину вебу, призначену для використання людьми, на програмні інтерфейси природною мовою.
Питання не стільки в технічних можливостях, скільки в згоді або незгоді видавців зробити їхній контент доступним програмам. Теоретичні обіцянки агентів базуються на світі, де агенти мають доступ до всього. Однією з перших очевидних наслідків було б прискорення краху, що вже почалося, рекламної моделі.
Це також може викликати питання щодо змін, особливо у контексті ринкових платформ: як можна уявити, що вигідні пропозиції сайтів оголошень, призначених для приватних осіб, таких як Le bon coin або Vinted, не будуть повністю захоплені систематично кількома гравцями?
Що станеться з конкуренцією та різноманітністю пропозицій, якщо ми всі використовуватимемо один і той самий порівняльник цін? Видавці опиняються в лещатах між обхідною політикою використання та поступовою невидимістю.