Claude Opus 4.8: Anthropic робить наголос на більш чесну модель щодо власних помилок

Покращення, на яке звертає увагу Anthropic для Claude Opus 4.8, опублікованого 28 травня 2026 року, полягає в одній метриці: за словами видавця, модель в чотири рази менш імовірно, ніж її попередник, пропустить помилки в коді, який вона створила, не вказавши на них. Ця цифра є самодекларованою, виробленою внутрішньою командою Alignment на основі протоколу, який не був публічно оголошений. Модель доступна негайно через API під ідентифікатором claude-opus-4-8 та на claude.ai з стандартною ціною, яка відповідає ціні Opus 4.7 (5 доларів за мільйон токенів на вході, 25 доларів за мільйон на виході). Режим "fast mode" Opus 4.8, який працює в 2,5 рази швидше за стандартний режим, коштує 10 доларів за мільйон токенів на вході і 50 доларів на виході, тобто, відповідно до офіційного повідомлення, в три рази дешевше, ніж fast mode попередніх моделей Opus.

Claude Opus 4.8 - ціни API на момент запуску (28 травня 2026)

Режим	Вхід ($/М токенів)	Вихід ($/М токенів)	Примітка
Стандартний	5 $	25 $	Без змін у порівнянні з Opus 4.7
Fast mode (2,5×)	10 $	50 $	3× дешевше, ніж попередній fast mode

Джерело: офіційне повідомлення Anthropic, anthropic.com/news/claude-opus-4-8

Три операційні важелі супроводжують випуск

Окрім моделі, три функції змінюють спосіб інтеграції Opus 4.8 у агентні робочі станції (призначені для автономного виконання багатоступінчастих завдань). Перша, названа "dynamic workflows" і розгорнута в ранньому доступі для розробників (research preview), розширює Claude Code на проекти дуже великого обсягу: агент планує роботу, запускає кілька сотень під-агентів паралельно в одній сесії, а потім перевіряє результати перед їх наданням. Anthropic наводить як приклад міграцію великого коду обсягом у кілька сотень тисяч рядків, від запуску до злиття, з використанням існуючого тестового набору як еталону. Функція доступна для планів Enterprise, Team і Max Claude Code. Друга, контроль зусиль ("effort control"), додає до вибору моделі на claude.ai повзунок з чотирма рівнями: "low", "default", "extra" і "max", доступний для всіх підписок. Anthropic рекомендує налаштування "extra" для важких завдань і асинхронних потоків тривалої дії. Третя, у Messages API, тепер дозволяє вставляти системні записи всередині таблиці messages під час виконання завдання, не порушуючи кеш запиту і не проходячи через користувацький обхід, що відкриває можливість оновлення дозволів, бюджетів токенів чи контексту середовища для агентів у ході виконання.

Метрика метакогніції як промисловий орієнтир

Чотирикратний фактор, заявлений щодо неповідомлених дефектів, є найважливішим елементом оголошення і найскладнішим для розуміння покупцем. Метрика документована в карті безпеки моделі (System Card), опублікованій того ж дня, але вона була створена командою Alignment Anthropic, а не незалежним оцінювачем, і протокол не може бути повторений за межами середовища видавця. За словами тієї ж команди, Opus 4.8 демонструє значно нижчі показники неузгодженої поведінки, такої як обман чи співпраця у зловживаннях, ніж Opus 4.7, і близькі до найкраще узгодженого моделі, Claude Mythos Preview. Що метрика фіксує, так це не стільки факт - чотирикратний самодекларований фактор на непублічному протоколі слабо зобов'язує - скільки зміщення осі оцінки: Anthropic тепер пропонує метакогніцію моделі (знати, що вона не може робити, повідомляти про свої невпевненості щодо власних продуктів) як центральний критерій для кваліфікації агентної моделі. Це саме те, чого бракує, щоб піти далі: видавець не публікує ні формулу підрахунку невиявлених дефектів, ні протоколу генерації тестового корпусу коду, ні умов збурення. Незалежні дослідження, опубліковані на дослідницькому блозі Aithos AI Research Foundation 9 лютого 2026 року, показали, відтворюючи сценарії оцінки Anthropic, що "опубліковані тестові сценарії показують майже ідеальну узгодженість для нових моделей Claude, але збурення виявляють стійкі прогалини у відповідності" (вільний переклад з "Published testing scenarios show near-perfect alignment for newer Claude models, but perturbations reveal persistent compliance gaps"). Спостереження стосувалося Opus 4.6; воно малює сценарій, проти якого метрика 4× сама по собі не є достатньо підготовленою.

"Опубліковані тестові сценарії показують майже ідеальну узгодженість для нових моделей Claude, але збурення виявляють стійкі прогалини у відповідності."
Aithos AI Research Foundation - Деан Хенселманс, Арно Лібер, Леннард Зварт (лютий 2026 року, переклад з англійської). Дослідження стосується Opus 4.6; автори ще не оцінювали Opus 4.8.

Орієнтир у серії перед революцією Mythos

Opus 4.8 входить у швидку ітераційну послідовність сімейства Claude: ActuIA вже документувала запуск Claude Opus 4 у травні 2025 року як генерацію, зосереджену на кодуванні та автоматизації агентами, траєкторія, яка продовжувалася з Claude Sonnet 4.5 на осі програмування. Видавець сам представляє його як "скромне, але відчутне покращення" у порівнянні з Opus 4.7, перед анонсованим приходом вищого класу. Цей клас - це Claude Mythos Preview, вже розгорнутий у обмеженому доступі в рамках Project Glasswing (ініціатива оборонної кібербезпеки, запущена у квітні 2026 року). Впродовж місяця Anthropic та "приблизно 50 партнерів", серед яких AWS, Apple, Cisco, Google, Microsoft і NVIDIA, заявили, що за допомогою Mythos Preview виявили понад десять тисяч вразливостей високої або критичної серйозності у програмах, які вважаються системно важливими. Публічний випуск Mythos анонсований "в найближчі тижні", за умови впровадження посилених запобіжників. Оцінка продуктивності Opus 4.8 зависає на даний момент через другий фільтр: з десятка представлених числових свідчень від Anthropic, єдине, що спирається на публічний академічний бенчмарк, - це Induced AI, яке заявляє 84% на Online-Mind2Web. Цей бенчмарк, підтримуваний OSU-NLP-Group з Ohio State University під ліцензією MIT, має власну назву референсного документу "An Illusion of Progress? Assessing the Current State of Web Agents", редакційний вибір академічних авторів, що запрошує обережно підходити до тріумфальних результатів на веб-агентах. Інші заявлені показники (Super-Agent Benchmark від Relevance AI, Legal Agent Benchmark від Harvey, CursorBench від Cursor) базуються на власних непублічних протоколах.

Stephane Nachez

Редакція ActuIA — новини, дані й аналітика про штучний інтелект для керівників.

Claude Opus 4.8: Anthropic робить наголос на більш чесну модель щодо власних помилок

Три операційні важелі супроводжують випуск

Метрика метакогніції як промисловий орієнтир

Орієнтир у серії перед революцією Mythos

Чому чутки про cloud Meta обвалили neoclouds

Anthropic змушена призупинити Fable 5 і Mythos 5 після директиви уряду США

Siri AI: Gemini як викладач, а не як двигун — про що не сказала WWDC