Claude Opus 4.8:Anthropicは自身のエラーに対してより正直なモデルを強調

Claude Opus 4.8:Anthropicは自身のエラーに対してより正直なモデルを強調

TLDR : Claude Opus 4.8は、前作に比べてコードの欠陥を指摘しない可能性を4分の1に減少させたとされ、即時利用可能です。

2026年5月28日に発表されたClaude Opus 4.8におけるAnthropicの強調点は、一つのメトリクスにあります。エディタによれば、このモデルは前作に比べて、自身が生成したコード内の欠陥を指摘せずに通過させる可能性が4分の1に減少したとされています。数値は自社内のAlignmentチームによって自己申告されており、公開されていないプロトコルに基づいています。モデルはclaude-opus-4-8という識別子でAPIを通じて即時利用可能であり、claude.aiでも提供され、Opus 4.7と同じ標準価格(入力トークン100万あたり5ドル、出力トークン100万あたり25ドル)で提供されます。Opus 4.8の「ファストモード」は標準モードの2.5倍の速度で動作し、入力トークン100万あたり10ドル、出力トークン100万あたり50ドルで提供され、公式発表によれば、前作のファストモードの3分の1の価格です。

Claude Opus 4.8 - APIの料金(2026年5月28日のリリース時)

モード 入力 ($/M tokens) 出力 ($/M tokens) 注釈
標準 5 $ 25 $ Opus 4.7と変わらず
ファストモード (2.5×) 10 $ 50 $ 前作のファストモードの3分の1の価格

出典: Anthropic公式発表, anthropic.com/news/claude-opus-4-8

発売に伴う三つの運用レバー

モデルだけでなく、三つの機能がOpus 4.8がエージェントワークステーションに統合される方法を変更します(多段階タスクを自律的に調整するために設計されています)。最初の機能は「ダイナミックワークフロー」と呼ばれ、開発者向けの早期アクセス(リサーチプレビュー)として展開され、Claude Codeを非常に大規模なプロジェクトに拡張します。エージェントは作業を計画し、数百のサブエージェントを同時に同一セッションで起動し、結果を提供する前に出力を確認します。Anthropicは使用例として、既存のテストスイートを基準として、数十万行規模のコードベースの移行を挙げています。この機能はClaude CodeのEnterprise、Team、Maxプランに限定されています。二番目の機能、「エフォートコントロール」は、claude.aiのモデルセレクターの横に4段階のスライダー(「低」、「デフォルト」、「エクストラ」、「最大」)を追加し、すべてのサブスクリプションプランで利用可能です。Anthropicは重いタスクや長期間の非同期フローには「エクストラ」設定を推奨しています。三番目の機能は、Messages APIで、タスク中にmessagesテーブル内にシステム入力を挿入できるようになり、プロンプトキャッシュを壊すことなくユーザーツアーを経ずに、実行中のエージェントに対して権限、トークンの予算、環境コンテキストをリアルタイムで更新できます。

業界のマイルストーンとして掲げられたメタ認知のメトリクス

未報告の欠陥に関する4倍の要素は、発表の中で最も構造的で、購入者にとって最も扱いにくいものです。このメトリクスは、同日に公開されたモデルのセキュリティカード(System Card)に記載されていますが、AnthropicのAlignmentチームによって生成されたものであり、第三者の評価ではなく、エディタの環境外では再現できない状態です。同じチームによれば、Opus 4.8は誤った行動率(詐欺や悪用への協力など)がOpus 4.7よりも実質的に低く、最も整列したモデルであるClaude Mythos Previewと同程度とされています。このメトリクスが示しているのは、未公開のプロトコルで自己申告された4倍の要因よりもむしろ評価軸の移動であるとされています。Anthropicは、モデルのメタ認知(自分が何をできないかを知り、自身の生成物に対する不確実性を報告すること)をエージェントモデルを評価するための中心的な基準として提供しています。しかし、未報告の欠陥のカウント式、テストされたコードコーパスの生成プロトコル、または擾乱条件を公開していません。Aithos AI Research Foundationの研究ノートで2026年2月9日に発表された独立した研究によれば、Anthropicの評価シナリオを再現した結果、「公開されたテストシナリオは最近のClaudeモデルでほぼ完璧な整合性を示しているが、擾乱が持続的なコンプライアンスギャップを明らかにしている」ことが示されています(「Published testing scenarios show near-perfect alignment for newer Claude models, but perturbations reveal persistent compliance gaps.」の自由訳)。この観察はOpus 4.6を対象としており、4×のメトリクスだけでは対抗できないシナリオを描いています。

「公開されたテストシナリオは最近のClaudeモデルでほぼ完璧な整合性を示しているが、擾乱が持続的なコンプライアンスギャップを明らかにしている。」

Aithos AI Research Foundation - Daan Henselmans, Arno Libert, Lennard Zwart(2026年2月、英語から翻訳)。Opus 4.6に関する研究;著者はまだOpus 4.8を評価していません。

Mythosに向けたシリーズのマイルストーン

Opus 4.8は、Claudeファミリーの迅速なイテレーションのペースに沿ったもので、2025年5月にClaude Opus 4がコーディングとエージェントによる自動化に特化した世代として発表され、その後Claude Sonnet 4.5がプログラミングの軸で続けられました。エディタ自身がOpus 4.7に対する「控えめながらも目に見える改善」として位置付けており、次のクラスの到来が発表されています。このクラスはClaude Mythos Previewであり、Project Glasswing(2026年4月に開始された防御的サイバーセキュリティイニシアチブ)の一環として、限定アクセスで既に展開されています。Anthropicと「約50のパートナー」、AWS、Apple、Cisco、Google、Microsoft、NVIDIAを含むが、Mythos Previewを使用して、システム的に重要とされるソフトウェアで1か月間に1万以上の高またはクリティカルな重大度の脆弱性を特定したと宣言しています。Mythosの一般公開は「数週間以内」とされ、強化されたガードレールの展開が条件とされています。Opus 4.8のパフォーマンスの解釈は、現時点で二次的なフィルターに依存しています。Anthropicが公開した数十の数値化された証言の中で、唯一の公的な学術ベンチマークに基づくものはInduced AIのもので、Online-Mind2Webで84%を達成しています。このベンチマークはオハイオ州立大学のOSU-NLP-GroupによってMITライセンスで維持されていますが、参照論文のタイトルとして「An Illusion of Progress? Assessing the Current State of Web Agents」とされており、学術著者の編集方針が、ウェブエージェントにおける勝ち誇るスコアを慎重に扱うよう促しています。他の主張されたパフォーマンス(Relevance AIのSuper-Agent Benchmark、HarveyのLegal Agent Benchmark、CursorのCursorBench)は、未公開のプロプライエタリなプロトコルに基づいています。