新模型

同一模型,不同护栏:Claude Fable 5 与 Mythos 5 的发布揭示了什么

Anthropic 于 2026 年 6 月 9 日发布 Claude Fable 5 与 Claude Mythos 5,两者据称共享同一底层模型,差异主要在于护栏、访问权限与推理时配置层。此次发布不仅体现了产品分层与定价策略,也折射出推理成本压缩、企业安全治理以及欧洲 AI Act 时间表对市场采用节奏的影响。

STStephane Nachez · ·2 min
同一模型,不同护栏:Claude Fable 5 与 Mythos 5 的发布揭示了什么
Sommaire

Anthropic 于 2026 年 6 月 9 日发布了 Claude Fable 5 和 Claude Mythos 5。据 Anthropic 介绍,这两款产品基于同一底层模型,差异仅在于护栏机制:Fable 5 面向通用用途,启用安全分类器;Mythos 5 则仅向通过 Project Glasswing 的少数网络防御人员开放,并在某些领域解除这些相同护栏。Anthropic 在其 工程博客中将这一封装层描述为一种在推理时应用的配置层(“configuration overlay applied at inference time”,意为“在推理时应用的配置叠加层”,为意译),与模型权重相分离,由此成为两项产品之间的商业边界。

因此,这次更新的意义并不只是推出了一个更强大的模型。更重要的是,它明确区分了模型权重、推理时配置以及访问机制。Fable 5 和 Mythos 5 之所以成为两款不同产品,并不一定是因为它们对应两套分别训练的模型,而是因为它们暴露给用户的使用空间并不相同。这一区分具有战略意义:Anthropic 既可以开放所谓“Mythos-class”的能力,又能将部分用途保留给经过验证的主体,尤其是在 Project Glasswing 框架下。


根据 Anthropic 的公告,Fable 5 通过 Anthropic API 的定价为输入 10 美元/百万 tokens、输出 50 美元/百万 tokens;而根据 LLMReference(截至 2026 年 6 月 9 日更新),Mythos Preview 的价格为输入 25 美元/百万 tokens。

一次降价,嵌入了推理成本在行业内持续压缩的大趋势

DeepSeek 在过去一年多里一直采用明显低于美国前沿模型的定价,而 OpenAI 的 GPT-5 定价为输入 1.25 美元/百万 tokens、输出 10 美元/百万 tokens,分别比 Fable 5 的基础价格便宜 8 倍和 5 倍。LLMReference 显示,Mythos Preview 的输入价格为 25 美元/百万 tokens,是 Fable 5 输入价格的 2.5 倍。因此,“护栏配置”导致 Anthropic 为封装工作而非模型权重收费的解释,与竞争压力的解释并存;6 月 9 日的公告并未在两者之间作出明确判断,官方表述也未披露具体拆分方式。

实测表现有据可查,但敏感结果未纳入公开审查

Cognition AI 于 2026 年 6 月 8 日发布的 FrontierCode 基准上,Fable 5 据 Cognition AI 称位居榜首,但发布公告并未给出具体分数。根据 Cognition AI 的说法,在 Fable 5 到来之前,Claude Opus 4.8 以 13.5% 的峰值领先 FrontierCode,而 SWE-bench 的输出中仍有超过 50% 无法合并。Cognition 开发 Devin,并且运营于编码代理这一 Anthropic 正在布局的细分市场,但这一点并未出现在发布公告中。在客户反馈方面,Stripe 表示在早期测试中,Fable 5 用一天时间完成了对一套 5000 万行 Ruby 代码库的迁移,而这项工作原本预计需要整支团队耗时两个月以上。至于更敏感的应用场景,Anthropic 表示,在一项内部药物设计研究中,14 个蛋白质靶点里有 9 个生成了有潜力的候选分子,但这些结果尚未经同行评审。该公司还指出,自动化对齐评估显示,Mythos 5 的不对齐行为水平与 Opus 4.8 相近,也就是较低,但并非为零。

Glasswing、分类器与 AI Act 时间表:欧洲买家会如何解读这则公告

Anthropic 用来证明 Mythos 产品线价值的最常被引用的结果,早于 Mythos 5 的正式发布:根据 2026 年 6 月 2 日的 Glasswing 扩展公告,最初的 50 家合作伙伴——包括 AWS、Apple、Cisco、CrowdStrike、Google、Microsoft、NVIDIA、JPMorganChase 和 Linux Foundation 等——在通过 Mythos Preview 扫描其代码库时,发现了超过 10,000 个高危或严重级别的安全漏洞。因此,这些漏洞应归因于自 2026 年 4 月起开放的 Preview 访问,而不是刚刚开始通过 Glasswing 部署的 Mythos 5。至于 Fable 5,Anthropic 表示安全分类器平均会在不到 5% 的会话中触发,并在此时将请求转交给 Opus 4.8——公司也承认,这是一种刻意偏保守的设置,可能会拦截无害请求。对于欧洲买家来说,监管时间表正在缓解集成压力:根据 2026 年 5 月 7 日就 AI Act Omnibus 达成的临时政治协议,附录 III 中的高风险义务将推迟至 2027 年 12 月 2 日。按照 Anthropic 的收费方式,护栏配置本身已经成为一项可独立售卖的对象;而分类器的误报率——目前仅由 Anthropic 自行披露,且称低于 5% 的会话——并未按被拦截请求的严重程度分级公开。

ST
Stephane Nachez
subscriber

Rédaction ActuIA — actualités, données et analyses sur l'intelligence artificielle pour les décideurs.