监管机构决定

Anthropic在美国政府指令后被迫暂停Fable 5和Mythos 5

美国政府一项出口管制指令迫使Anthropic切断Fable 5和Mythos 5的访问。公司选择配合并向客户致歉,但同时质疑这一先例可能会冻结所有新模型部署。

STStephane Nachez · · ·1 min
Anthropic在美国政府指令后被迫暂停Fable 5和Mythos 5
Visuel d'illustration généré avec l'IA
目录

Anthropic于2026年6月12日宣布,因美国政府当天发布的一项出口管制指令,必须暂停其模型Fable 5Mythos 5的访问。根据官方要求,任何外国公民——无论其身处美国境内还是境外,包括Anthropic的外国员工——都不得访问这两款模型。为确保合规,Anthropic表示别无选择,只能对所有客户全面切断Fable 5和Mythos 5的访问。Anthropic的其他模型不受影响。

该指令于美国东部时间当日17:21收到。Anthropic表示,来函并未详细说明所援引的国家安全担忧的具体性质。按照其理解,美国政府认为其掌握了一种针对Fable 5的绕过方法——即所谓的“jailbreak”。

争议中的绕过方式:让模型读取代码

Anthropic称其已审查该技术演示。演示仅用于识别“少量已知的轻微漏洞”,这些漏洞被认为相对简单,而且公司强调,其他公开模型无需任何绕过手段也能发现这些问题。

截至目前,Anthropic表示,美国政府仅提供了关于一种潜在、范围有限且并非通用的jailbreak的口头证据,其核心做法基本上是“要求模型读取特定代码库并修复其中的软件缺陷”。公司称,已查阅其认为导致该指令的报告,并核实其中描述的能力水平“在其他模型上也广泛可用(包括OpenAI的GPT-5.5)”,且安全防御团队每天都在使用。Anthropic承诺将在24小时内公布更多细节。

Anthropic的辩护:具备“业内最强”防护

Anthropic重申了其在Fable发布时的立场。公司称,其安全护栏“足够强”,以至于许多用户抱怨限制过于宽泛,尤其是在与网络安全相关的用途上。在发布前的数周内,Fable据称接受了数千小时的red-teaming测试,由美国政府、英国AISI、多个第三方组织以及内部团队共同参与。测试结果显示,这些防护措施“明显优于迄今任何已部署模型”。

更重要的是,Anthropic表示,“迄今为止,没有任何测试者找到通用jailbreak”——即能够大范围关闭安全护栏的绕过方式。不过,公司也承认,当前没有任何供应商能够实现绝对完美的防御,通用jailbreak最终大概率会出现;这一点公司称在Fable 5发布时就已明确说明。

“纵深防御”策略

由于无法实现完美抵御,Anthropic主张采用纵深防御策略:让绕过方式要么范围有限(非通用jailbreak),要么成本极高(通用jailbreak),并结合深度监测,以便快速发现并阻止任何成功攻击。公司还解释,这也是其对Fable实施30天客户数据留存的原因——这一措施确实会给客户带来成本,但也使其能够研究并修复jailbreak。Anthropic认为,这一策略已将Fable带来的风险降至与行业内已部署模型相当的水平。

Anthropic遵从,但提出异议

尽管Anthropic正在执行该指令并移除两款模型的访问权限,但公司明确表示反对:仅发现“一个潜在且范围有限的jailbreak”,不足以成为召回一款已“向数亿人部署”的商业模型的理由。若将这一标准推广至整个行业,Anthropic认为,这实际上将使所有前沿实验室的新模型发布“陷入停滞”。

Anthropic强调,公司公开支持政府阻止被认定为危险的部署,但前提应是一个“透明、公平、明确且基于技术事实”的法律程序,而公司认为此次行动并不符合这些原则。Anthropic为给客户造成的影响致歉,表示相信这是一次“误解”,并正在努力尽快恢复访问。

这不仅是监管先例,更是地缘政治先例

超越Fable 5和Mythos 5个案,此次事件标志着更深层次的转向:美国不再只管控芯片、算力或模型权重,而是开始主张可基于国家安全理由,直接中断一款已商业化模型的实际访问。

这是一个重要的变化。此前,围绕AI主权的讨论主要集中在上游:GPU、数据中心、数据集,以及开源或闭源模型。如今,控制延伸到了使用本身。问题不再只是“谁能训练前沿模型”,而是“谁有权调用它、在什么条件下调用,以及以什么国籍身份调用”。

针对外国公民的指令——即便他们身处美国境内,或为Anthropic工作——为全球AI经济引入了新的裂痕。它把用户、研究人员、员工或客户的国籍,变成了接入认知基础设施的参数。对于企业而言,这带来了难以通过合同覆盖的风险:一项已合法签约、技术上可用且已商业化部署的服务,可能因外部行政原因在一夜之间失效。

对于美国盟友而言,这一信号尤其敏感。欧洲、加拿大、日本、韩国或澳大利亚并不一定是此类措施的政治目标,但它们会承受其逻辑:在国家安全框架下,美国最先进模型的访问可能被暂停,而不会细分合作伙伴、竞争者与对手。此时,AI主权不再只是一个防御性口号,而是业务连续性问题。

这一先例也为那些挑战美国技术霸权的国家提供了论据。北京可能会将其视为进一步证明:美国前沿模型并非普通云产品,而是可被撤销的战略能力。华盛顿越是把访问控制作为权力工具,就越会促使其竞争对手加快建设各自的主权技术栈、封闭体系或区域体系。

难点在于所援引风险的性质。高级网络能力本身就具有双重用途:同一个模型既可帮助防御者识别漏洞,也可帮助攻击者利用漏洞。如果仅仅因为模型能够读取代码库并提出修复建议,就足以成为将其下架的理由,那么阻断门槛很快就可能覆盖几乎所有前沿模型。反过来,如果各国等待的证据门槛过高,又可能行动太迟。如今,正是这一中间地带仍缺乏明确的公开政策框架。

因此,Fable 5事件不只是对Anthropic的考验,也预示着前沿模型的政治秩序:这些产品面向全球商业化,却受主权召回权约束;它们是私有基础设施,却被视为战略资产;它们是软件工具,却在很大程度上受出口管制与国家安全逻辑治理。

未来几周所采用的标准将至关重要。如果一个范围有限、非通用、且与其他地方已存在能力相当的jailbreak,就足以证明全球性切断是合理的,那么前沿模型发布将进入一个新时代:条件化、可撤销且受地缘政治筛选的部署。反之,如果此事最终被证明只是过度谨慎或行政误解,它至少也揭示了一点:获取最先进模型,已不再只是市场问题,而是权力属性的一部分。

ST
Stephane Nachez

ActuIA 编辑部 — 面向决策者的人工智能资讯、数据与分析。

提及的参与者
ANAnthropic
AUAustralie
OPOpenAI
EUEurope
CACanada
JAJapon
ActuIA 周刊

订阅成功,敬请期待!