Anthropic, 미국 정부 지침에 따라 Fable 5와 Mythos 5를 중단하도록 강제돼

Anthropic은 2026년 6월 12일, 같은 날 미국 정부가 발령한 수출 통제 지침에 따라 자사 모델 Fable 5와 Mythos 5에 대한 접근을 중단해야 한다고 발표했다. 공식적으로 해당 명령은 미국 영토 안팎을 불문하고, Anthropic의 외국인 직원까지 포함해 모든 외국 국적자의 두 모델 접근을 금지한다. 그러나 규정을 준수하기 위해 회사는 전체 고객을 대상으로 Fable 5와 Mythos 5의 접근을 갑작스럽게 차단할 수밖에 없다고 밝혔다. Anthropic의 다른 모델들은 영향을 받지 않는다.

해당 지침은 미 동부시간 기준 오후 5시 21분에 전달됐다. Anthropic은 이 서한에 국가 안보 우려의 정확한 성격이 명시돼 있지 않았다고 설명했다. 회사의 이해에 따르면, 미국 정부는 Fable 5를 겨냥한 우회 기법, 즉 ‘jailbreak’의 존재를 인지한 것으로 보인다.

문제의 우회 기법: 모델에게 코드를 읽게 하는 방식

Anthropic은 해당 기법의 시연을 검토했다고 밝혔다. 이 시연은 “이미 알려진 소수의 경미한 취약점”을 찾아내는 데 사용됐으며, 회사는 이를 비교적 단순한 수준으로 평가했다. 또한 Anthropic은 이런 취약점은 다른 공개 모델들도 별도의 우회 없이 발견할 수 있다고 강조했다.

현 시점에서 Anthropic은 정부로부터 잠재적이지만 제한적이고 보편적이지 않은 jailbreak에 대한 구두 증거만 받았다고 밝히며, 핵심은 “모델에게 특정 코드베이스를 읽고 소프트웨어 결함을 수정하도록 요청하는 것”이라고 설명했다. 회사는 자신들이 지침의 근거가 된 것으로 보이는 보고서를 검토했으며, 그 보고서가 묘사한 수준의 능력은 “다른 모델들(예: OpenAI의 GPT-5.5 포함)에서도 널리 제공되고 있으며”, 보안 시스템을 담당하는 방어 측이 매일 활용하는 수준이라고 확인했다고 전했다. Anthropic은 24시간 내에 추가 세부 정보를 공개하겠다고 약속했다.

Anthropic의 방어 논리: “가장 강력한 수준”의 안전장치

회사는 Fable 출시 당시 제시했던 입장을 다시 언급했다. Anthropic은 자사의 안전장치가 “매우 강력해” 많은 사용자들이 특히 사이버보안 관련 사용 사례에서 지나치게 광범위하다고 불만을 제기할 정도라고 주장한다. 출시 직전 수 주 동안 Fable은 미 정부, 영국 AISI, 여러 제3자 조직, 내부 팀과 함께 수천 시간에 걸친 red-teaming을 거쳤다고 한다. 이 테스트들은 기존에 배포된 어떤 모델보다도 “훨씬 더 효과적인” 보호 장치를 보여줬다는 것이 회사의 설명이다.

무엇보다 Anthropic은 “현재까지 어떤 테스터도 보편적 jailbreak를 찾아내지 못했다”고 말한다. 이는 광범위하게 안전장치를 무력화할 수 있는 우회 기법을 뜻한다. 다만 회사는 현재 시점에서 어떤 공급자도 완벽한 저항력을 달성하기는 어렵다고 인정하며, 보편적 jailbreak는 결국 등장할 가능성이 높다고 본다. 이 점은 Fable 5 출시 당시 이미 명확히 밝혔다는 입장이다.

“Defense in depth” 전략

완벽한 방어가 불가능한 만큼 Anthropic은 다층 방어 접근을 내세운다. 즉, 우회 기법을 좁은 범위의 jailbreak(비보편적)로 제한하거나, 보편적 jailbreak를 만드는 데 매우 큰 비용이 들게 하고, 동시에 정교한 모니터링을 통해 성공한 공격을 신속히 탐지·차단하겠다는 것이다. 회사는 이것이 Fable에 30일 고객 데이터 보존을 적용하는 이유이기도 하다고 설명한다. 이 조치는 고객과의 관계에서 실제 비용을 수반하지만, jailbreak를 분석하고 수정하는 데 도움이 된다. Anthropic은 이러한 전략이 Fable의 위험을 업계에 이미 배포된 모델들과 비슷한 수준으로 낮춘다고 본다.

Anthropic은 준수하되, 이의는 제기한다

Anthropic은 지침을 이행하고 두 모델에 대한 접근을 제거하면서도, “잠재적이고 제한적인 jailbreak”의 발견만으로는 “수억 명에게 배포된” 상용 모델을 회수할 근거가 되지 않는다고 반발했다. 업계 전체에 이런 기준을 적용할 경우, 사실상 모든 최첨단 연구소의 신규 모델 배포가 멈추게 될 것이라고 경고했다.

회사는 위험하다고 판단되는 배포를 정부가 차단할 수 있는 능력을 공개적으로 지지해 왔지만, 그 과정은 “투명하고 공정하며 명확하고 기술적 사실에 기반한” 법적 절차여야 한다고 강조한다. Anthropic은 이번 조치가 그 원칙에 부합하지 않는다고 본다. 회사는 고객에게 불편을 끼친 점에 대해 사과하며, 이번 사태가 “오해”이길 바라고, 가능한 한 빨리 접근을 복구하기 위해 노력 중이라고 밝혔다.

규제만이 아닌 지정학적 선례

Fable 5와 Mythos 5만의 문제가 아니라, 이번 사건은 더 깊은 변화를 보여준다. 미국은 더 이상 칩, 컴퓨팅 자원, 모델 가중치만 통제하는 것이 아니다. 이제는 국가 안보를 이유로 이미 상용화된 모델에 대한 운영 접근 자체를 중단시킬 수 있다고 주장한다.

이는 중요한 이동이다. 지금까지 AI 주권 논의는 주로 상류 단계, 즉 GPU, 데이터센터, 데이터셋, 오픈/클로즈드 모델에 집중돼 있었다. 그러나 이번에는 통제의 초점이 사용 자체로 옮겨갔다. 이제 질문은 단지 누가 최첨단 모델을 학습시킬 수 있느냐가 아니라, 누가 어떤 조건에서, 어떤 국적을 가진 상태로 그 모델에 질문할 수 있느냐로 바뀌었다.

외국 국적자를 대상으로 한 지침은, 그들이 미국 내에 있든 Anthropic에서 일하든 상관없이, 글로벌 AI 경제에 새로운 균열을 만든다. 사용자의 국적, 연구자의 국적, 직원의 국적, 고객의 국적이 곧 인프라 접근 조건이 된다. 기업 입장에서는 계약으로도 관리하기 어려운 리스크가 생긴다. 합법적으로 구독했고, 기술적으로는 가능하며, 상업적으로도 배포된 서비스가 고객-공급자 관계와 무관한 행정적 이유로 하루아침에 접근 불가가 될 수 있기 때문이다.

미국의 동맹국들에게도 이 신호는 특히 민감하다. 유럽, 캐나다, 일본, 한국, 호주가 반드시 이 조치의 정치적 표적은 아닐 수 있다. 그러나 그들은 그 논리를 고스란히 체감한다. 국가 안보 체제에서는 미국의 가장 앞선 모델 접근이 파트너, 경쟁자, 적대국을 세밀하게 구분하지 않은 채 중단될 수 있다. 이때 AI 주권은 더 이상 방어적 구호가 아니라, 사업 연속성의 문제로 바뀐다.

이 선례는 미국의 기술 패권에 이의를 제기하는 국가들에게도 논거를 제공한다. 베이징은 이를 미국의 최첨단 모델이 단순한 클라우드 제품이 아니라, 회수 가능한 전략 자산이라는 증거로 볼 수 있다. 워싱턴이 접근 통제를 권력의 수단으로 더 많이 사용할수록, 경쟁국들은 자국의 독자적·폐쇄적·지역적 스택 구축을 더 서둘러 추진하게 된다.

문제는 제기된 위험의 성격 자체에 있다. 고급 사이버 역량은 본질적으로 이중용도다. 같은 모델이 방어자에게는 취약점 식별을 돕고, 공격자에게는 그것을 악용하는 데 쓰일 수 있다. 단지 코드베이스를 읽고 수정안을 제안할 수 있다는 이유만으로 모델을 시장에서 철수시킬 수 있다면, 차단 기준은 곧 거의 모든 최첨단 모델로 확대될 수 있다. 반대로 국가가 너무 높은 증거 수준을 요구한다면, 대응은 너무 늦어진다. 바로 이 중간 지점에 대해서는 아직 공개된 명확한 원칙이 없다.

따라서 Fable 5 사안은 Anthropic만의 시험대가 아니다. 이는 최첨단 모델의 정치적 규칙을 예고한다. 즉, 전 세계에 판매되지만 주권적 회수권이 적용되는 제품, 민간 인프라이지만 전략 자산으로 취급되는 서비스, 소프트웨어 도구이지만 export control과 국가 안보 논리로 통치되는 체계가 그것이다.

향후 몇 주간 어떤 기준이 적용될지가 결정적이다. 보편적이지도 않고, 다른 곳에서도 이미 가능한 수준과 유사한 제한적 jailbreak만으로 전면 차단이 정당화된다면, frontier 모델 출시는 조건부·가변적·지정학적으로 필터링되는 새로운 시대로 들어서게 된다. 반대로 이번 사안이 과도한 신중함이나 행정적 오해로 정리된다면, 하나는 분명해질 것이다. 가장 진보한 모델 접근은 더 이상 시장의 문제만이 아니라는 점이다. 이제 그것은 권력의 속성이다.

Stephane Nachez

ActuIA 편집부 — 의사결정자를 위한 인공지능 뉴스, 데이터, 분석.