신규 모델

같은 모델, 다른 안전장치: Claude Fable 5와 Mythos 5 출시가 보여주는 것

Anthropic은 Claude Fable 5와 Claude Mythos 5를 같은 기반 모델에 서로 다른 안전장치를 얹은 제품으로 출시했다. 가격 인하, 성능 벤치마크, Project Glasswing, 그리고 AI Act 일정까지 겹치며, 이번 발표는 모델 경쟁을 넘어 ‘접근 통제와 추론 안전장치의 상품화’라는 흐름을 보여준다.

STStephane Nachez · ·3 min
같은 모델, 다른 안전장치: Claude Fable 5와 Mythos 5 출시가 보여주는 것
Sommaire

Anthropic은 2026년 6월 9일 Claude Fable 5와 Claude Mythos 5를 출시했다. Anthropic에 따르면 두 제품은 동일한 기반 모델을 사용하며, 차이는 안전장치에만 있다. Fable 5는 활성화된 안전 분류기를 적용한 일반용 모델이고, Mythos 5는 Project Glasswing을 통해 검증된 제한된 사이버 방어 인력에게만 제공되며 일부 영역에서는 동일한 안전장치가 해제된다. Anthropic이 엔지니어링 블로그에서 설명한 바에 따르면, 이 격리 계층은 가중치와는 별개로 추론 시점에 적용되는 구성 오버레이(configuration overlay applied at inference time, 자유 번역)로, 두 제품을 가르는 상업적 경계가 된다.

따라서 이번 발표의 핵심은 단순히 더 강력한 모델의 출시가 아니다. 모델 가중치, 추론 시 적용되는 설정, 접근 권한 체계가 명확히 분리됐다는 점에 있다. Fable 5와 Mythos 5는 반드시 별도로 학습된 두 모델이어서가 아니라, 노출되는 사용 범위가 다르기 때문에 서로 다른 제품이 된다. 이 구분은 전략적으로 중요하다. Anthropic은 이로써 이른바 “Mythos-class” 역량을 개방하면서도, 특히 Project Glasswing 맥락에서 일부 사용은 검증된 주체에게만 제한할 수 있다.


Anthropic의 발표에 따르면 Fable 5의 가격은 Anthropic API 기준 입력 100만 토큰당 10달러, 출력 100만 토큰당 50달러다. LLMReference(2026년 6월 9일 기준 갱신)에 따르면 Mythos Preview의 가격은 입력 100만 토큰당 25달러였다.

추론 비용 압축이 이어지는 업계 흐름 속에 자리한 가격 인하

DeepSeek은 1년 넘게 미국 프런티어 모델보다 현저히 낮은 가격 정책을 유지해 왔고, OpenAI의 GPT-5는 입력 100만 토큰당 1.25달러, 출력 100만 토큰당 10달러를 책정해 기본 요금 기준으로 Fable 5보다 각각 8배, 5배 저렴하다. LLMReference에 따르면 Mythos Preview의 입력 가격은 100만 토큰당 25달러로, Fable 5의 입력 요금보다 2.5배 높았다. 따라서 Anthropic이 안전장치 적용 작업에 비용을 부과하고 모델 가중치 자체가 아니라 격리 작업을 과금한다는 설명은 경쟁 환경에 따른 설명과 함께 공존한다. 6월 9일 발표는 두 해석 중 어느 쪽도 निर्ण정하지 않았으며, 공식 문구 역시 세부적인 비용 구조에 대해서는 침묵하고 있다.

현장 성능은 입증됐지만, 민감한 결과는 공개 검토에서 제외

Cognition AI가 2026년 6월 8일 공개한 FrontierCode 벤치마크에서 Fable 5는 Cognition AI 기준 순위 1위에 올랐지만, 출시 보도자료에는 정확한 점수가 포함되지 않았다. Cognition AI에 따르면 Claude Opus 4.8은 Fable 5 등장 전 FrontierCode에서 최고 13.5%를 기록했고, SWE-bench 출력의 50% 이상은 여전히 병합 불가능한 상태였다. Cognition은 Devin을 개발하는 회사로, Anthropic이 겨냥하는 코드 에이전트 시장과 직접 맞닿아 있지만 이 점은 출시 발표에서 언급되지 않았다. 고객 사례 측면에서 Stripe는 초기 테스트에서 5천만 줄 규모의 Ruby 코드베이스 마이그레이션이 Fable 5에 의해 하루 만에 수행됐다고 밝혔으며, 이는 전체 팀이 작업할 경우 2개월 이상 걸릴 것으로 추정된다고 전했다. 민감한 분야에서는 Anthropic이 내부 약물 설계 연구에서 14개 단백질 표적 중 9개에서 유망한 후보가 나왔다고 설명했지만, 해당 결과는 동료 검토(peer review)를 거치지 않았다. 또한 Anthropic은 자동 정렬 평가에서 Mythos 5의 잘못 정렬된 행동 수준이 Opus 4.8과 비슷하게 낮지만 0은 아니라고 밝혔다.

Glasswing, 분류기, 그리고 AI Act 일정: 유럽 구매자가 발표문에서 읽는 것

Anthropic이 Mythos 계열의 근거로 가장 자주 제시하는 결과는 Mythos 5 출시보다 앞선다. 2026년 6월 2일 Glasswing 확장 발표에 따르면, AWS, Apple, Cisco, CrowdStrike, Google, Microsoft, NVIDIA, JPMorganChase, Linux Foundation 등을 포함한 초기 50개 파트너는 Mythos Preview를 통해 자사 코드베이스를 스캔하면서 1만 건이 넘는 고위험 또는 치명적 보안 취약점을 발견했다. 따라서 이 취약점들은 2026년 4월부터 개방된 Preview 접근을 통해 확인된 것이며, 이제 막 Glasswing 배포가 시작된 Mythos 5의 결과는 아니다. Fable 5의 경우 Anthropic은 보안 분류기가 평균적으로 전체 세션의 5% 미만에서만 작동하며, 그때 요청을 Opus 4.8로 우회시킨다고 설명한다. 다만 회사는 의도적으로 보수적인 설정을 적용해 무해한 요청까지 차단할 수 있다고 인정한다. 유럽의 구매자에게는 규제 일정도 통합 부담을 다소 완화한다. 2026년 5월 7일 AI Act Omnibus에 대한 잠정 정치 합의에 따라 부속서 III의 고위험 의무는 2027년 12월 2일로 연기됐다. Anthropic이 과금하는 방식대로 안전장치 구성은 이제 모델과 분리해 판매되는 독립 상품이 되고 있다. 반면 현재 Anthropic만 제시하는 지표인, 가로채진 요청의 심각도 수준별 분류기 오탐률은 공개되지 않았다.

ST
Stephane Nachez
subscriber

Rédaction ActuIA — actualités, données et analyses sur l'intelligence artificielle pour les décideurs.