Claude Opus 4.8: Anthropic, 자신의 오류를 정직하게 인정하는 모델에 중점

2026년 5월 28일에 발표된 Claude Opus 4.8에 대한 Anthropic의 개선 사항은 하나의 측정 지표에 중점을 두고 있습니다. 이 모델은 이전 버전보다 코드 결함을 보고 없이 통과시킬 가능성이 4배 낮다고 편집자는 주장합니다. 이 수치는 자체 보고된 것으로, 내부 Alignment 팀에 의해 생성되었으며 공개되지 않은 프로토콜에 기반합니다. 모델은 claude-opus-4-8이라는 식별자를 통해 API 및 claude.ai에서 즉시 사용할 수 있으며, Opus 4.7과 동일한 요금이 적용됩니다(입력 시 백만 토큰당 5달러, 출력 시 백만 토큰당 25달러). Opus 4.8의 '빠른 모드'는 표준 모드보다 2.5배 빠르게 작동하며, 입력 시 백만 토큰당 10달러, 출력 시 백만 토큰당 50달러로, 공식 발표에 따르면 이전 Opus 모델의 빠른 모드보다 3배 저렴합니다.

Claude Opus 4.8 - API 출시 요금 (2026년 5월 28일)

모드	입력 ($/M tokens)	출력 ($/M tokens)	비고
표준	5 $	25 $	Opus 4.7과 변경 없음
빠른 모드 (2.5×)	10 $	50 $	이전 빠른 모드보다 3배 저렴함

출처: 공식 발표 Anthropic, anthropic.com/news/claude-opus-4-8

세 가지 운영 레버가 출시를 지원합니다

모델 외에도 세 가지 기능이 Opus 4.8을 에이전트 작업 환경에 통합하는 방식을 변경합니다(다단계 작업을 자율적으로 조정하도록 설계됨). 첫 번째 기능은 'dynamic workflows'로, 개발자 사전 엑세스(research preview)로 배포되어 Claude Code를 대규모 프로젝트로 확장합니다: 에이전트는 작업을 계획하고, 여러 수백 개의 하위 에이전트를 동일 세션에서 병렬로 실행하며, 결과를 반환하기 전에 출력을 확인합니다. Anthropic은 사용 사례로 수백만 줄의 코드 기반을 기존 테스트 세트를 참조하여 실행에서 병합까지의 마이그레이션을 제시합니다. 이 기능은 Claude Code의 Enterprise, Team 및 Max 플랜에만 제공됩니다. 두 번째 기능은 'effort control'로, claude.ai의 모델 선택기 옆에 'low', 'default', 'extra', 'max'의 네 가지 수준의 슬라이더를 추가하여 모든 구독 플랜에서 접근할 수 있습니다. Anthropic은 무거운 작업과 장기 비동기 흐름에 대해 'extra' 설정을 권장합니다. 세 번째 기능은 Messages API 측면에서 작업 중인 messages 테이블 내에 시스템 입력 삽입을 허용하여, 프롬프트 캐시를 중단하거나 사용자 라운드를 거치지 않고 실행 중인 에이전트의 권한, 토큰 예산 또는 환경 컨텍스트를 실시간으로 업데이트할 수 있습니다.

산업적 이정표로 설정된 메타인지 측정 지표

보고되지 않은 결함에 대한 4배의 수치는 발표의 가장 구조적인 요소이며, 구매자에게는 다루기 가장 까다로운 부분입니다. 이 측정 지표는 발표 당일 공개된 모델의 안전성 카드(System Card)에 문서화되어 있지만, 제3자 평가자가 아닌 Anthropic의 Alignment 팀에 의해 생성되었으며, 편집자 환경 외부에서는 재현할 수 없는 프로토콜입니다. 동일한 팀에 따르면, Opus 4.8은 Opus 4.7보다 부정확하거나 남용에 협력하는 등 비정렬 행동의 비율이 상당히 낮으며, 가장 잘 정렬된 모델인 Claude Mythos Preview에 근접합니다. 측정 지표가 기록하는 것은 사실 그 자체가 아니라, 평가 축의 이동입니다: Anthropic은 이제 에이전트 모델을 평가하는 중심 기준으로 모델의 메타인지(자신이 할 수 없는 것을 알고, 자신의 생성물에 대한 불확실성을 보고하는 것)를 제안합니다. 이 부분이 더 나아가는데 부족한 요소입니다: 편집자는 보고되지 않은 결함의 계산 공식, 테스트된 코드의 생성 프로토콜, 또는 방해 조건을 공개하지 않습니다. 그러나 2026년 2월 9일 Aithos AI Research Foundation의 연구 노트에 발표된 독립 연구는 Anthropic의 평가 시나리오를 복제하며, '게시된 테스트 시나리오는 최신 Claude 모델의 거의 완벽한 정렬을 보여주지만, 방해는 지속적인 준수 격차를 드러낸다'고 보여주었습니다. 이 관찰은 Opus 4.6을 대상으로 했으며, 4배 측정 지표가 단독으로 대응하기에는 무장되지 않은 시나리오를 묘사합니다.

"게시된 테스트 시나리오는 최신 Claude 모델의 거의 완벽한 정렬을 보여주지만, 방해는 지속적인 준수 격차를 드러낸다."

Aithos AI Research Foundation - Daan Henselmans, Arno Libert, Lennard Zwart (2026년 2월, 영어에서 번역). Opus 4.6을 대상으로 한 연구; 저자들은 아직 Opus 4.8을 평가하지 않았습니다.

Mythos 단절 전의 제품군 이정표

Opus 4.8은 Claude 패밀리의 빠른 반복 주기 내에 위치합니다: ActuIA는 이미 2025년 5월 Claude Opus 4의 출시를 코드 및 에이전트 자동화 중심 세대로 문서화했으며, 그 후 Claude Sonnet 4.5가 프로그래밍 축을 따라 계속되었습니다. 편집자는 이를 Opus 4.7에 대한 '작지만 명백한 개선'으로 제시하며, 상위 클래스의 도착을 예고합니다. 이 클래스는 Claude Mythos Preview로, Project Glasswing의 일환으로 제한된 액세스를 통해 배포되었습니다(2026년 4월 출범한 방어적 사이버 보안 이니셔티브). 한 달 동안 Anthropic과 '약 50개 파트너'는 AWS, Apple, Cisco, Google, Microsoft 및 NVIDIA를 포함하여, Mythos Preview를 통해 높은 또는 치명적인 심각도의 취약점을 만 개 이상 식별했다고 발표했습니다. Mythos의 대중 공개는 '몇 주 내'에 발표될 예정이며, 강화된 보호 장치의 배포에 따라 결정됩니다. Opus 4.8의 성능 읽기는 현재 두 번째 필터에 의존합니다: Anthropic이 공개한 열 개의 수치적 증언 중, 학술적 공개 벤치마크에 의존하는 유일한 것은 Induced AI의 것으로, Online-Mind2Web에서 84%를 발표했습니다. 이 벤치마크는 오하이오 주립대학의 OSU-NLP-Group에 의해 MIT 라이선스로 유지되고 있으며, 참조 논문 제목은 'An Illusion of Progress? Assessing the Current State of Web Agents'로, 학술 저자들이 웹 에이전트의 성공적인 점수에 대해 신중하게 다룰 것을 제안하는 편집적 선택입니다. 기타 주장되는 성능(Super-Agent Benchmark of Relevance AI, Legal Agent Benchmark of Harvey, CursorBench of Cursor)은 공개되지 않은 독점 프로토콜에 기반합니다.

Stephane Nachez

ActuIA 편집부 — 의사결정자를 위한 인공지능 뉴스, 데이터, 분석.

Claude Opus 4.8: Anthropic, 자신의 오류를 정직하게 인정하는 모델에 중점

세 가지 운영 레버가 출시를 지원합니다

산업적 이정표로 설정된 메타인지 측정 지표

Mythos 단절 전의 제품군 이정표

Anthropic, 미국 정부 지침에 따라 Fable 5와 Mythos 5를 중단하도록 강제돼

Siri AI: Gemini는 엔진이 아니라 교수다 - WWDC가 말하지 않은 것

같은 모델, 다른 안전장치: Claude Fable 5와 Mythos 5 출시가 보여주는 것