2026년 5월 28일, Anthropic이 Claude Opus 4.8을 공개했습니다. 지난 4월에 나온 Opus 4.7의 후속 버전인데요, 완전히 새로운 세대라기보다는 "기존 모델을 더 똑똑하고 믿을 만하게 다듬은 업그레이드"에 가까워요. 가격은 그대로 두면서 성능만 끌어올린 게 핵심이고, 개발자가 아니어도 체감할 수 있는 변화가 꽤 있습니다. Anthropic 공식 발표를 바탕으로, 전문 용어를 걷어내고 정리해봤어요.
한 줄 요약부터
코딩도 더 잘하고, 거짓말(?)도 덜 하고, 긴 작업도 끝까지 해내는 더 듬직한 AI가 됐습니다. 같은 가격에요.
가장 큰 변화: "솔직해진" AI
이번 업데이트에서 Anthropic이 가장 강조하는 부분은 의외로 성능 수치가 아니라 정직함(honesty)이에요.
AI를 써보신 분들은 한 번쯤 겪어봤을 겁니다. AI가 "네, 다 끝냈습니다!"라고 자신 있게 말했는데 막상 확인해보면 엉뚱하게 해놨거나, 코드에 오류가 있는데도 멀쩡하다고 우기는 상황. 근거도 부족하면서 성급하게 "다 됐다"고 결론 내리는 건 AI의 꽤 고질적인 문제였죠.
Opus 4.8은 이 부분이 눈에 띄게 나아졌습니다. 확실하지 않은 부분은 "이건 좀 불확실하다"고 솔직히 짚어주고, 근거 없는 주장을 덜 해요. Anthropic의 자체 평가에 따르면, 자기가 짠 코드에 결함이 있는데 그냥 넘어가는 비율이 이전 모델 대비 약 4배 낮아졌다고 합니다. 쉽게 말해 "일을 대충 해놓고 잘했다고 둘러대는" 경우가 크게 줄어든 거예요.
정렬(alignment) 평가에서도 사용자 자율성 존중, 사용자 이익 우선 같은 친사회적 지표가 역대 최고치를 기록했고, 기만이나 오용 협력 같은 부정적 행동은 Opus 4.7보다 크게 낮아져서 Anthropic이 가장 잘 정렬됐다고 평가하는 Claude Mythos Preview 수준에 근접했다고 합니다.
코딩·에이전트·실무 전반이 좋아졌다
코딩, 복잡한 다단계 작업, 추론, 실무형 업무(문서·자료 작성 등) 전반에서 벤치마크 성능이 올라갔어요. 특히 눈에 띄는 건 '끈기'입니다.
긴 작업을 중간에 흐지부지 끝내지 않고 일관되게 마무리하는 능력이 향상됐고, 계획이 잘못됐다 싶으면 그냥 따르지 않고 "이 방향은 좀 아닌 것 같은데요"라고 의견을 내기도 해요. 큰 변경을 하기 전에 충분히 살펴본 뒤 진행하고, 자기 실수도 스스로 잡아냅니다. 이전 버전(4.7)에서 지적되던 '주석을 너무 길게 다는 버릇'이나 도구를 비효율적으로 쓰던 문제도 손봤다고 하네요.
AI 개발 도구 Devin을 만드는 Cognition의 평가가 인상적이에요. "Opus 4.6에서 개선됐고, Opus 4.7에서 있던 주석 과다와 도구 호출 비효율 문제를 고쳤다"는 평입니다. Cursor 벤치마크에서는 모든 노력(effort) 수준에서 이전 Opus 모델을 넘어섰고, 같은 지능 수준에서 더 적은 단계로 작업을 완료한다고 합니다.
함께 나온 새 기능 3가지
모델만 업데이트된 게 아니라, 편의 기능도 같이 추가됐어요.
① 노력(Effort) 조절 — 일반 사용자에게 가장 와닿는 변화입니다. claude.ai와 Cowork에서 "Claude가 답변에 얼마나 공을 들일지"를 직접 고를 수 있게 됐어요. 높게 설정하면 더 깊이 고민해서 좋은 답을 주고, 낮게 설정하면 빠르게 답하면서 사용 한도도 천천히 소모합니다. 급하게 간단한 답이 필요할 땐 낮게, 어려운 문제엔 높게. 모든 요금제에서 쓸 수 있어요. 참고로 Opus 4.8의 기본값은 'high'이고, 어려운 작업이나 비동기 장시간 워크플로우에는 'extra(Claude Code에서는 xhigh)'를 권장합니다.
② 다이내믹 워크플로우(Dynamic Workflows) — 개발자용 도구인 Claude Code에서 아주 큰 규모의 작업을 한 번에 처리하는 기능이에요. Claude가 직접 일을 잘게 쪼개 수백 개의 하위 에이전트를 동시에 돌리고, 결과를 검증한 뒤 보고합니다. 수십만 줄짜리 코드베이스 전체를 마이그레이션하는 작업도 기존 테스트 스위트를 기준으로 착수부터 머지까지 가능하다고 해요. 현재 연구 프리뷰 단계이고, Enterprise·Team·Max 요금제에서 이용 가능합니다.
③ 메시지 배열 내 시스템 항목 지원(개발자용) — Messages API에서 시스템 지시를 대화 중간에 삽입할 수 있게 됐어요. 프롬프트 캐시를 깨뜨리지 않고 에이전트 실행 중 권한, 토큰 예산, 환경 컨텍스트를 업데이트할 수 있습니다.
그리고 하나 더. 2.5배 빠르게 답하는 fast mode가 이전보다 3배 저렴해졌어요. fast mode 가격은 입력 100만 토큰당 10달러, 출력 100만 토큰당 50달러입니다.
가격은 그대로, 어디서 쓸 수 있나
가격은 Opus 4.7과 동일합니다.
| 항목 | 가격 |
|---|---|
| 일반 모드 입력 | 100만 토큰당 $5 |
| 일반 모드 출력 | 100만 토큰당 $25 |
| Fast 모드 입력 | 100만 토큰당 $10 |
| Fast 모드 출력 | 100만 토큰당 $50 |
| 프롬프트 캐싱 | 최대 90% 절감 |
| 배치 처리 | 50% 절감 |
일반 사용자는 Pro, Max, Team, Enterprise 요금제에서 바로 쓸 수 있고, 개발자는 API에서 claude-opus-4-8로 호출하면 됩니다. AWS, Google Cloud, Microsoft Foundry에서도 사용 가능해요. 미국 내에서만 추론을 실행해야 하는 워크로드는 1.1배 가격으로 US-only 추론도 지원합니다.
앞으로는 어떻게 되나
Anthropic은 두 가지 방향을 동시에 밝혔어요.
Opus급 성능을 더 저렴하게 제공하는 모델을 개발 중이라는 것, 그리고 Opus를 넘어서는 새로운 등급의 모델도 준비하고 있다는 것. 'Mythos'라는 이름의 차세대 모델이 Project Glasswing의 일환으로 소수 조직에서 사이버보안 용도로 시험 중인데, 워낙 강력하다 보니 사이버 보안 안전장치를 더 갖춘 뒤 "앞으로 몇 주 안에" 일반 공개를 목표로 하고 있다고 합니다.
같은 날 발표된 다른 소식도 있어요. Anthropic이 Series H 라운드에서 650억 달러를 조달했고, 기업 가치는 9,650억 달러(약 1,300조 원)를 기록했습니다. 밀라노에 유럽 6번째 사무실을 열었고, 서울 사무실 개설을 앞두고 한국 법인 대표도 선임했어요.
정리하면
Claude Opus 4.8은 화려한 신기능보다 "믿고 맡길 수 있는 AI"라는 방향에 집중한 업데이트예요. 솔직해지고, 끈기 있어지고, 사용자가 속도와 깊이를 직접 고를 수 있게 됐죠. 평소 Claude를 쓰던 분이라면 같은 가격에 조용히 좋아진 경험을 하게 될 겁니다. 더 자세한 AI 트렌드 분석은 휴미즈에서 확인하세요.
이 글은 AI 트렌드 전문 기업 휴미즈가 Anthropic 공식 릴리즈 노트(2026년 5월 28일)를 바탕으로 작성했습니다.


댓글
댓글 쓰기