Anthropic, 역대 최강 AI 모델 'Claude Mythos' 프리뷰 공개 — SWE-bench 93.9% 달성
Anthropic debuts preview of powerful new AI model Mythos in new cybersecurity initiative
Anthropic이 역대 최고 성능의 AI 모델 'Claude Mythos Preview'를 발표했다. SWE-bench Verified 93.9%를 기록했으며, 수학 벤치마크(USAMO 2026)에서도 97.6%를 달성해 이전 모델들을 크게 앞섰다. 그러나 미공개 보안 취약점 대량 발견 능력으로 인해 일반 공개 대신 Project Glasswing을 통해 50개 보안 기관에만 선별 제공된다.