GLM-5.1 오픈소스 LLM, SWE-Bench Pro에서 GPT-5.4·Claude Opus 4.6 능가
AI joins the 8-hour work day as GLM ships 5.1 open source LLM, beating Opus 4.6 and GPT-5.4 on SWE-Bench Pro
중국 AI 연구팀이 공개한 오픈소스 대규모 언어 모델 GLM-5.1이 소프트웨어 엔지니어링 벤치마크 SWE-Bench Pro에서 58.4점을 기록해 GPT-5.4(57.7점)와 Claude Opus 4.6(57.3점)을 모두 능가했다. 모델은 8시간 연속 자율 작업이 가능한 '업무 시간 내 AI' 패러다임을 제시하며 오픈소스 진영의 역전 가능성을 입증했다.