Models
★★★
Gemma 4: Byte for byte, the most capable open models
Google이 2B·4B·26B MoE·31B Dense 4가지 크기의 오픈소스 AI 모델 Gemma 4를 출시했다. 31B 모델은 Arena AI 오픈 모델 리더보드에서 3위를 기록하며 256K 토큰 컨텍스트, 140개 이상 언어, 멀티모달(이미지·비디오·오디오) 입력을 지원한다. Apache 2.0 라이선스로 Google AI Studio, Hugging Face, Kaggle, Ollama에서 제공된다.
★★★
Microsoft takes on AI rivals with three new foundational models
Microsoft가 MAI-Transcribe-1(25개 언어 음성 인식), MAI-Voice-1(1초 만에 60초 오디오 생성), MAI-Image-2(이미지 생성, Arena.ai 리더보드 3위) 등 자체 AI 모델 3종을 발표했다. OpenAI·Google 대비 저렴한 가격으로 Microsoft Foundry를 통해 제공되며, WPP 등 광고주들이 MAI-Image-2를 광고 제작에 채택했다. MAI Playground를 통해 즉시 테스트할 수 있다.
★★
Netflix AI Team Open-Sources VOID: AI Model That Erases Objects From Videos — Physics and All
Netflix AI팀이 영상에서 오브젝트를 제거하면서 그림자·반사·파편 등 물리적 후속 효과까지 재생성하는 AI 모델 VOID를 오픈소스로 공개했다. CogVideoX 기반이며 Runway 유료 서비스 대비 인간 선호도 테스트에서 64.8% 우위를 기록했다. Hugging Face에서 모델 가중치를 내려받을 수 있다.
★★
World Labs releases world model Marble 1.1 with enhanced world generation
Fei-Fei Li 창업의 World Labs가 Marble 1.1 및 Marble 1.1 Plus를 출시했다. Plus 버전은 3D 생성 캔버스를 고정 경계 너머로 자동 확장하는 다이나믹 스페이스 확장 기능을 도입해 ‘3D 버전 아웃페인팅’으로 불린다. Autodesk 등으로부터 총 10억 달러 투자를 유치했으며 AR/VR·로보틱스 분야를 타겟으로 한다.