🤖
1300 in / 5106 out / 6406 total tokens
🔥 핫 토픽
Qwen3.6-35B-A3B 오픈소스 공개
알리바바의 Qwen 팀이 Qwen3.6-35B-A3B를 Apache 2.0 라이선스로 공개했다. Sparse MoE(Mixture of Experts) 아키텍처 기반이며, 총 파라미터는 35B지만 실제 추론 시 활성화되는 파라미터는 3B에 불과하다. 핵심은 "활성 파라미터 3B로 30B 급 모델과 맞먹는 성능"을 보여준다는 점이다. 특히 에이전틱 코딩(Agentic Coding) 성능이 활성 파라미터 기준 10배 크기 모델들과 동등한 수준이라고 한다.
이게 왜 중요한가. 게임 개발 관점에서 보면, 로컬 환경에서 돌릴 수 있는 경량 모델이 생산성 도구로 실용적인 수준에 도달했다는 뜻이다. UE5 C++ 프로젝트에서 코드 어시스턴트를 돌릴 때, 3B 활성 파라미터면 RTX 4090 정도면 실시간으로 추론이 가능하다. MoE 구조의 핵심은 "상황에 맞는 전문가(Expert)만 선택적으로 활성화"하는 것인데, 이게 게임 엔진의 LOD(Level of Detail) 시스템과 닮아 있다. 카메라 거리에 따라 메시 디테일을 조절하듯, MoE는 입력 토큰에 따라 활성 파라미터를 조절한다.
Apache 2.0 라이선스라 상업적 사용도 자유롭다. 사이드 프로젝트로 AI 에이전트를 만들 때, 이 모델을 베이스로 파인튜닝해서 특정 도메인(예: 언리얼 엔진 코드베이스)에 특화시키는 것도 현실적인 선택지가 됐다. 다만 MoE 모델의 단점은 VRAM 사용량이다. 총 파라미터 35B를 메모리에 올려야 하니, 실제 필요한 VRAM은 3B 모델보다 훨씬 크다. 이건 게임 개발에서 텍스처 스트리밍과 비슷한 트레이드오프다. "디스크에는 다 가지고 있지만, 실제로는 일부만 GPU에 올린다"는 접근이 필요하다.
출처: Reddit r/LocalLLaMA - Qwen3.6-35B-A3B released!
Claude Opus 4.7 발표
Anthropic이 Claude Opus 4.7을 발표했다. 구체적인 벤치마크 수치나 기능 변화는 아직 상세히 공개되지 않았지만, Opus 라인업의 최신 버전이라는 점에서 주목할 만하다.
Claude Opus 시리즈는 Anthropic의 최고급 모델 라인업이다. GPT-4o, Gemini Ultra와 경쟁하는 포지션이며, 특히 코딩과 복잡한 추론 작업에서 강점을 보여왔다. Opus 4.7이 의미 있는 이유는, 앞서 언급한 Qwen3.6 같은 오픈소스 모델들의 약진과 맞물려 클로즈드 소스 모델의 대응을 보여준다는 점이다. 경쟁이 치열해질수록 결국 개발자가 이득이다.
실무 관점에서 Claude Opus는 대규모 코드베이스 분석에 강하다. UE5 프로젝트 같은 경우 소스 파일이 수천 개인데, 컨텍스트 윈도우가 넓은 모델이 유리하다. Opus 4.7이 이 부분에서 개선이 있었다면, 엔진 코드 분석이나 디버깅 워크플로우에 직접적인 영향을 줄 수 있다. 다만 가격이 문제다. Opus 급 모델은 API 호출 비용이 상당하니, 일상적인 코딩 보조용으로는 앞서 말한 Qwen3.6 같은 로컬 모델을 쓰고, 복잡한 아키텍처 설계나 난이도 높은 버그 분석에만 Opus를 쓰는 식의 하이브리드 접근이 현실적이다.
출처: Anthropic News - Introducing Claude Opus 4.7
💭 개발자 코멘트
오늘 두 뉴스를 나란히 보면 흥미로운 대조가 보인다. 한쪽은 "3B 활성 파라미터로 30B 급 성능을 내는 오픈소스 모델"이고, 다른 한쪽은 "최고 성능을 지향하는 클로즈드 소스 모델"이다. 이건 게임 엔진 시장의 양극화와 비슷하다. Unreal Engine(풀 피처, 무거움)과 Godot(경량, 오픈소스)가 공존하듯, AI 모델도 "성능 극대화"와 "효율 극대화" 두 방향으로 진화하고 있다.
개인적으로는 Qwen3.6이 더 흥미롭다. MoE 아키텍처가 게임 서버 아키텍처의 마이크로서비스와 닮아 있어서 그런지, 설계 철학이 와닿는다. "모든 요청에 모든 서비스를 돌리지 않고, 필요한 서비스만 활성화한다"는 건 게임 서버나 AI 추론이나 같은 문제다.
"3B로 30B를 이기는 건 최적화의 미학이다. 게임 개발에서도 60fps를 지키면서 비주얼 퀄리티를 올리는 게 진짜 실력이니까."