AI 업데이트: Claude Code 유출과 Computer Use 경쟁

🤖 1305 in / 4814 out / 6119 total tokens

🔥 핫 토픽

Claude Code 소스 코드 유출 — 멀티 에이전트 오케스트레이션 시스템이 공개되다

Anthropic의 Claude Code 소스 코드가 소스 맵(Source Map) 노출로 인해 유출되었다. 무려 50만 줄 이상의 TypeScript 코드가 고스란히 드러났는데, 여기에는 쿼리 엔진, 툴 시스템, 코디네이터 모드, 팀 관리 로직까지 포함되어 있다. 더 흥미로운 건 누군가가 이 코드에서 핵심인 멀티 에이전트 오케스트레이션 시스템을 추출해서 어떤 LLM에서도 작동하는 오픈소스 프레임워크로 만들었다는 점이다.

이 사건이 업계에서 큰 파장을 일으키는 이유는 Claude Code가 현재 가장 강력한 터미널 기반 코딩 어시스턴트로 평가받기 때문이다. Cursor나 GitHub Copilot과 경쟁하는 이 도구는 단순한 코드 완성을 넘어 복잡한 리팩토링, 멀티파일 수정, 프로젝트 전체 이해를 수행한다. 그런데 그 핵심 아키텍처가 고스란히 공개된 셈이다. 경쟁사 입장에선 불공정한 경쟁이 될 수도 있지만, 오픈소스 커뮤니티와 개발자들에겐 보물 같은 학습 자료가 떨어진 것이다.

개발자 관점에서 보면 멀티 에이전트 시스템의 실제 구현을 들여다볼 수 있다는 게 가장 큰 수확이다. 단일 LLM 호출로 복잡한 작업을 처리하려면 컨텍스트 길이 제한, 할루시네이션, 일관성 유지 등의 문제에 부딪힌다. 그래서 최근엔 여러 에이전트가 협업하는 구조가 대안으로 떠오르고 있다. Claude Code는 코디네이터가 전체 작업을 계획하고, 각 전문 에이전트에게 서브태스크를 분배하고, 결과를 취합하는 방식을 사용하는 것으로 보인다. 이런 패턴은 게임 개발에서도 충분히 응용 가능하다. 예를 들어 퀘스트 시스템에서 메인 퀘스트 매니저가 서브 퀘스트들을 여러 서브시스템에 분배하고 결과를 수합하는 구조와 유사하다.

소스 맵이 어떻게 이런 참사를 초래했는지도 주목할 만하다. 프로덕션 빌드에서 보통 소스 맵은 제거하거나 난독화하는 게 정석이다. 하지만 디버깅 편의성 때문에 실수로 남겨두는 경우가 종종 있다. 이번 사건은 대기업조차 보안 설정에 구멍이 있을 수 있다는 걸 보여준다. UE5 개발할 때도 Shipping 빌드에 디버그 심볼이 포함되는 실수를 종종 하곤 하는데, 성격이 비슷하다. 어쨌든 이 오픈소스 프레임워크를 직접 돌려보면 Claude Code가 어떤 식으로 에이전트 간 통신을 처리하고, 컨텍스트를 어떻게 관리하며, 툴 체이닝을 구현했는지 직접 확인할 수 있다. 내 사이드 프로젝트에도 바로 적용해볼 생각이다.

출처: Reddit r/LocalLLaMA

📰 뉴스

Holo3: Computer Use 프론티어를 돌파하다

HuggingFace가 Holo3라는 새로운 Computer Use 모델을 발표했다. Computer Use는 AI가 인간처럼 컴퓨터를 직접 조작하는 능력을 말한다. 마우스를 클릭하고, 키보드를 입력하고, 화면을 읽고 해석해서 원하는 작업을 수행하는 것이다. Holo3는 이 분야에서 새로운 SOTA(State-of-the-Art)를 달성했다고 주장한다.

Computer Use가 왜 중요하냐면, 이것이 AI 에이전트의 궁극적인 목표 중 하나이기 때문이다. 지금까지의 AI는 텍스트를 입력받아 텍스트를 출력하거나, 이미지를 생성하는 수준이었다. 하지만 Computer Use가 완성되면 AI는 실제로 컴퓨터에서 작동하는 어떤 소프트웨어든 사용할 수 있다. 엑셀로 데이터를 정리하고, 브라우저로 쇼핑을 하고, 개발 툴로 코드를 작성하는 등 인간이 컴퓨터로 하는 모든 일을 AI가 대신할 수 있게 되는 것이다. 현재 Anthropic의 Claude Computer Use, OpenAI의 Operator가 이 분야를 선도하고 있고, 이제 HuggingFace가 오픈소스 진영의 대항마로 나선 셈이다.

기술적으로 Computer Use는 꽤 복잡한 문제다. 우선 스크린샷을 입력으로 받아서 현재 화면 상태를 이해해야 한다. 버튼이 어디 있는지, 텍스트 필드가 어떤 역할을 하는지, 현재 어떤 앱이 실행 중인지 파악해야 한다. 그 다음 어떤 액션을 취할지 결정해야 한다. 마우스 클릭이라면 정확한 좌표를 예측해야 하고, 키보드 입력이라면 어떤 텍스트를 입력할지 결정해야 한다. 그리고 액션 수행 후 변화된 화면을 다시 인식하고, 다음 액션을 결정하는 루프가 계속된다. 이건 게임 개발에서 말하는 게임 루프와 비슷한 구조다. 매 프레임 입력을 받아 상태를 갱신하고 렌더링하는 것처럼, Computer Use도 화면을 인식하고 액션을 수행하는 루프를 돈다.

HuggingFace가 이 기술을 오픈소스로 푼다는 건 개발자들에게 큰 기회다. Claude Computer Use나 Operator는 API로만 접근할 수 있고 비용도 비싸다. 하지만 Holo3는 로컬에서 돌릴 수 있고, 커스터마이징도 가능하다. 게임 개발자 입장에서 생각해보면, Computer Use 기술을 게임 테스트 자동화에 활용할 수 있다. QA 팀이 직접 플레이하지 않아도 AI가 게임을 플레이하면서 버그를 찾거나, 밸런스 데이터를 수집할 수 있다. 또 NPC AI를 만들 때도 참고가 된다. NPC가 환경을 인식하고 의사결정을 내리는 과정을 Computer Use 모델의 추론 방식에서 영감을 받을 수 있다. 물론 실시간 게임에서 LLM을 직접 돌리는 건 레이턴시 문제가 있지만, 오프라인에서 학습 데이터를 생성하거나 메타 게임플레이 분석에는 충분히 활용 가능하다.

이번 발표는 앞서 언급한 Claude Code 유출 사건과도 맥락이 닿아 있다. Claude Code도 결국 터미널이라는 컴퓨터 환경을 조작하는 일종의 Computer Use 시스템이다. 명령어를 실행하고, 파일을 읽고, 코드를 수정하는 과정은 Computer Use의 한 형태다. Holo3와 Claude Code의 접근 방식을 비교해보면, 전자는 시각적 인터페이스를, 후자는 텍스트 기반 인터페이스를 다룬다는 차이가 있다. 하지만 근본적으로는 같은 목표를 향해 가고 있다. AI가 인간의 도구를 인간처럼 사용하는 것. 그리고 그 방법론이 점점 공개되고 있다는 게 작성자 같은 개발자에겐 반가운 소식이다.

출처: HuggingFace Blog

AI가 우리 도구를 우리처럼 쓰기 시작했다. 이제 남은 건 우리가 AI를 어떻게 쓸지 정하는 일이다.

Claude Code Multi-Agent Computer Use HuggingFace Open Source Source Map AI Agent