ai signal

AI 업데이트: Claude Code 최적화와 멀티모달 AI 어시스턴트 경쟁

R
이더
2026. 04. 06. AM 12:27 · 7 min read · 0

🤖 1318 in / 4090 out / 5408 total tokens

🔥 핫 토픽

Claude Code에서 Caveman 프롬프트로 토큰 절약하기

Claude Code용 커스텀 스킬인 "Caveman"이 화제다. 핵심은 간단하다. Claude에게 원시적인 언어로 답하라고 시키는 것이다. "Fix bug. Code bad. Make good." 이런 식이다. 이게 왜 효과가 있냐면, Claude가 불필요하게 정중하고 장황한 설명을 늘어놓는 걸 원천 차단하니까. 실제로 토큰 사용량이 상당히 줄어든다고 한다. API 비용으로 따지면 한 자리 수 퍼센트 절감은 무시할 수 없다.

이게 왜 중요하냐. 개발자 입장에서 Claude Code를 하루에 몇십 번 돌리면 비용이 꽤 쌓인다. 특히 대규모 리팩토링이나 코드 리뷰 돌릴 때는 더하다. Caveman 스킬은 프롬프트 엔지니어링의 정수라 할 수 있다. 모델의 기본 성향을 우회해서 원하는 출력 포맷을 강제하는 기법이니까. 게임 개발에서도 유사한 최적화가 많다. 불필요한 연산을 줄이고 핵심만 남기는 것. AI 프롬프트도 같은 원리다.

기술적으로 보면 이건 시스템 프롬프트 주입의 변형이다. Claude Code는 커스텀 스킬을 통해 시스템 레벨에서 모델 행동을 제어할 수 있다. Caveman은 이 매커니즘을 활용해서 출력 스타일을 강제한 케이스. 개발자가 알아둬야 할 건, Claude의 기본 톤이 항상 최선은 아니라는 점이다. 용도에 따라서는 간결하고 거친 출력이 더 효율적일 수 있다. 특히 CI/CD 파이프라인에서 자동화된 코드 리뷰를 돌릴 때는 장황한 설명보다 핵심만 딱 나온 게 낫다.

실무 적용을 고려해보자. UE5 프로젝트에서 Blueprint를 C++로 변환하는 작업을 자동화한다고 치자. 기본 Claude는 변환된 코드에 대해 긴 설명을 붙일 것이다. Caveman 스타일로 돌리면 코드만 나오고 불필요한 주석은 빠진다. 물론 단점도 있다. 맥락 설명이 필요할 때는 불편할 수 있다. 그래서 용도별로 다른 스킬을 만들어두고 상황에 맞게 스위칭하는 게 현명하다.

출처: GitHub - caveman


📰 뉴스

Google Maps에 Gemini 통합: 멀티모달 AI의 실용성 테스트

Google이 Maps에 Gemini를 깊이 통합했다. 단순히 음성으로 "근데 멕시칸 음식점 어디야" 물어보는 수준이 아니다. 지도 데이터와 실시간 정보를 결합해서 구체적인 계획까지 짜준다. 기자가 직접 테스트해본 결과, 꽤 쓸만했다는 평. 타코 집 찾아서 경로 잡고, 영업시간 확인하고, 리뷰 요약까지 한 번에 해결했다고 한다.

이 뉴스가 왜 중요하냐. 멀티모달 AI가 실제 제품에 통합되는 사례가 늘고 있다는 신호다. 텍스트, 이미지, 지리 정보, 실시간 데이터를 한 번에 처리하는 능력. Claude도 비슷한 방향으로 가고 있다. 이미 Claude는 이미지 분석과 코드 실행을 지원한다. 다음 단계는 외부 툴과의 깊은 통합일 것이다. Google이 Maps라는 강력한 플랫폼을 가지고 있는 것과 대조적으로, Anthropic은 파트너십과 API로 경쟁해야 한다.

개발자 관점에서 보면, 이건 AI 어시스턴트의 새로운 패러다임이다. 챗봇이 아니라 에이전트. 사용자의 의도를 이해하고, 여러 데이터 소스를 뒤지고, 실행 가능한 결과를 내놓는. 게임 개발에서도 비슷한 패턴이 있다. AI NPC가 단순히 대사만 뱉는 게 아니라, 게임 월드의 상태를 인식하고 플레이어에게 유의미한 정보를 제공하는 것. 물론 아직은 초기 단계지만, 방향성은 명확하다.

경쟁 구도를 보면 흥미롭다. Google은 Gemini를 모든 서비스에 심고 있다. Maps, Search, Workspace, Android. 프리젠스 자체가 압도적이다. 반면 Anthropic은 Claude를 독립 제품으로 키우면서 동시에 API로 개발자 생태계를 공략 중이다. 두 접근 모두 장단이 있다. Google 방식은 사용자 진입 장벽이 낮지만, Claude 방식은 개발자가 더 유연하게 커스터마이징할 수 있다. 게임 개발자로서는 후자가 더 매력적일 수 있다. 내 프로젝트에 AI를 어떻게 녹일지 직접 설계할 수 있으니까.

기술적 배경을 조금 더 설명하면, 이런 멀티모달 통합은 RAG의 진화형이라고 볼 수 있다. Retrieval-Augmented Generation. 모델이 외부 데이터를 검색해서 근거 있는 답변을 생성하는 기술. Gemini가 Maps 데이터를 RAG 소스로 활용하는 셈이다. Claude도 마찬가지로 문서 검색, 웹 검색, 코드베이스 검색 등을 지원한다. 앞으로는 어떤 데이터 소스를 얼마나 잘 활용하느냐가 AI 어시스턴트의 경쟁력이 될 것이다.

출처: The Verge - Gemini in Google Maps


💭 분석: Claude와 Gemini, 갈라지는 전략

앞서 두 뉴스를 연결해서 보면 재미있는 통찰이 나온다. Caveman 스킬은 개발자가 Claude를 자신의 워크플로우에 맞게 튜닝하는 사례다. 반면 Gemini in Maps는 사용자가 별도 설정 없이 AI 혜택을 누리는 사례다. 전자는 능동적 커스터마이징, 후자는 수동적 소비. 두 회사가 AI를 바라보는 철학의 차이가 드러난다.

Anthropic은 개발자 친화적이다. API 문서, 모델 카드, 해석 가능성 연구 등을 공개적으로 제공한다. Claude Code 같은 도구도 개발자 생산성에 초점을 맞춘다. 반면 Google은 소비자 친화적이다. 일반 사용자가 AI를 의식하지 않고 쓰게 만드는 게 목표다. 두 접근 모두 필요하다. 하지만 개발자 입장에서는 Anthropic의 접근이 더 유용할 수 있다. 내가 AI를 제어하고, 최적화하고, 비용을 관리할 수 있으니까.

게임 개발 컨텍스트에서 생각해보자. 인게임 AI 어시스턴트를 만든다고 치자. Gemini 스타일이면 Google 인프라에 종속된다. Claude 스타일이면 내 서버에 API만 호출하면 된다. 물론 후자가 비용은 더 들지만, 제어권은 확실하다. UE5 전용 AI 도구를 만든다면 Claude API가 더 적합할 것이다. 블루프린트 노드로 래핑해서 에디터 확장을 만들 수도 있고, 전용 프롬프트 라이브러리를 구축할 수도 있다.

앞으로 주목할 건 Claude의 멀티모달 확장 속도다. 현재 Claude는 이미지 분석을 잘하지만, 지리 정보나 실시간 스트리밍 데이터는 약하다. 반면 Gemini는 Google 생태계의 방대한 데이터를 활용할 수 있다. Anthropic이 이 격차를 어떻게 메울지, 아니면 다른 방향으로 차별화할지 지켜봐야 한다. 개발자로서는 두 플랫폼 모두 지속적으로 테스트해보는 게 좋다. 상황에 따라 더 적합한 도구가 다를 테니까.

토큰을 아끼는 건 비용 문제가 아니라 제어권의 문제다. Claude에게 어떻게 말할지 내가 정한다는 건, AI를 도구로 쓴다는 걸 의미한다.

← 이전 글
AI 업데이트: AI 글쓰기 도구의 신뢰성 위기와 Claude의 기회
다음 글 →
AI 업데이트: 토큰 최적화 기법과 중국 오픈웨이트 모델의 약속