AI 업데이트: Gemini 3.5 Flash의 등장과 LLM 에코시스템 변화

🤖 1401 in / 3773 out / 5174 total tokens

오늘 AI 업계는 Google의 Gemini 3.5 Flash 발표로 뜨겁다. 동시에 Anthropic은 프론티어 AI 논의 확대를 발표했고, Simon Willison은 관련 도구들을 연달아 업데이트했다. 하나씩 파보자.

🔥 핫 토픽

Gemini 3.5 Flash - 더 비싸지만, 더 똑똑해진 Google의 차세대 모델

Google이 Gemini 3.5 Flash를 공개했다. 핵심은 성능 대폭 향상이다. 기존 Flash 모델들이 '가성비'에 초점을 맞췄다면, 이번엔 비싸진 대신 진짜 똑똑해졌다. Google이 이 모델로 모든 걸 하겠다는 계획이다.

왜 이게 중요하냐? LLM 시장이 '모델 다변화'에서 '통합'으로 흘러가고 있다. OpenAI가 GPT-4o로 통합하듯, Google도 하나의 모델로 검색, 코딩, 크리에이티브까지 다 커버하겠다는 거다. 게임 개발자 입장에선 API 하나로 NPC 대화, 콘텐츠 생성, 코드 어시스트를 다 처리할 수 있다는 뜻이다. 서버 아키텍처가 단순해진다.

Simon Willison이 지적했듯, 가격이 올랐다는 게 걸린다. Flash라는 이름이 '빠르고 가볍다'는 의미였는데, 이제는 '빠르고 강력하지만 비싸다'가 됐다. 게임 서버에서 LLM을 실시간으로 돌릴 땐 비용이 치명적이다. 토큰당 가격이 2배 오르면, NPC 100명이 동시에 대화할 때 서버비가 어떻게 될지 상상해보라.

하지만 성능 향상은 실질적이다. 멀티모달 처리 능력이 좋아졌고, 컨텍스트 윈도우 활용도 개선됐다. 게임 내에서 플레이어의 행동 히스토리를 분석해서 동적 퀘스트 생성하는 거, 이제 더 잘 된다.

출처: Google Blog

📰 뉴스

Anthropic의 프론티어 AI 논의 확대 - 안전성 vs 개방성의 줄다리기

Anthropic이 프론티어 AI에 대한 대화를 확장하겠다고 발표했다. 연구자, 정책입안자, 일반 대중과 더 넓게 소통하겠다는 거다.

이게 왜 중요하냐. 앞서 언급한 Gemini 3.5 Flash가 나오면서 '빠르고 강력한 AI'의 경쟁이 가속화되고 있다. 그 반대편에서 Anthropic은 '잠깐, 이거 안전한 거 맞아?'라고 묻는 거다. 경쟁 구도가 성능 vs 안전으로 양극화되는 느낌이다.

개발자에게 영향을 주는 부분은 이거다. Anthropic 모델(Claude)을 쓰는 사람들은 더 엄격한 안전 가드레일을 경험할 가능성이 높다. 게임에서 폭력적인 콘텐츠 생성하려고 Claude 쓰면, 거절당할 확률이 더 높아질 수 있다. 반면 Google은 더 개방적으로 갈 거다. 어느 쪽이 개발자 친화적인지는 상황마다 다르다.

기술적 배경을 설명하면, '프론티어 AI'는 현재 기술 수준을 크게 뛰어넘는 능력을 가진 AI 시스템을 의미한다. AGI(범용인공지능)는 아니지만, 특정 분야에서 인간 수준 이상의 능력을 보이는 모델들이다. 이런 모델이 악용되면 사회적 피해가 크다. Anthropic은 이 걸 걱정하는 거다.

출처: Anthropic

⭐ 오픈소스

llm-gemini 0.32 - Simon Willison의 LLM CLI 도구 업데이트

Simon Willison이 llm-gemini 플러그인을 0.32로 업데이트했다. 명령줄에서 Gemini 모델을 쉽게 쓸 수 있게 해주는 도구다.

이게 왜 중요하냐. 개발자가 API 키 설정하고 HTTP 요청 직접 날리는 거, 귀찮다. llm 명령 하나로 Gemini 3.5 Flash를 바로 테스트할 수 있다. 게임 개발하다가 '이 프롬프트가 제대로 작동하나?' 확인할 때 유용하다.

실무 관점에서, 이런 CLI 도구는 프로토타이핑 속도를 크게 높여준다. UE5에서 C++로 AI 시스템 짜기 전에, 터미널에서 프롬프트 테스트하고, 결과 확인하고, 그 다음에 코드로 넘어가면 된다. 디버깅 사이클이 짧아진다.

Simon Willison은 전 Django 코어 개발자다. 파이썬 생태계에서 만든 도구들이 많은데, datasette 같은 걸로 데이터 탐색을 쉽게 할 수 있게 해왔다. llm 시리즈는 그 연장선이다. 데이터 기반 AI 개발에 관심 있다면 그의 블로그를 구독하라.

출처: Simon Willison's Weblog

datasette-llm-accountant 0.1a4 - LLM 사용량 추적 도구

같은 날 Simon Willison이 datasette-llm-accountant 0.1a4도 릴리즈했다. LLM API 사용량과 비용을 추적하는 도구다.

이게 타이밍이 절묘하다. 앞서 Gemini 3.5 Flash가 더 비싸졌다고 했잖아. LLM API 비용 관리가 갈수록 중요해지는 시점에 나온 도구다. 게임 서버에서 LLM 호출할 때마다 비용이 얼마나 나오는지, datasette로 시각화해서 볼 수 있다.

서버 아키텍처 관점에서, 이런 모니터링은 필수다. UE5 전용 서버에 LLM 연동하면, 토큰 사용량이 실시간으로 튄다. 한 명의 플레이어가 NPC랑 10분 대화하면 몇 토큰? 100명이 동시에? 이거 추적 안 하면 서버비 폭탄 맞는다. datasette-llm-accountant는 SQLite 기반이라 게임 서버에 가볍게 붙일 수 있다.

아직 0.1a4니까 알파 버전이다. 프로덕션에 바로 쓰긴 이르지만, 프로토타이핑 단계에서 비용 추적용으로 충분하다.

출처: Simon Willison's Weblog

💭 총평

오늘 뉴스들을 관통하는 키워드는 '비용'이다. Gemini 3.5 Flash는 성능 올렸지만 비용도 올렸다. Simon Willison은 비용 추적 도구를 내놨다. Anthropic은 안전에 대한 사회적 비용을 이야기한다.

LLM이 게임 개발에 진짜로 녹아들려면, 비용 문제부터 해결해야 한다. 서버 사이드에서 실시간으로 LLM 호출하는 건 아직 무겁다. 하지만 도구들은 나오고 있다. llm-gemini로 테스트하고, datasette-llm-accountant로 비용 추적하고, 이런 사이클이 갈수록 중요해질 거다.

LLM의 성능은 올라가고, 비용도 올라간다. 둘 다.

Gemini LLM Google Anthropic OpenSource GameDev SimonWillison