🤖
1755 in / 4860 out / 6615 total tokens
오늘은 보안 이슈가 꽤 무겁다. AI 개발자들이 자주 쓰는 도구들이 표적이 됐다.
🔥 핫 토픽: 서플라이체인 공격 주의보
LiteLLM, credential stealer 포함된 버전 배포됨
Litellm 1.82.8 버전에 악성코드가 포함됐다. litellm_init.pth 파일이 시스템 정보를 탈취해서 외부로 전송하는 후킹 코드를 심어놨다. 패키지 매니저 신뢰성에 또 구멍이 뚫린 셈.
Hacker News에서도 화제다. LiteLLM은 LLM API를 통합해서 쓰는 래퍼 라이브러리인데, 상당히 많은 프로젝트에서 의존하고 있다. 내 프로젝트도 예외는 아니다. 당장 pip list | grep litellm 해봐야겠다.
왜 중요한가: AI 래퍼 라이브러리는 API 키를 다루기 때문에 공격자들에게 매력적인 타겟이다. UE5 플러그인 마켓플레이스도 마찬가지 위험이 있지 않을까.
LM Studio에서도 악성코드 의심 신고
Reddit에서 LM Studio 사용자가 악성코드 탐지를 보고했다. 아직 확인된 건 아니지만, 같은 시기에 발생했다는 게 불안하다. 로컬 LLM 실행 도구들이 연이어 이슈에 휩싸였다.
왜 중요한가: 로컬 모델 실행 환경은 시스템 접근 권한이 높다. 공격받으면 피해가 클 수밖에 없다.
Simon Willison의 제언: 패키지 매니저가 식어야 한다
패키지 매니저가 좀 식어야 한다는 글이 올라왔다. 의존성 전파 속도가 너무 빠르다는 지적이다. npm, pip 생태계의 설계가 공격자에게 너무 유리하다.
🛠 개발 도구
Claude Code 치트시트
Claude Code를 효율적으로 쓰기 위한 치트시트가 공유됐다. 단축키, 프롬프트 패턴, 워크플로우 최적화 팁이 정리돼 있다.
최근 Claude Code를 메인 코딩 어시스턴트로 쓰고 있는데, 확실히 컨텍스트 유지력이 좋다. VS Code Copilot이랑은 다른 맛이 있다.
왜 중요한가: 도구 숙련도가 생산성을 갈라놓는다. 언리얼에서 단축키 외우는 거랑 같은 원리.
Claude Code Auto Mode
Claude Code의 Auto Mode가 추가됐다. 자율적으로 작업을 수행하는 모드다. 사용자 승인 없이 연속적으로 코드를 수정하고 테스트를 돌린다.
게임 개발에서 생각하면... 레벨 디자인 반복 작업이나 리팩토링에 쓸 수 있겠다. 다만 프로덕션 코드에 바로 적용하긴 무섭다.
Streaming Experts
전문가 스트리밍에 대한 글. LLM 응답을 스트리밍할 때의 UX 고려사항을 다뤘다. 첫 토큰까지의 지연, 청킹 전략, 사용자 인내심에 대한 이야기.
UE5에서 AI NPC 대화 시스템 구현할 때 참고해야 할 부분이다. 텍스트 타이핑 효과 속도 조절 같은 디테일이 생각보다 중요하다.
⭐ 오픈소스
AI-DEV-OS
AI Dev OS는 자율 AI 에이전트 오케스트레이션 플랫폼이다. 6가지 AI/ML 기술을 하나의 워크플로우로 통합했다.
에이전트 시스템 구조를 보면 게임 AI 아키텍처랑 비슷한 게 있다. 블랙보드, 태스크 큐, 의사결정 계층. 다만 게임은 실시간성이, AI 에이전트는 정확성이 더 중요하다.
graphbot
graphbot은 "LLM을 10배 똑똑하게 만든다"고 주장한다. 재귀적 DAG 분해 + 시간 지식 그래프 조합. 30개 태스크를 $0.0006 비용으로 처리했다.
아이디어는 흥미롭다. 복잡한 문제를 DAG로 쪼개서 순차적으로 해결하는 방식. 게임 퀘스트 시스템의 태스크 그래프랑 개념이 비슷하다. 다음 사이드프로젝트에서 한번 써먹어봐야겠다.
ContextLens
ContextLens는 RAG 평가 및 디버깅 플랫폼이다. 트레이스 캡처, 실패 분류, 설정 비교, LLM/휴리스틱 스코어링을 지원한다.
RAG 시스템 디버깅이 얼마나 고통스러운지 아는 사람은 안다. 검색 결과가 이상할 때 어디서 문제가 생겼는지 추적하기 어렵다. 이런 도구가 필요했다.
clinical-rag-system
임상 RAG 시스템은 의료 도메인에 특화된 RAG 구현이다. 임베딩, 모듈러 백엔드 아키텍처를 갖췄다.
도메인 특화 RAG는 신뢰성이 생명이다. 게임에서도 설정 덕후들을 위해 로어 RAG 시스템을 만들 수 있겠다. "이 NPC가 한 말이 설정과 일치하는가?"를 검증하는 용도로.
📄 논문
Scalable Prompt Routing
Scalable Prompt Routing via Fine-Grained Latent Task Discovery 논문이 공개됐다. 프롬프트 라우팅은 각 쿼리에 가장 적합한 LLM을 동적으로 선택하는 기술이다.
비용 최적화와 성능 균형을 잡는 게 핵심이다. 게임 서버의 로드밸런싱이랑 비슷하다. 어떤 요청은 가벼운 모델로, 어떤 요청은 무거운 모델로 보내는 라우팅 로직.
왜 중요한가: 멀티모델 API를 쓰는 프로덕션에서 비용 절감은 생존 문제다.
💬 읽을거리
AI 이야기에 지루함을 느끼나요?
Is anybody else bored of talking about AI?라는 글이 올라왔다. AI 피로감에 대한 솔직한 고백이다.
공감된다. 매일 새로운 모델, 새로운 도구, 새로운 논문이 쏟아진다. 따라가려니 지치고, 놓치면 불안하고. 그래도 실제로 만들어봐야 한다. 튜토리얼 지옥에서 빠져나와 사이드프로젝트라도 하나 완성해야 한다.
Wine 11, 리눅스 게임 성능 대폭 향상
Wine 11이 커널 레벨에서 윈도우 게임 실행 방식을 재작성했다. 상당한 성능 향상이 있다고 한다.
UE5 개발자로서 리눅스 지원은 계속 신경 쓰이는 부분이다. Steam Deck 덕분에 리눅스 게이밍 시장이 커졌는데, Wine의 발전은 환영할 일이다.
32MB VRAM에서 Claude Opus 이기는 모델?
Reddit에 32MB VRAM으로 Claude Opus를 이길 모델을 찾는 글이 올라왔다. GeForce 256과 펜티엄 3를 보유하고 있다나.
농담글이지만, 로컬 LLM 커뮤니티의 열정을 보여준다. 32MB라니. 퀀타이즈 기술이 발전해도 그건 좀...
오늘 교훈: requirements.txt 점검하자. 그리고 AI 피로감 느끼면 잠깐 쉬어도 된다.
의존성은 빚이다. 악성코드는 그 빚을 독촉하는 고리다.