AI 업데이트: LiteLLM 공급망 공격, 중국 AI의 약진

이 글은 AI 검수에서 통과하지 못했습니다 (점수: 15/100)

⚠️ 비어있는 섹션이 있다 🚫 죽은 링크: https://www.reuters.com/business/autos-transportation/chinas-open-source-dominance-threatens-us-ai-lead-us-advisory-body-warns-2026-03-23/ (401) 🚫 죽은 링크: https://www.reddit.com/r/LocalLLaMA/comments/1s1gm9z/the_current_state_of_the_chinese_llms_scene/ (403) 🚫 죽은 링크: https://www.reddit.com/r/LocalLLaMA/comments/1s1t5ot/rys_ii_repeated_layers_with_qwen35_27b_and_some/ (403) 🚫 죽은 링크: https://v.redd.it/9ju2tp2gezqg1 (403)

링크 오류, 품질 미달 등의 사유로 자동 분류된 글입니다.

🤖 1860 in / 4971 out / 6831 total tokens

오늘자 AI 소식 중 가장 눈에 띄는 건 LiteLLM 공급망 공격이다. 게임 서버 보안만 신경 쓰다가 AI쪽도 만만치 않구나 실감했다.

🔥 핫 토픽

LiteLLM 1.82.8, 악성코드 포함된 채 배포됐다

LiteLLM이 공급망 공격을 당했다. 1.82.8 버전에 litellm_init.pth라는 악성 파일이 포함돼 있었는데, credential stealer(자격증명 탈코드)였다. 이 패키지를 쓰는 프로젝트가 한둘이 아닐 텐데... 생각만 해도 등골이 서늘하다.

우리 같은 인디 개발자는 의존성 하나하나가 다 레이턴시처럼 신경 쓰인다. pip install 한 방에 프로젝트 전체가 털릴 수 있다는 거, 진지하게 받아들여야 한다. requirements.txt 고정하고 checksum 검증하는 습관, 이제 선택 아니다.

왜 중요한가: AI 인프라도 결국 소프트웨어 공급망이다. 방심하다간 API 키 몽땅 날린다.

출처: GitHub Issue | Simon Willison

LM Studio도 멀웨어 의심 신고

Reddit에서 LM Studio 사용자가 정교한 멀웨어 탐지 리포트를 올렸다. 아직 확정은 아니지만, 여러 번 반복해 탐지됐다고 한다. 로컬 LLM 돌리려고 깐 게 역으로 당할 수도 있다는 얘기.

로컬 모델은 "내 PC에서 돌아가니 안전"이라는 착각하기 쉬운데, 실행 파일 자체가 문제면 답이 없다. 바이러스 토탈 한 번씩 돌려보자.

왜 중요한가: 로컬 LLM 툴 생태계가 커질수록 공격 표면도 넓어진다.

출처: Reddit r/LocalLLaMA

패키지 매니저, 냉각이 필요하다

Simon Willison이 패키지 매니저 생태계의 과열을 지적했다. 의존성 캐스케이드가 너무 깊고, 업데이트 주기가 너무 빠르다. 게임 개발에서도 언리얼 플러그인 버전 지옥 겪어봤을 거다. AI쪽은 그보다 더 심하다.

출처: Simon Willison

🌏 중국 AI 현황

중국 오픈소스 AI, 미국 리드를 위협한다

미국 자문기구가 중국의 오픈소스 AI 지배력이 미국의 AI 리더십을 위협한다고 경고했다. 중국은 정책적으로 오픈소스를 밀어주고 있고, Qwen 시리즈나 DeepSeek 같은 모델이 증거다.

왜 중요한가: 폐쇄형 vs 오픈소스 싸움이 국가 경쟁으로 번졌다. 우리 같은 개발자는 그냥 좋은 거 쓰면 되지만, 정책 입장에선 복잡하겠지.

출처: Reuters

중국 LLM 생태계 정리

Reddit에 중국 LLM 현황을 정리한 글이 올라왔다. ByteDance의 doubao(구 dola-seed)가 마켓 리더고, Alibaba의 Qwen, DeepSeek, Baidu 등이 치열하게 경쟁 중이다.

우리가 Qwen을 메인으로 쓰는 이유가 있다. 성능 대비 비용, 그리고 오픈 가중치. 중국 모델이 싸고 좋으면 쓰는 거다. 국적보다 퍼포먼스다.

출처: Reddit r/LocalLLaMA

RYS II: Qwen3.5 27B로 반복 레이어 실험

H100을 굴려가며 Qwen3.5 27B로 레이어 반복 실험을 했다는 글. "Universal Language" 힌트도 있다는데, 모델 아키텍처 트윅으로 성능 향상을 노리는 연구다.

최적화는 게임 개발자의 본능이다. 폴리곤 줄이듯 레이어 최적화하는 거, 비슷한 맥락이다.

출처: Reddit r/LocalLLaMA

🎮 게임 + AI

SillyTavern으로 게임 NPC 살리기

SillyTavern 확장을 만들어서 어떤 게임이든 NPC에 AI를 입혔다. 게임 클라이언트는 브리지 역할만 하고, 실제 RP는 SillyTavern이 처리한다. Cydonia랑 Qwen 3.5를 쓴다고 한다.

이게 바로 내가 하고 싶던 거다. 게임 엔진은 렌더링과 물리만, AI는 외부 서버. UE5에서 비슷한 거 시도해봤는데, 실시간 대화 레이턴시가 관건이더라. 로컬 LLM으로 돌리면 꽤 그럴싸해진다.

왜 중요한가: 모든 게임이 NPC AI를 자체 구현할 필요 없다. LLM 백엔드만 잘 붙이면 된다.

출처: Reddit r/LocalLLaMA

🛠️ 도구 & 리소스

Claude Code 치트시트

Claude Code 쓰는 사람들을 위한 치트시트다. CLI 기반 코딩 어시스턴트 쓸 때 단축키랑 패턴 정리해둔 거. 나도 Cursor랑 Claude Code 병행하는데, 이런 거 있으면 생산성 확 올라간다.

출처: cc.storyfox.cz

GraphBot: LLM 10배 똑똑하게 만들기

재귀적 DAG 분해 + 시간 지식 그래프로 저렴한 모델을 비싼 모델 수준으로 끌어올린다. 30개 태스크에 총 0.0006달러. 프롬프트 엔지니어링만 잘하면 GPT-4 안 부럽다는 증거다.

출처: GitHub - LucasDuys/graphbot

ContextLens: RAG 디버깅 플랫폼

RAG 시스템 평가랑 디버깅을 위한 플랫폼. 트레이스 캡처, 실패 분류, 설정 비교까지. RAG 만들어본 사람은 알 거다. 검색 결과가 이상할 때 어디서 문제인지 찾는 게 얼마나 고통인지.

출처: GitHub - samarthshete/ContextLens

Clinical RAG 시스템

의료용 RAG 시스템. 임베딩이랑 모듈형 백엔드 아키텍처. 의료 데이터는 민감해서 로컬이나 프라이빗 클라우드에서 돌려야 하는데, 이런 레퍼런스 있으면 좋다.

출처: GitHub - azitaCodes/clinical-rag-system

📄 논문

확장 가능한 프롬프트 라우팅

프롬프트 라우팅은 쿼리마다 가장 적합한 LLM을 선택하는 기술이다. 모델 풀이 커질수록 어떤 모델에 던질지가 비용과 품질을 결정한다.

게임 서버 로드밸런싱이랑 같다. 요청 성격에 따라 서버 인스턴스를 다르게 배정하는 거. LLM도 이제 인프라 레이어가 됐다.

출처: HuggingFace Papers

EVA: 음성 에이전트 평가 프레임워크

ServiceNow에서 음성 AI 에이전트 평가를 위한 새 프레임워크를 공개했다. 음성은 텍스트보다 평가가 어렵다. 레이턴시, 발음, 톤, 컨텍스트 유지까지 다 봐야 하니까.

출처: HuggingFace Blog

오늘의 교훈: LiteLLM 사건 보고 나니 내 API 키들이 걱정된다. 의존성 업데이트 전엔 항상 changelog랑 이슈 확인하자.

보안 공급망공격 LiteLLM 중국AI Qwen SillyTavern 게임NPC RAG 프롬프트라우팅 검수실패

← 이전 글

AI 업데이트: LiteLLM 서플라이체인 공격, 중국 오픈소스 AI의 약진

다음 글 →

AI 업데이트: 공급망 공격과 오픈소스 보안, 그리고 프롬프트 라우팅