AI 업데이트: 중국 오픈소스 AI의 위협, FlashAttention-4, 그리고 공급망 해킹

이 글은 AI 검수에서 통과하지 못했습니다 (점수: 55/100)

⚠️ 비어있는 섹션이 있다 🚫 죽은 링크: https://www.reuters.com/business/autos-transportation/chinas-open-source-dominance-threatens-us-ai-lead-us-advisory-body-warns-2026-03-23/ (401) 🚫 죽은 링크: https://medium.com/ai-advances/flashattention-4-python-gpu-kernel-blackwell-2b18f51c8b32 (403)

링크 오류, 품질 미달 등의 사유로 자동 분류된 글입니다.

🤖 1674 in / 4475 out / 6149 total tokens

오늘 핫한 뉴스들을 게임 개발자 시각에서 정리했다. 중국 AI의 약진, 추론 성능의 획기적 개선, 그리고 조용히 터진 보안 사고까지.

🔥 핫 토픽

중국 오픈소스 AI, 미국 리드를 위협한다

미국 자문기구가 경고장을 날렸다. 중국의 오픈소스 AI 전략이 미국의 AI 패권을 위협한다는 것이다. 사실 이미 개발자들 사이에서는 공공연한 비밀. Qwen, DeepSeek, Yi 같은 중국 모델들이 성능 대비 가성비로 시장을 잠식 중이다.

재미있는 건 미국이 '오픈소스'를 무기로 삼은 건 중국이라는 점이다. 클로즈드 모델로 고가를 유지하던 빅테크들이 이제 와서 뒤늦게 불안해하는 꼴. 게임 업계로 치면 인디게임이 AAA를 위협하는 상황과 비슷하다.

출처: Reuters

GPT-5.4 Pro, 수학 공개 문제 해결

Epoch AI가 확인했다. GPT-5.4 Pro가 Ramsey Hypergraphs 관련 미해결 수학 문제를 풀었다는 것. AI가 창의적 추론을 못한다는 말은 이제 옛날 이야기다.

물론 회의적일 수 있다. 하지만 '툴'로서의 AI가 수학자의 영역까지 넘보기 시작했다는 건 부인할 수 없다. 게임 개발에서도 프로시저럴 알고리즘이나 물리 시뮬레이션 최적화에 AI가 개입할 날이 멀지 않았다.

출처: Epoch AI

Karpathy의 자율 AI 연구 에이전트, 2일간 700 실험 수행

Andrej Karpathy가 공개한 Loop 프로젝트가 충격적이다. 자율 AI 에이전트가 이틀 만에 700개의 실험을 돌렸다. 사람이 했으면 몇 주 걸릴 작업이다.

이게 왜 중요하냐. 'AI가 AI를 개발한다'는 게 이제 이론이 아니라 실제로 돌아가기 시작했다는 거다. 게임 개발자 입장에서 생각하면, AI가 렌더링 파이프라인을 최적화하거나 네트워크 코드를 프로파일링하는 미래가 올 수 있다. 무섭지만 기대된다.

출처: Fortune

📰 뉴스

중국 LLM 생태계 현황 정리

Reddit에 중국 LLM 판도를 정리한 글이 올라왔다. ByteDance의 doubao(구 dola-seed)가 현재 마켓 리더라는 평. Alibaba의 Qwen, 01.AI의 Yi, DeepSeek 등이 뒤를 잇는다.

특이한 건 중국 기업들이 '오픈웨이트' 전략으로 시장을 공략 중이라는 점. 성능은 GPT-4급인데 가격은 파격적. 로컬 LLM으로 게임 NPC AI를 돌리는 사이드프로젝트에 딱이다.

출처: Reddit r/LocalLLaMA

RYS II: Qwen3.5 27B로 레이어 반복 실험

로컬 LLM 커뮤니티의 괴물 실험이 또 나왔다. 모델의 레이어를 반복해서 더 깊은 추론을 유도하는 기법. 'Universal Language'라는 개념에 대한 힌트도 포함되어 있다.

H100을 풀로 돌려서 나온 결과물이라는데, 이런 실험을 개인이 돌릴 수 있다는 게 시사하는 바가 크다. 클라우드 비용이 문제긴 하지만, 최적화 기법이 이런 식으로 커뮤니티에서 먼저 튀어나오는 추세다.

출처: Reddit r/LocalLLaMA

🛠️ 오픈소스 & 툴

FlashAttention-4: Triton보다 2.7배 빠르다

FlashAttention-4가 나왔다. B200에서 1,613 TFLOPs/s, BF16 포워드 기준 71% 활용률. Triton 대비 2.7배 빠르고, 결정적으로 Python으로 작성됐다.

추론 성능에 미치는 영향이 크다. 게임 서버에서 실시간으로 LLM을 돌려야 하는 상황이라면, 이런 최적화는 선택이 아니라 필수. UE5에서도 GPU 연산 최적화를 고민하는 입장에서, Python으로 이 정도 성능을 뽑아낸 건 놀랍다.

출처: Medium

SillyTavern 확장: 모든 게임에 NPC AI를

SillyTavern을 백엔드로 써서 게임 NPC에 AI를 입히는 확장이다. 브릿지 모드만 있으면 어떤 게임이든 연동 가능하다. 현재 Cydonia를 RP 모델로, Qwen 3.5를 백엔드로 사용 중이라고.

게임 개발자로서 바로 눈에 띄는 프로젝트. UE5 플러그인으로 비슷한 걸 만들어볼 수 있겠다. NPC 대화 시스템에 로컬 LLM을 붙이는 건 이제 구현 문제지 기술적 장벽이 아니다.

출처: Reddit r/LocalLLaMA

EVA: 음성 에이전트 평가 프레임워크

HuggingFace와 ServiceNow가 공개한 음성 AI 평가 프레임워크. 음성 에이전트의 품질을 객관적으로 측정할 수 있는 도구다.

게임에서 보이스 챗봇이나 음성 인식 시스템을 도입할 때 유용할 듯. 평가 메트릭이 표준화되면 개발사 입장에서도 어떤 모델을 채택할지 판단하기 쉬워진다.

출처: HuggingFace Blog

⚠️ 보안 이슈

LiteLLM 1.82.7, 1.82.8 PyPI 패키지 해킹당함

조용히 터진 보안 사고다. LiteLLM의 최신 두 버전이 공급망 공격을 당했다. PyPI에서 다운로드받은 사용자들은 전부 영향권이다.

이게 왜 무섭냐. LiteLLM은 LLM API 호출을 추상화하는 라이브러리로, API 키가 다 이 라이브러리를 통과한다. 해커가 이 키들을 탈취했다면? OpenAI, Anthropic, Azure 등 모든 LLM API 키가 뚫린 셈이다.

게임 서버에서 LLM API를 쓰고 있다면 당장 버전을 확인하고 키를 로테이션해야 한다. 의존성 관리의 어두운 면을 다시 한번 상기시켜주는 사건.

출처: Reddit r/LocalLLaMA

중국은 오픈소스로 판을 키우고, 미국은 클로즈드로 돈을 번다. 사이에서 개발자들은 공짜 좋은 모델을 쓰면 그만. 그런데 의존성 하나 잘못 건드리면 API 키가 털린다. 세상은 공평하다.

China AI FlashAttention Security LLM LocalAI GameDev 검수실패

← 이전 글

AI 업데이트: FlashAttention-4, 중국 오픈소스, 그리고 공급망 해킹

다음 글 →

AI 업데이트: 중국 오픈소스, 인퍼런스 혁신, 그리고 보안 재앙