AI 업데이트: 중국 오픈소스의 약진과 FlashAttention-4, 그리고 공급망 공격

이 글은 AI 검수에서 통과하지 못했습니다 (점수: 55/100)

⚠️ 비어있는 섹션이 있다 🚫 죽은 링크: https://www.reuters.com/business/autos-transportation/chinas-open-source-dominance-threatens-us-ai-lead-us-advisory-body-warns-2026-03-23/ (401) 🚫 죽은 링크: https://medium.com/ai-advances/flashattention-4-python-gpu-kernel-blackwell-2b18f51c8b32?sk=59bca93c369143e5f74fb0f86e57e6d0 (403)

링크 오류, 품질 미달 등의 사유로 자동 분류된 글입니다.

🤖 1674 in / 4189 out / 5863 total tokens

오늘 핵심은 중국 오픈소스 모델이 미국을 위협한다는 미국 자문기구 경고, FlashAttention-4의 압도적 성능, 그리고 Litellm 패키지 해킹 사건이다. 게임 개발자로선 NPC AI 확장과 성능 최적화 소식이 특히 반갑다.

🔥 핫 토픽

중국 오픈소스 AI가 미국 리드를 위협한다

미국 자문기구가 중국의 오픈소스 AI 전략이 미국의 AI 리더십을 위협한다고 경고했다. 중국은 알리바바의 Qwen, 딥시크, 바이트댄스의 Doubao 등 고품질 오픈소스 모델을 쏟아내며 전 세계 개발자 생태계를 장악하고 있다. 미국은 폐쇄적 접근으로 승부하려 하지만, 오픈소스의 파급력을 무시하기 어렵다.

왜 중요한가: 오픈소스는 생태계를 먹는다. UE5도 소스 공개로 생태계를 확장했듯, AI도 같은 길을 걷고 있다.

출처: Reuters - China's open-source dominance threatens US AI lead

GPT-5.4 Pro, 수학 난제 해결

Epoch AI가 GPT-5.4 Pro가 Ramsey Hypergraphs 관련 미해결 수학 문제를 풀었다고 확인했다. FrontierMath 벤치마크의 오픈 문제 중 하나를 해결한 것. AI가 단순히 패턴 매칭을 넘어 진짜 추론 능력을 갖췄다는 신호다.

왜 중요한가: 게임 AI로 치면 NPC가 퀘스트를 스스로 설계하는 수준의 도약이다.

출처: Epoch AI - Ramsey Hypergraphs

Andrej Karpathy의 자율 AI 연구 에이전트

Karpathy가 만든 자율 AI 연구 에이전트가 2일 만에 700개의 실험을 수행했다. 인간 연구자가 몇 주 걸릴 작업을 AI가 자율적으로 설계하고 실행한 셈이다. Loop라는 이 시스템은 AI가 AI를 연구하는 재귀적 구조다.

왜 중요한가: 사이드 프로젝트 개발자로서 AI 에이전트가 내 일을 대신해주는 미래가 가까워지고 있다.

출처: Fortune - Andrej Karpathy's autonomous AI research agent

🛡️ 보안 이슈

Litellm PyPI 패키지 해킹, 공급망 공격 주의

Litellm 1.82.7과 1.82.8 버전이 PyPI에서 해킹당했다. 설치하면 악성 코드가 실행되는 공급망 공격이다. 수천 명이 영향받았을 것으로 추정된다. 당장 해당 버전 사용을 중단하고 이전 버전으로 롤백해야 한다.

왜 중요한가: 게임 서버도 마찬가지지만, 의존성 하나가 전체 시스템을 무너뜨릴 수 있다. requirements.txt 고정하고 checksum 검증하는 습관 들여야 한다.

출처: Reddit - Litellm compromised

⚡ 성능 최적화

FlashAttention-4: Triton보다 2.7배 빠르다

FlashAttention-4가 B200에서 BF16 포워드 1,613 TFLOPs/s를 달성했다. Triton 구현보다 2.7배 빠르고, 무엇보다 Python으로 작성됐다는 게 놀랍다. Blackwell 아키텍처의 71% 활용률. 추론 서빙 비용이 크게 내려갈 것으로 보인다.

왜 중요한가: 게임 서버 최적화하던 시절 캐시 미스 줄이던 감각이 AI 추론에서도 그대로 적용된다. 메모리 대역폭이 병목인 세상에서 이런 최적화는 금이다.

출처: Medium - FlashAttention-4

🎮 게임 & AI

SillyTavern 확장으로 게임 NPC에 생명 불어넣기

SillyTavern을 백엔드로 사용해 어떤 게임이든 NPC를 AI로 구동하는 확장이 나왔다. 게임과 SillyTavern 사이에 작은 모드만 있으면 되고, Cydonia와 Qwen 3.5를 RP 모델로 사용 중이라고 한다. UE5 플러그인으로 비슷한 거 만들어두면 재밌겠다.

왜 중요한가: 게임 개발자로서 이건 진짜 흥미진진하다. NPC 대화 시스템을 별도로 짤 필요 없이, AI 백엔드에 연결만 하면 된다.

출처: Reddit - SillyTavern NPC extension

🔬 연구 & 실험

RYS II: Qwen3.5 27B로 레이어 반복 실험

H100을 굴려 Qwen3.5 27B로 레이어 반복 실험을 했다. 'Universal Language'라는 개념에 대한 힌트도 있다는데, 블로그 글이 너무 길어서 아직 다 못 읽었다. 핵심은 모델 아키텍처 변형으로 성능 향상을 노리는 실험들.

출처: Reddit - RYS II

중국 LLM 현황 정리

중국 LLM 생태계 정리글이 올라왔다. 바이트댄스의 Doubao이 현재 최고 성능이고, 알리바바 Qwen, 딥시크 등이 따라가는 구도. 미국 모델과 비교해도 손색없는 성능이라고.

출처: Reddit - Chinese LLMs scene

EVA: 음성 에이전트 평가 프레임워크

ServiceNow와 HuggingFace가 음성 AI 에이전트 평가 프레임워크 EVA를 공개했다. 음성 인식, 이해, 응답 생성까지 종합적으로 평가할 수 있다. 게임 음성 채팅 시스템이나 음성 비서 만들 때 유용할 듯.

출처: HuggingFace Blog - EVA

오픈소스가 생태계를 먹는다. 그리고 FlashAttention-4는 Python으로 GPU 커널을 짜는 시대를 열었다. 게임 개발자도 AI도 결국 최적화 싸움이다.

FlashAttention-4 OpenSource Security GameAI China SupplyChain 검수실패

← 이전 글

AI 업데이트: 중국 오픈소스, FlashAttention-4, 그리고 보안 이슈

다음 글 →

AI 업데이트: FlashAttention-4, 중국 오픈소스, 그리고 보안 공격