AI 업데이트: GPT-5.4, 중국 오픈소스, 그리고 공급망 해킹

이 글은 AI 검수에서 통과하지 못했습니다 (점수: 55/100)

⚠️ 비어있는 섹션이 있다 🚫 죽은 링크: https://www.reuters.com/business/autos-transportation/chinas-open-source-dominance-threatens-us-ai-lead-us-advisory-body-warns-2026-03-23/ (401) 🚫 죽은 링크: https://medium.com/ai-advances/flashattention-4-python-gpu-kernel-blackwell-2b18f51c8b32?sk=59bca93c369143e5f74fb0f86e57e6d0 (403)

링크 오류, 품질 미달 등의 사유로 자동 분류된 글입니다.

🤖 1674 in / 4374 out / 6048 total tokens

오늘은 GPT-5.4가 수학 난제를 풀었고, 중국 오픈소스 모델이 미국을 위협한다는 경고, 그리고 Litellm 패키지가 해킹당해 수천 명이 영향받은 사건 등 굵직한 소식이 많다.

🔥 핫 토픽

GPT-5.4 Pro, 미해결 수학 문제 풀어

Epoch AI가 공개한 바에 따르면 GPT-5.4 Pro가 FrontierMath의 미해결 문제 중 하나인 Ramsey Hypergraphs 문제를 해결했다. 이건 진짜 큰거다. 수학계에서 아무도 못 푼 문제를 AI가 풀었다는 건, 단순한 패턴 매칭을 넘어서는 어떤 추론 능력이 생겼다는 뜻이니까. 게임 개발자로서 말하자면, NPC AI가 퀘스트 퍼즐을 스스로 설계할 수 있는 수준이 되고 있다는 무서운 생각이 든다.

출처: Epoch AI

Andrej Karpathy의 자율 AI 연구 에이전트, 2일 만에 700개 실험 수행

Karpathy가 만든 Loop라는 자율 AI 연구 에이전트가 2일 동안 700개의 실험을 돌렸다. 혼자서 연구실 하나를 돌리는 셈이다. UE5에서 블루프린트 돌리던 내가 말하는 게 좀 그렇지만, 이건 진짜로 연구자의 역할을 자동화하는 방향으로 가고 있다. 게임 서버 최적화 실험도 이렇게 돌리면 되려나?

출처: Fortune

📰 뉴스

미국 자문기구: 중국 오픈소스 AI가 미국 리드를 위협한다

미국 자문기구에서 중국의 오픈소스 AI dominance가 미국의 AI 리더십을 위협한다고 경고했다. 솔직히 말하면, 요즘 r/LocalLLaMA만 봐도 중국 모델들이 진짜 잘 나오고 있다. Qwen, DeepSeek, Yi 계열이 성능도 좋고 라이선스도 관대하다. 오픈소스 생태계에서 미국이 놓친 게 뭔지 진지하게 고민해야 할 시점이다.

출처: Reuters

Litellm 1.82.7, 1.82.8 PyPI 패키지 해킹 당함 - 업데이트 금지

이건 진짜 비상사태다. Litellm의 PyPI 패키지 두 버전이 공급망 공격을 당했다. 수천 명이 영향받았을 거라고 한다. 나도 프로젝트에서 Litellm 쓰고 있는데, requirements.txt 버전 고정해둔 게 천만다행이었다. 항상 의존성 버전은 고정하고, sha256 해시까지 검증하는 습관 들여야 한다. 게임 서버 배포할 때도 마찬가지다.

출처: Reddit r/LocalLLaMA

FlashAttention-4: Python으로 작성, Triton 대비 2.7배 빠름

FlashAttention-4가 1613 TFLOPs/s를 달성했다. B200에서 BF16 forward 기준 71% 활용률이라니, 이건 CUDA 커널 최적화 수준이다. 근데 놀랍게도 Python으로 작성됐다. 추론 서버 구축할 때 Triton 쓰던 나로서는 자존심 상하는 소식이지만, 성능은 인정해야지. 실시간 게임 서버에서 어텐션 연산이 병목이던 시절이 있었는데, 이제 그런 걱정은 안 해도 되겠다.

출처: Medium

🎮 게임 개발자 관점

SillyTavern 확장으로 게임 내 NPC에 생명 불어넣기

SillyTavern을 백엔드로 써서 어떤 게임이든 NPC에 AI를 입히는 확장이 나왔다. 게임 쪽에는 작은 모드만 bridge로 달아주면 된다. 지금 Cydonia를 RP 모델로 쓰고 있다고 한다. UE5에서 비슷한 거 만들어봤는데, 플러그인으로 연동만 해주면 퀘스트 주는 NPC가 매번 다른 대사를 할 수 있는 거다. 물론 서버 비용이 문제지만.

출처: Reddit r/LocalLLaMA

EVA: 음성 에이전트 평가 프레임워크

HuggingFace에서 ServiceNow와 함께 음성 에이전트 평가 프레임워크인 EVA를 공개했다. 음성 AI 에이전트가 게임에서 보스 몬스터나 내레이션에 쓰이는 경우가 많아질 텐데, 이걸 어떻게 평가할지 표준이 없었다. 이 프레임워크가 그 간극을 메워줄 것 같다. 지연 시간, 자연스러움, 컨텍스트 유지 능력 등을 벤치마킹할 수 있다.

출처: HuggingFace Blog

🔬 기술 심층

RYS II: Qwen3.5 27B로 반복 레이어 실험

누군가 H100을 풀가동해서 Qwen3.5 27B로 레이어 반복 실험을 했다. 'Universal Language'라는 개념에 대한 힌트도 있다고 하는데, 아직 자세히 읽어보진 못했다. 핵심은 모델의 특정 레이어를 반복해서 실행했을 때 성능이 어떻게 변하는지 보는 것. 추론 시간에 compute를 더 쏟는 방식의 연구인데, O1 스타일 reasoning과 맥락이 닿아 있다.

출처: Reddit r/LocalLLaMA

중국 LLM 현황 정리

r/LocalLLaMA에 중국 LLM 생태계를 정리한 글이 올라왔다. ByteDance의 dola-seed(aka doubao)가 현재 최고 성능이라고. 그 외에도 Alibaba의 Qwen, 01.AI의 Yi, DeepSeek 등이 있다. 이걸 보면서 느낀 건, 중국은 오픈소스를 무기로 쓰고 있다는 거다. 미국 기업들이 폐쇄적으로 가는 사이, 중국은 모델을 풀어서 생태계를 장악하는 전략.

출처: Reddit r/LocalLLaMA

오픈소스 전쟁, 보안 사고, 그리고 수학 문제를 푸는 AI. 2026년 봄, 속도가 빨라지고 있다.

GPT-5 오픈소스 보안 FlashAttention 게임AI 중국LLM Karpathy 검수실패

← 이전 글

AI 업데이트: 중국 오픈소스, 인퍼런스 혁신, 그리고 보안 재앙

다음 글 →

AI 업데이트: 중국 오픈소스, FlashAttention-4, 그리고 보안 이슈