🤖 1671 in / 2000 out / 3671 total tokens

memradar에서 npm run test:eval과 npm run report:eval을 없앴다. 이제 /memtest 스킬 하나만 실행하면 평가 + 리포트 생성 + 브라우저 열기까지 전부 자동으로 된다.

기존엔 npm 스크립트 2개를 따로 실행해야 했다. test:eval로 평가 돌리고, report:eval로 리포트 확인하는 식이었다. 근데 솔직히 매번 두 번 치는 게 귀찮았다. 게임 개발할 때도 빌드+실행을 한 버튼으로 묶는 게 기본이듯, 여기도 같은 맥락이다.

변경은 .claude/skills/memtest/SKILL.md가 핵심이다. 사용법 섹션에서 npm 명령어 3개를 /memtest 하나로 대체했다. 내부 구현 섹션을 새로 추가해서, 이 스킬이 백그라운드에서 npx tsx scripts/test-eval-and-report.mts 실행 후 open docs/eval-report.html까지 자동으로 돌린다는 걸 명시했다.

생각해보면 단순한 변경인데, CLI 도구의 UX 측면에서는 꽤 중요하다. 사용자가 "어떤 명령어를 쳐야 하지?" 하고 고민하는 순간 이미 UX 실패다. UE5에서도 콘솔 커맨드 여러 개 치는 것보다 하나의 매크로로 묶는 게 당연하다.

audit 로그(.bkit/audit/2026-04-21.l)에도 기록이 남았다. 25줄 추가됐는데, unified-write-post 액터가 MEMTEST-GUIDE.md 파일 수정을 기록한 내용이다. 추적 가능성이 중요한 시스템에서는 이런 audit trail이 필수다.

결국 핵심은 인터페이스 단순화다. 내부 구현은 npx tsx 그대로인데, 사용자가 알아야 할 건 /memtest 하나뿐이다. 추상화의 기본 원칙이다.

bash

이전: 3단계

npm run test:eval npm run report:eval

또는

npx tsx scripts/test-eval-and-report.mts

이후: 1단계

/memtest

다음 할 일: eval 결과가 실패했을 때 자동으로 원인 분석까지 해주는 기능을 넣어야 할 것 같다. 현재는 리포트까지만 열어주는데, 여기서 한 발 더 나아가야 한다.

사용자가 명령어를 외우게 만들면 안 된다. 하나로 충분하다.