MidWayDer

1

memradar

6
역할 분류 시그널 실전 어휘로 전면 재조정, 평가 편향도 같이 고쳤다
commitsmemradar · 603fadb

역할 분류 시그널 실전 어휘로 전면 재조정, 평가 편향도 같이 고쳤다

🤖 2064 in / 1678 out / 3742 total tokens v2 평가에서 30샘플 100% 달성이 무의미했다는 걸 깨달았다. 생성 AI에 시그널 키워드를 노출한 상태로 테스트 데이터를 만들었으니 편향일 수밖에 없다. 이번 커밋은 두 가지를 동시에 고친다. 역할 분류 시그널의 어휘를 실전 기반으로 재조정하고, 평가 스펙을 v3로 재작성했다

이더1개월 전3 min read0
memradar평가편향NLP분류
Claude가 헤매지 않게 스킬 정의를 뼈대부터 다시 썼다
commitsmemradar · 63bceb5

Claude가 헤매지 않게 스킬 정의를 뼈대부터 다시 썼다

🤖 2157 in / 1772 out / 3929 total tokens The memtest skill wasn't triggering Claude properly. The SKILL.md listed trigger keywords but never specified what to actually execute. Claude would receive

이더1개월 전4 min read0
claude-skillsai-evaluationdeveloper-experience
memtest 스킬 순수화 — npm 스크립트 의존성 제거하고 /memtest 하나로 끝냄
commitsmemradar · 531393b

memtest 스킬 순수화 — npm 스크립트 의존성 제거하고 /memtest 하나로 끝냄

🤖 1671 in / 2000 out / 3671 total tokens memradar에서 npm run test:eval과 npm run report:eval을 없앴다. 이제 /memtest 스킬 하나만 실행하면 평가 + 리포트 생성 + 브라우저 열기까지 전부 자동으로 된다. 기존엔 npm 스크립트 2개를 따로 실행해야 했다. test:eval로

이더1개월 전3 min read1
AI 역할 분류기 정확도 71.1% — 평가 자동화 파이프라인 구축기
commitsmemradar · 6aba815

AI 역할 분류기 정확도 71.1% — 평가 자동화 파이프라인 구축기

🤖 6364 in / 2000 out / 8364 total tokens memradar의 AI 역할 분류기가 218개 샘플에서 71.1% 정확도를 기록했다. 합격인지 불합격인지 애매한 구간이다. 게임으로 치면 밸런싱 1차 패스를 끝낸 상태 — 플레이는 되지만 세밀한 튜닝이 필요한 단계다. 이번 커밋의 핵심은 평가 자동화 파이프라인을 통째로 만들었다

이더1개월 전5 min read0
사용자 역할 분석에 혼합형 감지와 confidence index 구조만 먼저 박음
commitsmemradar · b00eeac

사용자 역할 분석에 혼합형 감지와 confidence index 구조만 먼저 박음

🤖 1669 in / 1708 out / 3377 total tokens API 레이어에 혼합형 역할 감지와 confidence index 계산 로직을 추가했다. UI는 건드리지 않았다. 기존에 analyzeUsageTopCategories 하나에 몰려있던 스코어링 로직을 computeRawAnalysis / buildRankedScores 두 개의

이더1개월 전4 min read0
refactoringusage-analysisconfidence-index
toolUse 보너스 점수와 미확정 게이트로 사용자 분류 정밀도 올리기
commitsmemradar · 23019d7

toolUse 보너스 점수와 미확정 게이트로 사용자 분류 정밀도 올리기

🤖 1532 in / 2000 out / 3532 total tokens Memradar의 사용자 프로파일링 Phase 2 커밋. 텍스트 토큰 매칭만으로는 역할 분류가 애매한 구간을 toolUse 패턴으로 보강하고, 데이터가 부족할 땐 과감히 빈 배열을 반환하도록 분기했다. 기존 CategorySignals에는 tokenStrong, tokenWea

이더1개월 전3 min read0

LAMDiceBot

3
경마 다시보기가 실제 결과와 달랐던 이유 — speedSeeds 동기화 누락
commitsLAMDiceBot · 13515af

경마 다시보기가 실제 결과와 달랐던 이유 — speedSeeds 동기화 누락

🤖 2447 in / 1570 out / 4017 total tokens 경마 다시보기를 틀면 실제 경주 결과랑 완전히 다른 순위가 나오는 버그가 있었다. 원인은 단순했다. calculateHorseRaceResult에서 생성한 speedSeeds를 다시보기 record에 안 넘겨주고 있었다. 재생할 때 새 시드로 시뮬레이션을 돌려버리니 당연히 결과가

이더1개월 전3 min read0
bugfixhorse-racereplay
경마 시드 편향 수정 — 특정 레인이 자꾸 이기던 문제 고쳤다
commitsLAMDiceBot · d91d452

경마 시드 편향 수정 — 특정 레인이 자꾸 이기던 문제 고쳤다

🤖 2508 in / 2000 out / 4508 total tokens 경마에서 특정 레인이 유독 자주 1등 하더라. 원인을 파고들어보니 speedChangeSeed랑 initialSpeedFactor를 계산할 때 레인 인덱스 기반 의사난수 공식이 있었는데, 이게 편향을 만들고 있었다. Math.random() 기반으로 바꿔서 레인 간 격차를 없앴다

이더1개월 전3 min read0
bugfixhorse-raceseed-b
경마 거리 인디케이터가 화면 밖에서 렌더링되던 버그 수정
commitsLAMDiceBot · 300e208

경마 거리 인디케이터가 화면 밖에서 렌더링되던 버그 수정

🤖 1438 in / 1737 out / 3175 total tokens 트랙 너비가 7350px인 경마 게임에서 우측 거리 인디케이터가 right: 2px로 배치돼 있었다. 트랙 컨테이너 자체가 7350px짜리 너비를 가지니까 right: 2px는 트랙의 오른쪽 끝에서 2px 떨어진 지점, 즉 화면 밖 7000px 넘게 떨어진 곳에 요소가 붙어 있던

이더1개월 전3 min read0
bugfixCSSDOM