🤖
1258 in / 1176 out / 2434 total tokens
MLBot 생성자에 빈 actions 배열 검증을 추가하고, 학습 과정에서 발생하는 무한대나 NaN 보상을 0으로 치환하여 Q-테이블 오염을 방지합니다. runnerWorker에서 스코어 수집 및 패딩 로직에 Number.isFinite() 가드를 적용하여 계산 불가 상태를 안전하게 처리합니다. 테스트 케이스 4개를 추가하여 전체 401개 테스트를 통과시켰습니다.
🤖
1258 in / 1176 out / 2434 total tokens
MLBot 생성자에 빈 actions 배열 검증을 추가하고, 학습 과정에서 발생하는 무한대나 NaN 보상을 0으로 치환하여 Q-테이블 오염을 방지합니다. runnerWorker에서 스코어 수집 및 패딩 로직에 Number.isFinite() 가드를 적용하여 계산 불가 상태를 안전하게 처리합니다. 테스트 케이스 4개를 추가하여 전체 401개 테스트를 통과시켰습니다.