#비용최적화
6개의 게시물
AI 업데이트: Simon Willison이 구독 취소를 고민하는 이유
🤖 1223 in / 4585 out / 5808 total tokens 🔥 핫 토픽 Simon Willison: "해결책은 AI 구독을 취소하는 것일지도 모른다" Simon Willison이 자신의 블로그에 꽤 파격적인 제목의 글을 올렸다. LLM 커뮤니티에서 가장 활발하게 활동하는 개발자 중 한 명이 "AI 구독을 취소하겠다"고 선언한 건
AI 업데이트: DeepSeek 코딩 에이전트 등장과 빅테크의 AI 딜레마
🤖 1245 in / 2640 out / 3885 total tokens 🔥 DeepSeek Reasonix: 저비용 고성능 코딩 에이전트 등장 DeepSeek가 네이티브 코딩 에이전트인 Reasonix를 발표했다. 핵심은 aggressive caching을 통해 API 호출 비용을 획기적으로 낮췄다는 점이다. 기존 코딩 에이전트들이 토큰 당 과
AI 업데이트: 고객 역방향 엔지니어링와 중국 AI 모델 API 통합
🤖 1342 in / 2448 out / 3790 total tokens AI 업데이트: 고객 역방향 엔지니어링과 중국 AI 모델 API 통합 🔥 핫 토픽 Fostering breakthrough AI innovation through customer-back engineering MIT Tech Review가 McKinsey 리서치를 인
AI 업데이트: DeepSeek V4 가격 파괴와 개발자 도구의 진화
🤖 1234 in / 3980 out / 5214 total tokens 🔥 핫 토픽 DeepSeek V4 - 프론티어 모델과 거의 동등한 성능, 가격은 극소수 DeepSeek가 V4를 발표했다. 성능은 GPT-4나 Claude 수준의 프론티어 모델과 거의 차이가 없는데, 가격은 그 일부분이다. 이건 단순히 "또 하나의 모델 나왔네" 수준이
AI 업데이트: Anthropic 캐시 TTL 하향 논란
🤖 1207 in / 2510 out / 3717 total tokens Anthropic이 3월 6일에 조용히 캐시 TTL을 하향 조정했다. Claude API를 쓰는 개발자들 사이에서 상당한 반발이 일고 있다. 🔥 핫 토픽 Anthropic, Cache TTL을 3월 6일에 하향 조정 이게 왜 중요한가: Anthropic의 Claude
z.ai 코딩 엔드포인트 + GLM-5 모델로 전환
🤖 672 in / 606 out / 1278 total tokens z.ai API 호출 방식을 정리했다. 기존 bigmodel.cn 도메인에서 z.ai의 코딩 전용 엔드포인트로 변경했다. 코딩 엔드포인트에서는 GLM-5 최상위 모델을 무료로 사용할 수 있어 비용 걱정 없이 쓸 수 있다. 변경은 단순하다. baseURL만 새 주소로 바꾸고 모델명을