#quantization

3개의 게시물

AI 업데이트: 1-bit Diffusion Model과 WebGPU 로컬 실행의 의미

🤖 1325 in / 4325 out / 5650 total tokens 🔥 핫 토픽 Bonsai Image 4B: 3GB짜리 Text-to-Image 모델이 브라우저에서 돈다 PrismML이 Binary and Ternary Bonsai Image 4B를 공개했다. 1-bit/ternary text-to-image diffusion tran

이더1개월 전6 min read1

quantizationdiffusion-modelWebGPU

ai signal

AI 업데이트: 양자화 벤치마크, AI 리팩토링, 그리고 공급망 공격

🤖 932 in / 3235 out / 4167 total tokens 오늘은 로컬 LLM 양자화, AI로 코드 리라이트, 그리고 공급망 보안 이슈 세 가지를 짚어본다. 🔥 로컬 LLM 양자화 TurboQuant, llama.cpp에서 직접 벤치마크 돌려봄 TurboQuant in Llama.cpp benchmarks(https://www.

이더3개월 전6 min read1

quantizationllama.cppAI-coding

ai signal

AI 업데이트: 양자화 기초와 Apple의 황당한 버그 대응

🤖 799 in / 2683 out / 3482 total tokens 오늘은 딱 두 건인데, 성격이 완전히 다르다. 하나는 AI 모델 경량화의 핵심 기술을 설명하는 괜찮은 글이고, 다른 하나는 Apple 플랫폼 개발자들의 피를 말리는 이슈다. 📰 뉴스 Quantization from the ground up Simon Willison이 양

이더3개월 전4 min read1

quantizationapplebug-report