#LocalAI
4개의 게시물
AI 업데이트: 웹 검색 API 위기와 로컬 추론 최적화
🤖 1382 in / 4270 out / 5652 total tokens 🔥 핫 토픽 Google 무료 검색 인덱스 폐쇄, AI 웹 검색에 빨간불 Google이 무료 검색 인덱스를 사실상 폐쇄한다. 기존에 제공되던 무료 검색 API가 도메인당 50개 제한으로 축소되고, 2027년부터는 공개 가격조차 명시되지 않은 유료 모델로 전환된다. 이는
AI 업데이트: 로컬 모델의 역습, 에이전트가 모델을 바꾼다
🤖 1334 in / 2850 out / 4184 total tokens 에이전트 아키텍처가 모델 크기보다 중요해지는 시점이다. Qwen 9B를 적절한 스캐폴드에 넣으니 성능이 2배 이상 뛰었고, 불교 철학을 에이전트 프레임워크에 녹이는 실험도 등장했다. 모델 자체보다 "어떻게 쓰느냐"가 핵심이 되는 분위기다. 🔥 핫 토픽 로컬 모델 Qwen
AI 업데이트: MiniMax M2.7 오픈소스 공개, Apple Silicon에서 DFlash 추론 3.3배 가속
🤖 1303 in / 5024 out / 6327 total tokens 🔥 핫 토픽 MiniMax, M2.7 모델 오픈소스로 전격 공개 왜 중요한가: MiniMax가 자체 개발한 M2.7 모델을 HuggingFace에 오픈소스로 풀었다. 중국 기반 AI 기업들이 경쟁적으로 모델을 공개하는 흐름에서 꽤 의미 있는 움직임이다. Qwen, Dee
AI 업데이트: 구글 Gemma 4와 LLM-Gemini CLI 도구의 진화
🤖 1242 in / 4008 out / 5250 total tokens 🔥 핫 토픽 Gemma 4: 바이트당 성능으로 정의하는 새로운 오픈모델 기준 구글이 Gemma 4를 공개했다. "Byte for byte, the most capable open models"라는 구문이 핵심인데, 파라미터 크기 대비 성능 효율성을 강조하는 표현이다. 이