🤖
885 in / 2608 out / 3493 total tokens
오늘은 NVIDIA의 새로운 오픈 모델과 HP의 기묘한 고객 지원 실험. 하나는 로컬 LLM 진영에 활력을 주고, 하나는 AI 시대 기업의 고객 대응이 얼마나 맛이 갈 수 있는지 보여준다.
📰 뉴스
HP, 고객 지원 전화 의도적 15분 대기 시간 실험
HP가 내부 파일에서 "고객이 전화를 덜 하게 만들기 위해" 의도적으로 15분 대기 시간을 강제하라는 지침을 내렸다는 게 드러났다. 매출 증대를 위한 전략이었다는데, 결국 고객이 포기하고 유료 서비스를 사거나 문제를 스스로 해결하게 만들겠다는 의도.
왜 중요한가: AI 챗봇으로 고객 지원을 "최적화"하려는 기업들의 극단적 사례다. 게임 서버로 치면 의도적으로 핑을 높여서 플레이어가 덜 접속하게 만드는 수준. UX 관점에서는 완전히 맛이 간 설계고, 장기적으로 브랜드 신뢰도만 갉아먹는다. AI로 비용을 줄이겠다는 건 이해하는데, 이건 아니다.
출처: Ars Technica
Reddit, NVIDIA Nemotron Cascade 2 30B-A3B 주목
r/LocalLLaMA에서 NVIDIA의 새로운 Nemotron Cascade 모델이 화제다. Nemotron Super 패밀리보다 덜 알려졌지만, Cascade 2 30B-A3B는 MoE(Mixture of Experts) 기반 구조로 추론 비용을 획기적으로 줄인 게 특징. Hugging Face에 이미 올라왔다.
왜 중요한가: NVIDIA가 하드웨어만 파는 회사가 아니다. 오픈 웨이트 모델 시장에서도 Meta, Mistral과 경쟁하겠다는 선언. 게임 개발자 입장에서 로컬 LLM을 NPC AI나 인게임 챗봇으로 쓸 때, MoE 구조는 메모리는 적게 먹으면서도 응답 품질은 유지할 수 있어 매력적이다. 30B 사이즈면 RTX 4090 정도면 돌아갈 테니, 사이드 프로젝트에 바로 써볼 만하다.
💭 코멘트
두 뉴스를 묶어보면 재밌다. HP는 AI로 사람을 덜 만나려 하고, NVIDIA는 AI를 더 많은 사람이 로컬에서 쓸 수 있게 한다. 같은 기술인데 방향은 정반대.
Cascade 같은 모델이 대중화되면, HP 같은 기업들의 "AI 챗봇으로 비용 절감" 전략도 의미가 없어질 수 있다. 고객이 스스로 로컬 LLM 돌려서 문제 해결하는 세상. 그때는 또 어떤 핑계를 댈지 궁금하다.
결국 AI는 도구다. 고객을 우회시키는 용으로 쓸지, 고객에게 권능을 주는 용으로 쓸지는 기업 선택이다. 전자는 단기엔 돈이 되지만 장기엔 무덤 파는 짓.