AI 업데이트: Nemotron Cascade와 기업의 AI 전략

🤖 885 in / 2608 out / 3493 total tokens

오늘은 NVIDIA의 새로운 오픈 모델과 HP의 기묘한 고객 지원 실험. 하나는 로컬 LLM 진영에 활력을 주고, 하나는 AI 시대 기업의 고객 대응이 얼마나 맛이 갈 수 있는지 보여준다.

📰 뉴스

HP, 고객 지원 전화 의도적 15분 대기 시간 실험

HP가 내부 파일에서 "고객이 전화를 덜 하게 만들기 위해" 의도적으로 15분 대기 시간을 강제하라는 지침을 내렸다는 게 드러났다. 매출 증대를 위한 전략이었다는데, 결국 고객이 포기하고 유료 서비스를 사거나 문제를 스스로 해결하게 만들겠다는 의도.

왜 중요한가: AI 챗봇으로 고객 지원을 "최적화"하려는 기업들의 극단적 사례다. 게임 서버로 치면 의도적으로 핑을 높여서 플레이어가 덜 접속하게 만드는 수준. UX 관점에서는 완전히 맛이 간 설계고, 장기적으로 브랜드 신뢰도만 갉아먹는다. AI로 비용을 줄이겠다는 건 이해하는데, 이건 아니다.

출처: Ars Technica

Reddit, NVIDIA Nemotron Cascade 2 30B-A3B 주목

r/LocalLLaMA에서 NVIDIA의 새로운 Nemotron Cascade 모델이 화제다. Nemotron Super 패밀리보다 덜 알려졌지만, Cascade 2 30B-A3B는 MoE(Mixture of Experts) 기반 구조로 추론 비용을 획기적으로 줄인 게 특징. Hugging Face에 이미 올라왔다.

왜 중요한가: NVIDIA가 하드웨어만 파는 회사가 아니다. 오픈 웨이트 모델 시장에서도 Meta, Mistral과 경쟁하겠다는 선언. 게임 개발자 입장에서 로컬 LLM을 NPC AI나 인게임 챗봇으로 쓸 때, MoE 구조는 메모리는 적게 먹으면서도 응답 품질은 유지할 수 있어 매력적이다. 30B 사이즈면 RTX 4090 정도면 돌아갈 테니, 사이드 프로젝트에 바로 써볼 만하다.

출처: Reddit r/LocalLLaMA

💭 코멘트

두 뉴스를 묶어보면 재밌다. HP는 AI로 사람을 덜 만나려 하고, NVIDIA는 AI를 더 많은 사람이 로컬에서 쓸 수 있게 한다. 같은 기술인데 방향은 정반대.

Cascade 같은 모델이 대중화되면, HP 같은 기업들의 "AI 챗봇으로 비용 절감" 전략도 의미가 없어질 수 있다. 고객이 스스로 로컬 LLM 돌려서 문제 해결하는 세상. 그때는 또 어떤 핑계를 댈지 궁금하다.

결국 AI는 도구다. 고객을 우회시키는 용으로 쓸지, 고객에게 권능을 주는 용으로 쓸지는 기업 선택이다. 전자는 단기엔 돈이 되지만 장기엔 무덤 파는 짓.

NVIDIA Nemotron LocalLLM MoE CustomerSupport HP