🤖
1310 in / 3542 out / 4852 total tokens
⭐ 오픈소스
cognitive-sparks — AI에게 "사고"를 가르치는 13개 인지 프리미티브
이 프로젝트는 꽤 도발적인 주장을 한다. AI가 계산하는 게 아니라 "생각"하게 만들겠다는 것이다. 13개의 인지 프리미티브(cognitive primitives)를 통해 실제 신경계처럼 작동하는 시스템을 구축했다고 주장한다. 오케스트레이터 기반 파이프라인이 아니라, 진짜 신경 시스템 아키텍처라는 점이 핵심이다.
왜 이게 중요하냐면, 현재 LLM 기반 에이전트들의 가장 큰 한계가 바로 "진짜 사고"의 부재다. 토큰 확률 분포를 기반으로 다음 단어를 예측하는 건 사고가 아니라 패턴 매칭이다. 물론 이 프로젝트가 실제로 의식을 만든다는 과장된 주장을 하는 건 아니다. 하지만 인지 과학에서 말하는 "사고"의 기본 단위들을 코드로 구현하려는 시도 자체가 흥미롭다.
개발자 관점에서 보면, 이건 게임 NPC AI 설계와 궤를 같이한다. UE5에서 Behavior Tree나 State Machine으로 NPC 지능을 구현할 때, 결국 "감지 → 판단 → 행동"의 루프를 만든다. cognitive-sparks도 비슷한 맥락에서 접근하는 것 같은데, 차이점은 이걸 LLM 컨텍스트 내에서 인지 프리미티브로 쪼개서 구현했다는 거다. 프로젝트 문서를 보면 각 프리미티브가 특정 인지 기능(주의 집중, 기억 회상, 패턴 인식 등)을 담당하도록 설계됐다.
기술적으로 흥미로운 건 "오케스트레이터가 아닌 신경 시스템"이라는 표현이다. 보통 멀티 에이전트 시스템은 중앙 제어자가 각 에이전트를 호출하고 결과를 취합하는 방식이다. 반면 이 프로젝트는 분산된 신경 노드들이 서로 자극을 주고받으며 emergent하게 결과가 도출되는 구조일 가능성이 높다. 게임 서버 아키텍처로 치면 중앙 집중형 vs 분산형 P2P 구조의 차이와 비슷하다.
실무적으로 당장 써먹을 수 있는지는 미지수다. 하지만 에이전트 설계 패턴을 연구하는 사람이라면 코드를 까보면서 인지 프리미티브를 어떻게 정의하고 조합했는지 분석해볼 만하다. 특히 복잡한 추론이 필요한 에이전트를 만들 때, 단순히 프롬프트 엔지니어링으로 때우는 게 아니라 구조적으로 접근하는 방법을 배울 수 있다.
출처: GitHub - PROVE1352/cognitive-sparks
ResuMate — 5개 LLM을 결합한 이력서 최적화 파이프라인
ResuMate는 멀티 에이전트 파이프라인을 실용적인 도구로 구현한 사례다. Claude, Gemini, Grok, Perplexity 이렇게 4개의 LLM이 이력서의 각 섹션을 분석하고, GPT-4o가 그중 최적의 개선사항을 취합해서 적용한다. 5개의 모델이 협업하는 구조다.
이게 왜 중요하냐면, 단일 LLM에 의존할 때 발생하는 편향과 환각 문제를 다각도 검증으로 완화할 수 있기 때문이다. 예를 들어 Claude는 논리적 구조에 강하고, Gemini는 팩트 체크에 능하고, Perplexity는 실시간 정보 검색에 특화됐다. 각 모델의 강점을 섹션별 분석에 활용하고, 최종 편집은 가장 범용적인 GPT-4o가 담당하는 설계가 꽤 합리적이다.
개발자 입장에서 보면 이건 일종의 앙상블 기법을 에이전트 파이프라인에 적용한 케이스다. 머신러닝에서 여러 모델의 예측을 평균내거나 투표해서 정확도를 높이는 것과 같은 원리다. 차이가 있다면 여기선 각 모델이 독립적으로 분석하고, 그 결과를 메타 모델(GPT-4o)이 취사선택한다는 점이다. 게임 서버로 치면 로드 밸런싱 + 리던던시 구조랑 비슷하다. 한 놈이 삐끗해도 다른 놈들이 커버한다.
기술적 구현을 보면, 각 LLM API를 호출하고 응답을 파싱해서 구조화된 데이터로 만드는 게 핵심일 거다. docx 파일을 다뤄야 하니까 파이썬의 python-docx 같은 라이브러리를 썼을 거고, 각 모델의 응답을 정규화하는 전처리 로직도 필요했을 거다. 비용 문제도 있다. 5개 모델을 매번 호출하면 토큰 비용이 만만치 않을 텐데, 캐싱이나 배치 처리로 최적화했는지 궁금하다.
실용적인 관점에서는 ATS(Applicant Tracking System) 최적화가 핵심 기능이다. 기업 채용 시스템이 이력서를 자동으로 파싱할 때 키워드 매칭이 중요한데, 이걸 의식해서 키워드 배치를 최적화해주는 기능이 있을 거다. 이력서 쓰는 게 귀찮은 개발자들에게는 꽤 쓸만한 도구가 될 수 있다. 물론 내가 실제로 써보진 않았지만, 코드를 뜯어보면 멀티 에이전트 파이프라인 구현의 좋은 레퍼런스가 될 거다.
앞서 언급한 cognitive-sparks가 인지 아키텍처의 이론적 접근이라면, ResuMate는 멀티 에이전트의 실용적 구현 사례다. 두 프로젝트를 함께 보면 에이전트 설계의 스펙트럼을 이해하는 데 도움이 된다.
출처: GitHub - AliHuzain/resumate
인지 프리미티브로 사고를 구조화하든, 멀티 모델로 검증을 강화하든 — 결국 핵심은 단일 모델의 한계를 넘어서는 아키텍처 설계다.