에이전트 6명 만들었는데 팀이 안 된다 — 오픈소스 뜯어보고 해결한 이야기
소개
에이전트 6명을 만들었는데, 협업이 안 된다
ARIA(리서치), CODEX(개발), IRIS(기획), CREATO(설계), UXER(디자인), CRITIC(QA) — Claude Agent SDK로 6명의 AI 전문가 팀을 만들었습니다. 3D 오피스까지 구현해서 로봇 아바타가 돌아다니며 일하는 모습도 볼 수 있게 했어요.
근데 문제가 있었습니다.
에이전트를 만든다고 알아서 팀이 되는 게 아니었어요. 각 에이전트는 최근 20개 메시지만 기억하고, 다른 에이전트가 뭘 했는지 전혀 몰랐습니다. 키워드 매칭으로 에이전트를 배정하니 실제 필요와 안 맞는 경우가 많았고, "어떻게"까지 지시하지 않으면 에이전트가 멈춰버리는 일이 반복됐어요.
그래서 다른 사람들은 이 문제를 어떻게 풀었는지 궁금해졌습니다. Paperclip, CrewAI, AutoGen 같은 유명한 멀티에이전트 오픈소스를 직접 분석해보기로 했어요.
---
과정
Claude Code한테 "유명한 멀티에이전트 프로젝트 조사해줘"
먼저 "최근 인기 있는 멀티에이전트 오픈소스 조사해줘"라고 요청했더니, MetaGPT(66K stars), Paperclip(45K), DeerFlow 등 주요 프로젝트를 Stars/언어/핵심 개념으로 정리해줬습니다.
그중 3개를 골랐어요:
- Paperclip — CEO→CTO→엔지니어 조직도 기반으로 AI 회사를 운 영하는 프로젝트
- CrewAI — 역할 기반 팀 협업 프레임워크
- AutoGen — 대화 기반 멀티에이전트 + Critic 패턴
### 병렬로 분석 돌리기
"Paperclip과 CrewAI/AutoGen을 병렬로 분석해줘"라고 했더니, Claude Code가 에이전트 2개를 동시에 돌려서 각각 분석했습니다. 몇 분 지나니까 양쪽 결과가 다 나왔어요.
인상적이었던 건, 단순히 "이런 프로젝트야"로 끝나는 게 아니라 내 프로젝트 코드와 나란히 비교표를 만들어줬다는 것.
| 항목 | Paperclip | 내 프로젝트 |
|------|-----------|------------|
| 통신 방식 | 파일 기반 + JSON-RPC | 공유 맥락 파일 (JSON/MD) |
| 오케스트레이션 | CEO가 계층적 위임 | 단일 오케스트레이터 → 5 에이전트 |
| 상태 관리 | "Memento Man" — 매번 재구성 | current_status.json 실시간 갱신 |
---
결과
분석에서 끝나지 않고, 실제로 4가지를 만들었다
레퍼런스에서 아이디어를 가져와서 실제로 구현까지 했습니다:
1. 공유 맥락 시스템 (CrewAI에서 영감)
에이전트들이 프로젝트 목표(Mission), 실시간 상태(Status), 의사결정 기록(Decision) — 3계층 맥락을 공유하게 만들었어요. 매번 호출할 때마다 ~550 토큰이 자동으로 주입됩니다.
2. CRITIC 에이전트 (AutoGen에서 영감)
AutoGen의 Critic 패턴을 참고해서, 다른 에이전트가 한 작업을 검증하는 전용 QA 에이전트를 추가했어요.
3. 위임 문법 @delegate (Paperclip에서 영감)
에이전트가 스스로 다른 전문가한테 도움을 요청할 수 있는 구조를 만들었습니다. @delegate(codex): 이 데이터 파싱하는 코드 작성해줘 이런 식으로요.
4. 하트비트 체크리스트 6단계
맥락 확인 → 목표 파악 → 계획 수립 → 실행 → 기록 → 보고. 에이전트가 매번 이 순서를 따르게 해서 일관성을 확보했습니다.
Before / After
| | Before | After |
|-|--------|-------|
| 레퍼런스 분석 시간 | GitHub 레포 3개 × 반나절 = 1~2일 | 한 세션에서 수십 분 |
| 분석 깊이 | README 수준에서 멈춤 | 실제 코드 아키텍처 + 설계 패턴 |
| 산출물 | 메모장에 대충 정리 | 비교표 + 반영 포인트 + 실제 구현 |
---
배운 점
"에이전트를 만든다 ≠ 팀이 된다"
이게 이번에 얻은 가장 큰 교훈이에요.
- 공유 맥락과 협업 프로토콜이 없으면 그냥 도구 모음일 뿐. 팀워크는 설계해야 합니다.
- 예산 관리, 품질 게이트 같은 구조적 안전장치가 있어야 실무에서 쓸 수 있어요.
- 먼저 설계하고 나중에 코딩하는 게 결국 빠릅니다. 설계 적합도 98%를 찍었어요.
비개발자인 제가 GitHub 오픈소스 코드를 직접 읽고 분석한 건 아닙니다. Claude Code가 읽고, 비교하고, "이 부분을 네 프로젝트에 이렇게 적용하면 돼"까지 정리해줬어요. 덕분에 "구경"이 아니라 "적용"까지 갈 수 있었습니다.