Claude·OpenClaw·Codex로 AI 에이전트 만드는 5가지 방법 — Hermes부터 멀티 에이전트까지 비교

요즘 AI 업계에서 가장 핫한 키워드는 단연 AI 에이전트,
"AI 에이전트를 직접 만들어보려고 한다"는 사람들이 크게 늘었어요
한국 사용자들이 가장 자주 검색하는 키워드는 다음 다섯입니다.

헤르메스 에이전트 (Hermes Agent)
클로드 에이전트 만들기 (Claude Code Sub-agents)
오픈클로 멀티 에이전트 (OpenClaw 멀티 에이전트)
코덱스 서브에이전트 (Codex Sub-agents)
클로드 스킬 (Claude Agent Skills)

다섯 도구 모두 "에이전트"라는 이름을 공유합니다. 그래서 자주 혼동됩니다.
어떤 것은 대화 한 번 안에서 활성화되는 가벼운 절차 자원이고, 어떤 것은 서버에 24시간 상주하며 메모리를 누적시키는 인프라급 시스템입니다. 이름이 같다고 해서 같은 작업을 위해 만들어진 도구가 아닙니다.

이 글은 다섯 도구를 같은 비교 축 위에 정렬한 뒤, 어떤 상황에 어떤 도구가 맞는지 의사결정 트리로 정리합니다. 공식 문서를 모두 직접 인용하며, 자주 헷갈리는 지점(Skill vs Sub-agent, 단일 vs 다중 에이전트)을 짚어보겠습니다.

1. 다섯 도구를 두 축에 정렬

다섯 도구는 단일 스펙트럼 위에 일렬로 놓이지 않습니다.
두 개의 독립적인 축으로 분리해야 차이가 정확히 드러납니다.

축 1: 상주 여부 — 도구가 사용자 호출 시점에만 활성화되는지, 아니면 백그라운드에서 24시간 떠 있는지
축 2: 자가 학습 여부 — 작업 결과를 메모리·스킬로 자동 누적해 다음 작업에 반영하는지

이 두 축으로 정렬하면 다음과 같습니다.

도구

상주 여부

자가 학습

한 줄 정의

Claude Agent Skills

호출 시 활성

없음

절차 지식을 자동 활성화 자원으로 추가

Claude Code Sub-agents

호출 시 활성 (CLI 세션 내)

없음

메인 컨텍스트를 보호하며 작업 위임

Codex Sub-agents

호출 시 활성 (CLI 세션 내)

없음

ChatGPT 계정 사용자의 코드 위임

OpenClaw 멀티 에이전트

24시간 상주 (Gateway)

명시적 메커니즘 없음 (수동 스킬 관리)

채널·페르소나별 격리된 에이전트

Hermes Agent

24시간 상주

자동 스킬 생성 + 지속 메모리

자가 학습형 운영 인프라

이 두 축은 도구 선택 기준의 출발점이 됩니다. "24시간 상주가 필요한가"가 첫 분기,
"자가 학습이 필요한가"가 두 번째 분기입니다. 이 질문 두 개만 답해도 후보군이 절반 이상 좁혀집니다.

2. 도구별 정의·구조·차이

클로드 코드 - 스크린샷 - 클로드 코드 - 스크린샷 - 클로드 코드 - 스크린샷 -

2.1 Claude Code 환경의 두 도구 — Skills vs Sub-agents

다섯 도구 중 가장 자주 혼동되는 두 도구를 먼저 분리하고 시작합니다. Claude Agent Skills와 Claude Code Sub-agents는 이름·파일 구조·자동 활성화 메커니즘이 거의 비슷해 보입니다. 둘 다 .md 파일에 YAML frontmatter를 두고, 둘 다 description 필드로 자동 트리거되며, 둘 다 ~/.claude/ 하위 경로에 저장됩니다.

이 표면 유사성 때문에 "결국 같은 거 아닌가"라는 인상을 받기 쉽지만, 작동 위치가 완전히 다릅니다.

구분

Claude Agent Skills

Claude Code Sub-agents

작동 위치

메인 대화 안에서 활성화

별도 컨텍스트 윈도우에서 실행

결과 처리

전체 작업이 메인 세션에서 진행

결과 요약만 메인에 반환

본질

"절차 지식"을 담는 자원

"작업을 위임받는 별도 실행 단위"

파일 위치

~/.claude/skills/<name>/SKILL.md

~/.claude/agents/<name>.md

적합 작업

PDF·Excel·PowerPoint 변환, 문서 템플릿 적용

대용량 검색·로그·리서치 격리

비용 구조

항상 메인 모델 비용

가벼운 모델(Haiku 등)로 위임 가능

선택 기준

절차를 자동화하고 싶다

메인 컨텍스트를 깨끗하게 유지하고 싶다

Skill은 Claude에게 "이 절차를 따라서 해라"라고 알려주는 가이드이고, Sub-agent는 Claude에게 "이 작업은 다른 방에서 해와라"라고 위임하는 별도 직원입니다.

2.1.1 Claude Agent Skills — 절차 지식 자원

Agent Skills는 Claude의 기능을 확장하는 모듈식 자원입니다. SKILL.md 파일과 부속 자원(스크립트·템플릿·참고 문서)으로 구성된 디렉터리 구조이며, Claude가 사용자 요청을 분석한 뒤 자동으로 활성화됩니다. 핵심 특징은 점진적 로딩(progressive disclosure) 구조입니다.

레벨

로딩 시점

토큰 비용

내용

Level 1 (메타데이터)

시작 시 항상

약 100토큰/스킬

YAML frontmatter의 name, description

Level 2 (지시문)

스킬 활성화 시

5K 토큰 미만

SKILL.md 본문

Level 3 (자원)

필요 시

사실상 무제한

번들 파일, 스크립트, 참고 문서

적합한 작업: PDF 처리, Excel/PowerPoint 자동 생성, 회사 고유 문서 템플릿, 반복되는 일회성 절차.

제약: 팀·조직 단위로 동기화되지 않습니다. claude.ai에 올린 스킬은 API에 자동 반영되지 않고, Claude Code 스킬은 ~/.claude/skills/ 또는 .claude/skills/ 경로에 별도 관리해야 합니다.

2.1.2 Claude Code Sub-agents — 별도 실행 단위

Sub-agent는 특정 유형의 작업을 처리하는 전문 AI 어시스턴트입니다. 메인 대화에서 분리된 별도 컨텍스트 윈도우에서 실행되며, 작업이 끝나면 결과 요약만 메인 컨텍스트로 돌려줍니다.

핵심 사용 시나리오는 다음과 같습니다.

메인 컨텍스트 보호: 검색 결과·로그·파일 내용처럼 한 번 읽고 다시 참조하지 않을 정보는 sub-agent 내부에서 처리
권한 제한: sub-agent별로 사용 가능한 도구를 제한해 안전성 확보
재사용: 사용자 레벨로 등록한 sub-agent는 여러 프로젝트에서 동일하게 작동
비용 제어: 단순 작업은 Haiku 같은 가벼운 모델에 위임

파일 위치는 .claude/agents/<agent-name>.md 또는 사용자 레벨 ~/.claude/agents/입니다. YAML frontmatter에 name과 description을 명시하면 Claude가 작업 내용을 보고 자동으로 위임합니다.

2.1.3 둘을 같이 쓰는 패턴

실제 운영에서는 둘이 함께 쓰일 때가 많습니다. 예를 들어 "PDF 보고서를 분석한 뒤 요약을 메인에 반환"하는 작업은 다음 흐름이 가장 효율적입니다.

Sub-agent가 별도 컨텍스트에서 PDF 파일을 통째로 로드 (메인 컨텍스트 오염 방지)
Sub-agent 안에서 PDF 처리 Skill이 자동 활성화되어 추출·분석 절차 수행
Sub-agent가 결과 요약만 메인에 반환

즉 Sub-agent는 "어디서 작업할지"를 결정하고, Skill은 "어떻게 작업할지"를 알려주는 역할입니다. 충돌하는 도구가 아니라 다른 차원에서 협력하는 도구입니다.

2.2 Codex Sub-agents

Codex CLI는 OpenAI가 공개한 로컬 코딩 에이전트입니다. Apache-2.0 라이선스, GitHub 80K+ 스타. ChatGPT 계정 또는 API 키로 인증하며, npm·Homebrew로 설치합니다. Rust 96.4%로 작성된 비교적 경량의 도구입니다.

Codex Sub-agents는 Claude Code Sub-agents와 유사한 패턴을 따릅니다. AGENTS.md 등 파일 기반 정의를 통해 특정 작업을 위임받는 구조이며, 같은 코드베이스에서 Claude Code 사용자와 Codex CLI 사용자가 같이 작업할 수 있습니다.

Claude Code와의 선택 기준:

ChatGPT Plus 사용자 → Codex CLI 추가 비용 부담 적음
Anthropic API 또는 Pro/Max 플랜 사용자 → Claude Code가 자연스러운 선택
두 도구를 동시에 쓰는 경우 — 같은 프로젝트에서 컨텍스트 공유는 자동되지 않으므로 동기화 부담 발생

2.3 OpenClaw 멀티 에이전트

OpenClaw는 자기 기기에서 실행하는 로컬 우선 AI 비서 시스템입니다. Gateway가 세션·채널·도구의 통제 평면 역할을 하며, 다음 워크스페이스 구조를 가집니다.

~/.openclaw/workspace/
├── AGENTS.md       # 에이전트 구성 및 라우팅
├── SOUL.md         # 핵심 인격·값
├── TOOLS.md        # 사용 가능한 도구 명세
└── skills/
    └── <skill>/
        └── SKILL.md

스킬은 ClawHub 레지스트리를 통해 발견·관리됩니다.

멀티 에이전트 라우팅의 핵심 개념은 다음과 같습니다. 인입 채널(WhatsApp, Telegram, Slack, Discord, 카카오톡 등 15개+ 메시징 플랫폼)을 격리된 에이전트(워크스페이스 + 에이전트별 세션)로 분기시키는 구조입니다. 즉, 한 사람이 여러 인격·역할의 에이전트를 동시에 운영할 수 있습니다.

적합한 작업:

채널별로 다른 페르소나 운영(개인 카톡은 친근, 업무 슬랙은 공식)
부서별로 다른 권한·도구 분리
그룹 채널과 개인 채널의 컨텍스트 분리(샌드박스 옵션 제공)

제약: 로컬 우선 시스템이라 사용자가 직접 기기에서 실행해야 합니다. 클라우드 SaaS처럼 가만히 두면 작동하는 구조가 아닙니다.

2.4 Hermes Agent

Hermes Agent는 Nous Research가 공개한 오픈소스 AI 에이전트 프레임워크입니다(GitHub 50K+ 스타, MIT 라이선스). 서버나 노트북에 상주하면서 자가 학습·자가 성장하는 구조를 갖습니다. 일반 챗봇·코딩 에이전트와 결이 다른 두 가지 핵심 특성을 갖습니다.

(1) 지속적 메모리 구조: 모든 대화에서 학습합니다. "메모리"는 사실(facts)을, "스킬"은 절차(procedures)를 저장합니다. 프로젝트 환경, 선호 작업 방식, 과거 성공 접근법이 세션 간에 유지됩니다.

(2) 자동 스킬 생성: 작업 완료 후 그 과정을 스킬 문서로 자동 정리합니다. 다음에 비슷한 요청이 오면 처음부터 시행착오 없이 저장된 스킬을 참조합니다. 즉 사용할수록 자체적으로 빨라지는 구조입니다.

원문(Nick Spisak)이 강조하는 핵심 사례는 1인 핀테크 창업자의 경험입니다. 처음에는 마케팅·SDR·엔지니어링·커뮤니티·브리핑 5개 에이전트를 분리 운영했으나 48시간 만에 모두 실패. 이유는 컨텍스트 비공유였습니다. 마케팅 에이전트의 톤과 SDR 아웃리치 톤이 따로 놀았고, 스킬이 중복으로 만들어졌습니다. 5개를 모두 폐기하고 Hermes 1개로 통합한 후 마케팅의 브랜드 보이스가 아웃리치에 자동 반영됐고, 커뮤니티 피드백이 다음 날 마케팅 카피에 녹아드는 복리 효과가 작동했습니다.

Claude Code와의 역할 분리 (Nick Spisak의 원문 공식):

도구

역할

Claude Code

코드 작성·테스트·커밋 — 레포 안의 모든 것

Hermes Agent

마케팅·리서치·브리핑·모니터링 — 코드 밖의 모든 것

시스템 요구사항: Linux/macOS/WSL2/Android(Termux), 64K 토큰 이상 컨텍스트의 LLM 필요. 프론티어 모델 API 권장 — 모델 선택 자체가 실패 원인 1위라고 원문에서 강조합니다.

제약: 24시간 상주 인프라이므로 단순 일회성 작업에는 과합니다. 부서·전사 단위 운영 자동화를 염두에 둔 도구입니다.

3. 상황 → 도구 의사결정 트리

다섯 도구의 차이를 정리했지만 실제 선택은 자기 상황에 매핑할 때 결정됩니다. 다음 5개 분기 질문을 순서대로 답하면 적합한 도구가 좁혀집니다.

질문 1: 24시간 백그라운드 상주가 필요한가? (메시징 채널 응대, 크론 자동화, 무인 모니터링)
├─ 예 → 질문 2
└─ 아니오 (CLI 세션 안에서 끝남) → 질문 4

질문 2: 작업 결과가 메모리·스킬로 자동 누적되어야 하는가?
├─ 예 → Hermes Agent
└─ 아니오 → 질문 3

질문 3: 한 사람이 여러 채널·페르소나를 동시 운영하는가? (개인 카톡 + 업무 슬랙 + 디스코드 등 분리)
├─ 예 → OpenClaw 멀티 에이전트
└─ 아니오 → Hermes Agent (단일 인스턴스로 통합 운영)

질문 4: 작업이 코드 안에서 끝나는가? (코드 작성·테스트·리팩터링)
├─ 예 → 질문 5
└─ 아니오 (문서 처리·일회성 절차) → Claude Agent Skills

질문 5: 메인 컨텍스트가 오염되면 곤란한가? (대용량 파일·로그·검색 결과 처리 포함)
├─ 예 → Claude Code Sub-agents 또는 Codex Sub-agents
└─ 아니오 → Claude Code/Codex 메인 세션에서 직접 처리

이 트리의 분기 근거는 도구별 공식 문서에서 직접 가져왔습니다.

분기

근거

24시간 상주 필요

OpenClaw·Hermes 모두 Gateway/서버 상주형, 그 외는 CLI 세션 기반

메모리·스킬 자동 누적

Hermes의 지속적 메모리 + 자동 스킬 생성 특성

채널·페르소나 분리

OpenClaw README의 "다중 에이전트 라우팅" 구조

코드 안/밖

Hermes 원문(Nick Spisak)의 역할 분리 공식: 코드 안 = Code 도구, 코드 밖 = Hermes/일반 자동화

메인 컨텍스트 보호

Claude Code Sub-agents 공식 문서의 "메인 대화 보호" 사용 시나리오

4. 흔한 오해와 함정

4.1 "에이전트는 많을수록 좋다"는 함정

Hermes 원문 사례가 직접 반박하는 지점입니다. 핀테크 창업자가 5개 분리 에이전트를 운영하다 48시간 만에 실패한 이유는 컨텍스트 비공유였습니다. 같은 회사·같은 사용자가 운영하는 에이전트는 같은 메모리를 공유해야 누적 효과가 납니다. 분리는 채널·페르소나·권한처럼 분명한 이유가 있을 때만 정당합니다.

기준을 단순하게 정리하면 다음과 같습니다.

분리할 이유가 분명할 때: 채널·페르소나·권한이 정말 다르면 OpenClaw의 워크스페이스 단위 라우팅 (예: 개인 카톡 ↔ 업무 슬랙은 톤·도구·권한이 모두 다름)
분리할 이유가 약할 때: Hermes 1개 인스턴스로 통합하고 스킬로 역할을 분기 (자동 스킬 생성·메모리 누적의 복리 효과를 살림)

4.2 "도구 도입 = 자동화 완성"이라는 단순화

도구는 인프라이지 결과물이 아닙니다. Hermes를 깔았다고 자동화가 끝나는 것이 아니라, 자기 워크플로우에 맞는 스킬을 누적시켜야 가치가 발생합니다. 처음 한 달은 도구가 무엇을 잘하는지 학습하는 기간이고, 두 번째 달부터 누적된 스킬·메모리가 복리 효과를 내기 시작합니다.

따라서 도구 선택만큼 중요한 것은 다음 두 가지 운영 결정입니다.

어떤 작업을 매일 위임할 것인가(메모리·스킬 누적의 시작점)
어떤 작업은 위임하지 않을 것인가(에이전트 권한 경계)

4.3 "코드 안 = Code, 코드 밖 = Hermes" 공식의 한계

Nick Spisak이 제시한 역할 분리는 명료하지만, 실제로는 두 영역이 자주 겹칩니다. 예를 들어 PR 리뷰는 코드 안 작업이지만 Slack 알림은 코드 밖입니다. GitHub Actions에서 파생되는 사건들은 양쪽에 걸쳐 있습니다.

겹치는 영역의 운영 방식은 다음과 같이 정리할 수 있습니다.

단방향 흐름: Claude Code가 작업한 결과를 Hermes가 모니터링·통지(예: 배포 완료 알림)
순환 구조: Hermes가 수집한 사용자 피드백을 Claude Code의 다음 작업 입력으로 사용

두 도구를 같은 MCP 서버에 연결하면 컨텍스트 공유가 가능해집니다.

5. Takeaways

다섯 도구의 차이를 한 줄로 정리하면 다음과 같습니다.

도구

한 줄 정리

Claude Agent Skills

Claude에 절차 지식을 자동 활성화 자원으로 추가하는 가장 가벼운 방법

Claude Code Sub-agents

메인 컨텍스트를 보호하며 코드 작업을 위임하는 별도 실행 단위

Codex Sub-agents

ChatGPT 계정 사용자에게 자연스러운 코드 위임 도구. Claude Code와 패턴 유사

OpenClaw 멀티 에이전트

24시간 상주 Gateway 위에서 채널·페르소나별로 격리된 에이전트를 운영하는 로컬 우선 인프라

Hermes Agent

24시간 상주 + 메모리·스킬 자동 누적이 합쳐진 자가 성장형 에이전트

도구 선택의 다음 행동은 자기 위치에 따라 다릅니다.

위치

다음 행동

처음 시도

Claude Agent Skills부터 시작. PDF 처리·문서 생성 같은 가벼운 절차 자동화로 도구 감각 확보

코딩 작업 위임 필요

Claude Code Sub-agents 또는 Codex Sub-agents 도입. 메인 컨텍스트 보호 구조 학습

채널·페르소나 분리 운영 (24시간 상주 + 멀티)

OpenClaw 워크스페이스 단위 라우팅 도입. 로컬 운영 부담 인정

자가 학습형 단일 에이전트 필요 (24시간 상주 + 단일)

Hermes Agent 도입. 첫 한 달은 학습 기간, 두 번째 달부터 누적 효과 검토

5개 분리 에이전트 운영 중

통합 검토. Hermes 원문 사례(48시간 실패) 참조

핵심 정리는 다음 다섯 줄입니다.

다섯 도구는 같은 "에이전트" 이름을 쓰지만 상주 여부와 자가 학습 여부라는 두 축으로 분리해야 차이가 정확해진다.
24시간 상주는 OpenClaw와 Hermes의 공통점이며, 둘의 진짜 차이는 자동 스킬 생성·메모리 누적 여부다.
"에이전트는 많을수록 좋다"는 가정은 직접 반박된 패턴이다(Hermes 원문 5→1 사례).
Skills와 Sub-agents는 컨텍스트 작동 위치가 다르다. 이름이 아니라 작동 위치로 구분해야 한다.
도구 도입 자체는 결과물이 아니라 인프라이며, 무엇을 위임할지/위임하지 않을지의 운영 결정이 진짜 작업이다.

이 글은 Anthropic 공식 문서(Claude Code Sub-agents, Agent Skills), OpenClaw GitHub README, Nous Research Hermes Agent 관련 자료(Nick Spisak X 원문 기반 한국어 정리), OpenAI Codex CLI GitHub README를 참고했습니다.

📣 D-3! 22기 스터디 판매가 종료됩니다