소개
콘텐츠를 만들 때마다 똑같은 9단계를 반복하고 있었습니다. 주제 선정 → 자료(논문) 검색 → 신뢰도 평가 → 쉬운 언어로 번역 → 스크립트 작성으로 이어지는 흐름이었죠.
이 과정을 AI Agent로 자동화하고 싶었는데, 단순히 챗봇 하나에 전부 맡기는 방식은 처음부터 배제했습니다. 자료를 잘못 인용하거나 근거 없이 단정하거나 톤이 흔들리면 콘텐츠의 신뢰도 자체가 무너지기 때문입니다. 증거 기반·비선동적이라는 콘텐츠 원칙을 지키면서도 반복 작업의 속도는 끌어올리는 것, 그게 목표였습니다. 그래서 단일 프롬프트가 아니라 역할이 분리된 멀티 에이전트 구조로 가기로 했습니다.
진행 방법
사용 도구: Claude Project + 9단계 확인 게이트 워크플로우
오케스트레이터 1개가 작업 전체를 지휘하고, 그 아래 3개의 전문가 에이전트가 각 영역을 담당하는 harness 구조로 설계했습니다.
논문 헌터: 주제에 맞는 자료(논문) 검색 + 신뢰도 평가 (저널 등급, 표본 크기, 이해상충). 품질의 1차 게이트키퍼.
사이언스 트랜슬레이터: 자료의 핵심 발견을 일반 독자 언어로 번역. 과장·단정 금지가 핵심 제약.
스크립트 라이터: 콘텐츠 톤에 맞는 영상 스크립트로 완성.
가장 중요한 설계 결정은 완전 자동화를 일부러 하지 않은 것입니다. 후보 자료를 가져왔을 때, 번역 결과를 스크립트로 넘기기 전 등 핵심 분기점마다 사람이 직접 확인·승인하는 게이트를 남겨뒀습니다.
결과와 배운 점
가장 큰 배움: 에이전트의 성능을 결정하는 건 도구가 아니라 맥락 주입의 질이었습니다. 같은 모델에 같은 자료를 줘도, 톤에 대한 암묵적 기준과 "이렇게 단정하지 않는다"는 판단 규칙을 얼마나 잘 명문화해서 넣느냐에 따라 결과물이 완전히 달라졌어요.
꿀팁: harness(작업을 묶는 구조)와 개별 tool을 구분해서 이해하기 시작하면 설계가 훨씬 명료해집니다. "알아서 다 하는 에이전트"가 좋은 게 아니라, 어디까지 맡기고 어디서 멈출지를 명확히 설계한 에이전트가 좋은 에이전트라는 결론에 도달했습니다.