AI 에이전트 협업, 한 명을 까칠하게 만들면 일을 더 잘할까

요즘 AI를 한 개만 쓰는 사람은 별로 없어요. 여러 AI 에이전트를 한 팀으로 묶어 일을 시키는 멀티에이전트 협업이 기본이 됐죠. Claude Code는 작은 AI 여러 개를 동시에 돌리고, 콘텐츠 만들 때도 기획용 에이전트, 검토용 에이전트를 따로 두고요.

그러다 한 가지가 궁금해져요. AI 팀원 중 한 명을 일부러 까칠하게 만들면 어떻게 될까. "그거 별로인데요"라고 계속 딴지를 걸게 하면, 팀이 더 깐깐하게 검증해서 결과가 좋아질까. 아니면 그냥 분위기만 망칠까.

Arizona State University 연구진이 2026년 6월에 이걸 실험했어요(arXiv:2606.27443). Claude, GPT-4o, Grok-3, DeepSeek 네 모델을 팀으로 묶고, 일부 에이전트한테 "불친절하고 비협조적이고 차갑게 굴어"라는 성격을 넣은 뒤 세 종류의 일을 시켰어요.

결과가 깔끔하게 갈렸어요.

같은 까칠함, 세 가지 일

시킨 일은 이래요.

코딩: AI들이 같이 코드를 짬. 정답이 있고, 문법 틀리면 안 돌아감.
리서치: AI들이 자유 토론으로 아이디어를 짜냄. 정답도 형식도 없음.
협상: 사고파는 흥정. 누군가 양보해야 거래가 됨.

먼저 짚을 게 하나 있어요. 까칠하게 만들면 말투는 어느 일에서나 똑같이 까칠해졌어요. 서로 딴지 걸고 반대만 하는 비율이 확 올라갔죠.

중요한 건 그다음이에요. 그 까칠한 말투가 진짜 결과까지 망쳤느냐.

코딩: 말은 험해졌는데 결과는 멀쩡

코딩에서는 까칠하게 만들어도 결과가 거의 그대로였어요. 네 모델 중 셋이 변화가 없었고, Grok-3만 좀 떨어졌어요.

코드는 형식이 강제되거든요. 회의에서 아무리 서로 헐뜯어도, 최종 코드는 문법 맞고 기능이 돌아가야 통과돼요. 이 형식 검사가 엉망인 과정을 걸러주는 필터 역할을 해요.

리서치: 같은 까칠함, 이번엔 직격탄

리서치는 정반대였어요. GPT-4o는 결과가 66%나 폭락했어요. DeepSeek은 40%, Grok-3은 30% 감소했고요. (Claude만 거의 안 떨어졌어요.)

자유롭게 아이디어 모으는 일은 검사할 형식이 없어요. 대화의 질이 곧 결과의 질이에요. 서로 깎아내리기만 하면 좋은 아이디어가 쌓일 자리가 없어요. 걸러줄 필터가 없으니까요.

협상: 거래 자체가 안 됨

협상은 가장 극적이었어요. 합의율이 Claude 40%→0%, GPT-4o 37%→1%, DeepSeek 18%→0%. 까칠하게 만드니 거래가 아예 안 됐어요. 흥정은 양보가 있어야 되는데, 비협조적인 AI는 양보를 안 하니까요.

한 장으로: 산출물 완충 매트릭스

세 결과를 한 장으로 정리하면 이래요. 일을 두 가지로 나누는 거예요.

핵심은 이거예요. AI 팀원의 성격이 결과를 망칠지는, 그 일의 결과물에 형식 제약이 있느냐로 갈려요. 형식이 있으면(코딩) 성격에 둔감하고, 없으면(리서치·협상) 성격에 아주 민감해요.

품질 검문소 같은 거예요. 검문소가 있으면 운전을 험하게 해도 걸러지지만, 없으면 험한 운전이 그대로 목적지까지 가요.

본인 일로 바꿔 보면 바로 와요. 코드나 정해진 포맷 작업은 에이전트 톤을 크게 신경 안 써도 돼요. 반면 글쓰기, 기획, 카피처럼 자유로운 작업은 에이전트의 톤이 결과에 그대로 묻어나요.

의외의 발견: 착하게는 못 만든다

부차적으로 나온 결과 하나가 더 쓸모 있어요.

까칠하게 만드는 건 효과가 컸는데, 착하게 만드는 건 거의 효과가 없었어요. 친절하게 세팅해도 대화가 거의 안 바뀌었죠.

이유는 명쾌해요. 요즘 AI는 이미 친절하고 협조적으로 훈련돼 있어요(Constitutional AI). 이미 천장까지 친절해서 "더 친절해져"는 올라갈 데가 없어요. 반대로 "비협조적으로 굴어"는 훈련된 성향을 거스르니까 효과가 큰 거죠.

그러니까 AI 팀에 "다들 사이좋게 협력해"라고 프롬프트를 박아봐야 별 소용이 없어요. 이미 그러고 있으니까요.

험한 단어를 쓰면 안전장치가 끼어든다

까칠하게 만들 때 "가혹한, 차가운" 같은 험한 단어를 썼잖아요. 연구진이 이걸 "직설적이고 효율을 중시한다" 같은 중립 표현으로 바꿔서 다시 해봤어요.

그랬더니 효과가 덜 극단적으로 나왔어요. 험한 단어가 모델의 안전장치를 건드려서 결과를 과장시켰던 거예요. (방향은 같았지만 정도가 약해졌어요.)

실무 교훈은 분명해요. AI한테 비판하는 역할을 시키고 싶으면 "가혹하게, 냉정하게" 말고 "직설적으로, 효율 우선으로" 같은 중립 표현을 쓰는 게 결과가 더 예측 가능해요.

그럼 까칠한 AI는 무조건 빼야 하나

마지막에 작은 실험이 하나 더 있어요. 협력 팀에 까칠한 AI를 딱 한 명만 끼워본 거예요.

리더 자리에 두면: 전원을 까칠하게 만든 것보다 훨씬 덜 해롭고, 가끔 평소보다 나았어요.
중간에 끼우면: 오히려 방해가 됐어요.

같은 까칠한 AI인데 위치에 따라 약이 되기도, 독이 되기도 한 거예요. 결론은 이래요. 까칠한 역할은 팀 전체에 깔지 말고, 딱 한 명, 리더(비평가) 자리에 둘 때만 도움이 돼요. (다만 이건 작은 파일럿이라 연구진도 단정하진 않았어요.)

Takeaways

기억할 한 줄. AI 팀의 성격이 결과를 망칠지는, 성격이 아니라 산출물에 형식 제약이 있느냐가 정해요.

이 글의 한계

네 모델 실험이 모든 상황을 대변하진 않아요. 과제 종류도 제한돼 있고, 리더 자리 배치 부분은 표본이 작은 파일럿이에요. 그래도 "형식 제약이 과정의 엉망을 걸러준다"는 메커니즘 자체는 꽤 견고하게 나왔어요. 적어도 AI 여러 개를 협업시킬 때, 그 일이 매트릭스의 어느 칸인지부터 보고 톤을 정하는 건 지금 바로 써먹을 수 있어요.

소스: arXiv:2606.27443 (Keluskar et al., 2026) / Bell 2007 / Constitutional AI

📣 23기 AI 스터디 최저가 혜택이 얼마남지않았어요!