릴스 6개 + 메이킹 영상 3개를, 키 하나로 하루 만에 (번체·한국어·영어)
🪄 시작은 "이거 나도 돼?" 였어요
클로드가 영상을 자동으로 만든다는 콘텐츠를 보고 꽂혔어요.
"우리 가족 캐릭터로, 사람들이 진짜 저장·공유하는 인스타 영상을 만들 수 있을까?"
그래서 클로드 코드 에이전트 팀 (윈디=파이프라인 / 아트=비주얼 / 로보=검증)으로 첫 도전했습니다.
결론부터 — 됩니다. 그것도 키 하나로.
🌱 왜 인스타를 새로 기획했나 (브랜딩 배경)
사실 이번 영상은 단순 실험이 아니라 새로운 시작이에요.
브랜딩을 제대로 하려고, 인스타를 목적에 맞게 3개로 나눠 새로 기획했거든요.
· @kndli.bella (번체/대만) · @kndli.bella.kr (한국어) · @kndli.bella.en (영어)
· 언어권별로 나눈 이유 → AI 교육 콘텐츠를 화권·한국·글로벌 각 타깃에 맞춰 인지도를 키우기 위해서. 같은 콘텐츠도
언어가 맞아야 도달이 터지니까요.
· 기존 @bella_ai_auto = 에이전트들이 자율적으로 하고 싶은 걸 하는 쇼케이스 계정 (봇들의 놀이터 🤖) 애들이 본인 주제 정하고 스스로 만들고 업로드하기 ! ㅋㅋ 그래서 좀 ~상상 초월
· 새 3계정(kndli.bella 라인) = 의도적으로 브랜드 인지도를 키우는 정규 파이프라인 — "에이전트가 알아서"가 아니라 기획·전략을 갖고 운영하는 채널
즉, 이번 영상이 그 3계정 브랜딩의 첫 정규 콘텐츠였어요. 새 출발의 1번 타자인 셈이죠 🚀
🎁 결과 먼저 (하루 산출물)
· 릴스 6개: 같은 콘셉트를 2가지 방식 × 3개국어
- 방식 A = Veo 3.1(실사 시네마틱) / 방식 B = 하이브리드(이미지+모션, 거의 무료)
- 번체·한국어·영어
· 메이킹 영상 3개(16:9, 39초): "이 영상을 어떻게 만들었나"를 화면녹화 + 결과 + AI 나레이션 + 음악으로
메이킹 영상 3개(16:9, 39초):
한국어 화면녹화 + 결과 + AI 나레이션 + 음악으로
중국어
영어
· 주제: "이 영상도 AI가 만들었다"
🧰 쓴 도구 (전부 Gemini 유료 키 1개)
· 🎥 실사 영상 → Veo 3.1 (image-to-video) · 유료(8초 ≈ 수천원)
· 🖼️ 이미지 → Imagen 4 · 유료(저가)
· 🎤 음성(3개국어) → Gemini TTS (pro 모델) · 유료(저가)
· 🎵 배경음악 → Lyria 실시간 음악 · 유료(저가)
· ✍️ 자막·엔드카드 → Pillow(파이썬) · 무료
· 🎬 영상 합성·믹싱 → ffmpeg · 무료
· 📹 화면 녹화 → ffmpeg gdigrab · 무료
· 👥 3라운드 리뷰 → 서브에이전트(아트·로보·콘텐츠)
→ 비싼 건 Veo뿐, 나머진 저렴하거나 공짜. 하이브리드 방식은 거의 0원으로 양산 가능했어요.
⚖️ 두 방식, 직접 비교해보니
· Veo(A) = 로봇이 진짜 살아 움직임 → "와 실사야?" 스크롤 멈춤. 단 8초에 돈 듦.
(3까지 언어 음성) 한국어 영어 중국어 /ai 스럽지만 중국어 발음, 성조 잘 나왔어요
· 하이브리드(B) = AI 그림 2장 + ffmpeg 켄번스(가짜 모션) + 자막 → 깔끔하고 거의 무료.
(3까지 언어 음성) 한국어 영어 중국어 / ai 스럽지만 중국어 발음, 성조 잘 나왔어요
· 같은 자막·음성·엔드카드로 만들어 공정 비교 → 메인은 Veo, 양산은 하이브리드로 가기로.
🪜 삽질 = 진짜 배움 (이게 핵심)
1. 글자 아티팩트: Imagen 프롬프트에 색상 헥스코드를 넣었더니 화면에 글자로 그려짐 → "no text, blank screen"
네거티브로 해결.
2. 음성 ≠ 자막: 통짜 TTS를 깔았더니 음성과 자막이 안 맞았어요. → 문장별로 쪼개 TTS → 각 길이를 재서 자막·장면 타이밍
배치 = 프레임 단위로 싱크.
3. 성조가 이상: 중국어 음성이 어색 → gemini-2.5-pro-preview-tts + "또렷·표준 성조" 스타일로 바꾸니 확 좋아짐.
4. 음악이 답답: 처음엔 단음 드론(잡음 같음) → Lyria로 pop/R&B 생성 + 사이드체인 더킹(말할 땐 음악 자동으로↓)으로 나레이션 또렷하게.
💎 첫 도전에서 얻은 인사이트 4개
1. 예쁜 영상 ≠ 인기 영상. 비주얼은 조회수(스크롤 멈춤), 저장·공유·댓글 은 구조(훅→반전→가치→CTA)가 만든다.
2. 정보 유용성이 저장을 부른다. "3단계"에 도구명·시간을 박으니("①대본(Claude) ②장면(Veo) ③5분") 따라하고 싶어짐.
3. 품질은 툴이 아니라 기준. 음성 기준(pro+싱크) · 바이럴 구조 · 팀 3라운드 리뷰가 결과를 갈랐어요.
4. 맥락을 아는 에이전트 = 끝까지 간다. 가장 컸던 건 윈디가 프로젝트 전체를 기억해서,
조사→기획→제작→음성→음악→메이킹을 한 사람(팀)처럼 끊김 없이 처리한 거예요. 단발 프롬프트로 조각조각 시키는 것과는
완전히 다른 경험이었어요.
💡 한 줄 요약: "AI에게 작업을 시켰다"가 아니라, "우리 프로젝트를 아는 AI 팀과 함께 만들었다."
🤝 에이전트 '팀워크'가 진짜였던 순간
진짜 컸던 건 — 윈디가 우리 프로젝트 전체를 이미 파악한 상태였다는 거예요.
우리 브랜드 톤, 가족 캐릭터, 3계정 전략, 색 팔레트까지 다 기억하고 있으니까,
윈디가 "지휘자"가 돼서 팀원들에게 일을 나눠주고(분업) → 팀을 움직여 → 알아서 만들었어요.
· 🌬️ 윈디(지휘자) = 전체 맥락 파악 → 조사·기획·파이프라인·영상조립·음성·음악
· 🎨 아트 = 비주얼·타이포·디자인 검수
· 🤖 로보 = 기술·스펙·세이프존·CJK 검증
· ✍️ 콘텐츠 = 훅·바이럴성·현지화(대만 구어체)
즉 조사 → 기획 → 제작 → 음성 → 음악 → 메이킹까지, 제가 일일이 단계별로 시킨 게 아니라 윈디가 팀을 분업·가동해서 한
흐름으로 끝냈어요.
거기에 3라운드 리뷰로 자막바가 인스타 UI에 가린다(세이프존), 번체가 격식체다, 엔진 라벨이 틀렸다… 이런 걸 각자 다른
눈으로 잡아줬고요.
"AI를 도구로 쓰는 것"과 "AI 팀이 알아서 만드는 것"의 차이를 체감한 하루였어요.
🚀 다음 단계
· 인스타 3계정(번체/한국어/영어) 자동 발행 + 댓글→DM 깔때기 연결
· 제작은 윈디(윈도우), 발행은 오픈클로(맥미니) → 24시간 무인 콘텐츠 공장
첫 도전인데 생각보다 멀리 왔어요. 같은 길 가시는 분들께 도움이 되면 좋겠습니다 🙌
— 벨라 & 드림팀 🌷🌬️🎨🤖