# Suno + Grok을 활용한 AI 코믹 뮤직비디오 제작 과정
## 소개
### 시도하고자 했던 것과 그 이유를 알려주세요.
이번에 시도한 것은 **Suno로 만든 4분 55초짜리 코믹 음악을 바탕으로 Grok 이미지/영상 생성용 프롬프트를 제작하는 작업**입니다.
노래의 주제는 **성과급을 많이 받은 하이닉스 친구에게 한턱을 내게 하려는 직장인의 처절한 부탁**입니다.
처음에는 성과급 뉴스와 주변 사람들의 이야기에 질투심과 자괴감을 느끼지만, 후반부로 갈수록 분위기가 밝아지고 결국 친구를 축하하면서 **“한턱 쏴!”** 를 외치는 신나는 회식장 분위기로 전환되는 내용입니다.
이 작업을 하려는 이유는 단순히 노래만 만드는 것이 아니라, 노래에 맞는 **캐릭터 이미지**, **뮤직비디오 장면 구성**, **10초 단위 영상 프롬프트**까지 만들어서 하나의 짧은 AI 뮤직비디오처럼 완성해보고 싶었기 때문입니다.
---
## 진행 방법
### 어떤 도구를 사용했고, 어떻게 활용하셨나요?
사용한 도구는 크게 두 가지입니다.
첫째, **Suno**를 사용해서 노래를 만들었습니다.
처음에는 처절한 피아노 발라드처럼 시작하고, 후반부에는 드럼, 베이스, 일렉기타, 신스가 추가되면서 신나는 트로트 록 / 페스티벌 팝 분위기로 전환되도록 설정했습니다.
둘째, **Grok 이미지/영상 생성**을 활용하기 위해 캐릭터별 이미지 프롬프트와 10초 단위 영상 프롬프트를 작성했습니다.
전체 영상은 4분 55초였지만, Grok에서는 10초 영상 단위로 만들기 위해 핵심 장면을 25개로 나누었습니다.
등장인물은 총 4개 그룹으로 설정했습니다.
1. 메인 주인공
2. 하이닉스에 다니는 친구
3. 주인공의 아내
4. 회사 동료 / 회식 멤버 단체
캐릭터 이미지는 영상 전체에서 반복적으로 사용해야 하므로, 모두 **눈이 크고 귀여운 캐릭터 스타일**로 통일했습니다.
현실적인 인물보다는 코믹하고 친근한 느낌이 살아나도록 구성했습니다.
---
## 사용한 Suno 프롬프트 전문
```text
Korean song, starts as a very sad dramatic piano ballad with desperate male vocal, comic jealousy and pleading mood. The singer begs his SK Hynix friend to treat him after receiving a huge performance bonus. Lyrics should feel painfully desperate at first, talking about hearing Hynix bonus news everywhere, at home from his wife and at work from coworkers, until his ears feel like bleeding.
After the first chorus, gradually add drums, bass, electric guitar, and synth. The mood transforms from sad ballad into upbeat Korean trot rock / festival pop. The second half becomes funny, energetic, and catchy, like everyone at a company dinner chanting together.
Theme: jealousy, friendship, performance bonus, asking for a dinner treat, but finally realizing he still loves his own job, home, family, and wants to love himself more.
Mood progression:
1. Intro: slow piano, desperate spoken vocal
2. Verse 1: sad emotional ballad
3. Chorus 1: pleading and pathetic
4. Verse 2: beat slowly enters
5. Chorus 2: brighter and funny
6. Bridge: warm emotional reflection about family and self-love
7. Final chorus: explosive upbeat festival chant, everyone shouting “한턱 쏴!”
Style: Korean dramatic ballad intro, emotional male vocal, humorous lyrics, gradual build-up, upbeat trot rock, festival pop, crowd chant, catchy chorus, warm ending, 3 minutes.Grok 이미지 생성을 위한 공통 스타일 프롬프트
Create a cute Korean music video character concept art. Big sparkling eyes, adorable facial expression, soft rounded face, charming cartoon-realistic style, clean colorful illustration, high detail, warm lighting, expressive comedy-drama mood, 9:16 vertical portrait, full body character design, no real company logos, no copyrighted brand logos.캐릭터 1. 메인 주인공 프롬프트
Create a cute Korean male office worker character for a comedy music video. He is in his late 40s, average build, short black hair, slightly tired but adorable face, very big expressive eyes, soft rounded cheeks, funny desperate expression. He wears a slightly wrinkled white office shirt, loosened navy tie, black slacks, and office shoes. He looks jealous, pathetic, but lovable, holding a smartphone as if waiting for his friend's message. His mood is comic desperation, like he wants to beg his friend to buy dinner. Cute cartoon-realistic style, big sparkling eyes, warm cinematic lighting, 9:16 vertical full body portrait, no real logos.짧은 설명
성과급을 받은 친구가 부러워 연락은 못 하고, 한턱을 기다리는 주인공입니다. 표정은 처절하지만 귀엽게 표현합니다.
캐릭터 2. 하이닉스 다니는 친구 프롬프트
Create a cute Korean male semiconductor company employee character for a comedy music video. He is in his late 40s, neat and confident, friendly smile, very big sparkling eyes, soft rounded face, clean short black hair. He wears a clean business casual outfit, light blue shirt, navy blazer, neat slacks, and an employee ID card without any real logo. He looks successful but kind, holding a glowing bonus envelope and a shiny credit card. His expression is proud, generous, and slightly embarrassed because everyone is asking him to treat them to dinner. Cute cartoon-realistic style, adorable character design, warm bright lighting, 9:16 vertical full body portrait, no real company logos.짧은 설명
성과급을 받은 친구입니다. 너무 얄미워 보이지 않게, 성공했지만 착하고 귀여운 이미지로 잡았습니다.
캐릭터 3. 주인공의 아내 프롬프트
Create a cute Korean wife character for a warm comedy music video. She is in her 40s, kind but sharp and realistic, big sparkling eyes, soft rounded face, gentle smile with a slightly teasing expression. She wears comfortable home clothes, a cozy cardigan, and holds a smartphone showing generic bonus news without real logos. She sits at a warm dinner table, casually talking about performance bonuses while her husband looks shocked. Cute cartoon-realistic style, warm home lighting, adorable facial expression, 9:16 vertical full body portrait, no real logos.짧은 설명
집에서 성과급 이야기를 꺼내 주인공을 더 괴롭게 만드는 인물입니다. 하지만 후반부에는 가족의 따뜻함을 보여주는 역할도 합니다.
캐릭터 4. 회사 동료 / 회식 멤버 단체 프롬프트
Create a cute group of Korean office coworkers for a comedy music video. A small group of 4 to 6 office workers, mixed men and women in their 30s to 50s, all with big sparkling eyes, rounded cute faces, expressive funny reactions. They wear office shirts, blazers, cardigans, and employee ID cards without real logos. In the first mood, they gossip excitedly about huge performance bonuses around a coffee machine. In the second mood, they happily clap and chant “한턱 쏴!” at a Korean barbecue restaurant. Cute cartoon-realistic style, cheerful group character design, warm colorful lighting, 9:16 vertical composition, no real company logos.짧은 설명
회사에서 성과급 이야기를 반복하는 동료들이며, 후반부에는 회식장에서 “한턱 쏴!” 를 떼창하는 단체 캐릭터입니다.
Grok 10초 영상 제작 방향
전체 영상은 다음과 같은 흐름으로 나누었습니다.
구간
영상 번호
분위기
처절한 발라드 인트로
01~04
어둡고 느림, 질투와 자괴감
성과급 소음 지옥
05~07
집, 회사, 뉴스에서 성과급 이야기 반복
첫 번째 애원
08~10
불쌍하고 코믹하게 부탁
비트 진입
11~14
슬픔에서 리듬감으로 변화
가족과 자기 회복
15~16
따뜻한 감정 회복
밝은 후렴 전환
17~21
웃기고 신나는 음식 판타지
회식장 떼창 피날레
22~25
축제, 떼창, 한턱 쏴 엔딩
Grok 영상용 공통 프롬프트
Vertical 9:16 Korean comedy music video style. Use cute cartoon-realistic characters with big sparkling eyes and adorable expressions. The main character is a Korean male office worker in his late 40s, tired but lovable, wearing a white shirt and loosened navy tie. The mood starts as a sad dramatic piano ballad and gradually transforms into upbeat Korean trot rock and festival pop. Cinematic lighting, expressive acting, funny but warm story, no real company logos, no copyrighted brand logos.Grok 영상용 네거티브 프롬프트
Avoid real company logos, avoid real brand names on screen, avoid distorted hands, avoid unreadable faces, avoid scary gore, avoid dark violence, avoid political content, avoid celebrity likeness. Keep it cute, funny, warm, cinematic, and music-video-like.4분짜리 영상과 노래는 킷컷으로 그냥 합쳤습니다.
별다른 기술을 안부리구요 ^^
결과와 배운 점
배운 점과 나만의 꿀팁을 알려주세요.
이번 작업을 하면서 가장 크게 배운 점은 노래 → 캐릭터 → 장면 → 영상 프롬프트 순서로 가야 결과물이 훨씬 안정적으로 나온다는 점입니다.
처음부터 바로 영상을 만들려고 하면 장면마다 인물이 달라지거나 분위기가 흔들릴 수 있습니다. 그래서 먼저 등장인물을 정하고, 각 인물의 외형과 성격을 고정한 뒤, 영상 프롬프트에 같은 캐릭터 설명을 반복해서 넣는 것이 중요했습니다.
나만의 꿀팁
캐릭터를 먼저 만든다
영상보다 캐릭터 이미지를 먼저 만들어야 전체 뮤직비디오의 통일감이 좋아집니다.공통 스타일 문장을 반복해서 넣는다
big sparkling eyes,cute cartoon-realistic style,no real logos같은 문장을 계속 넣으면 스타일이 흔들리지 않습니다.음악 분위기 전환을 영상 색감으로 표현한다
초반은 어두운 파랑/회색 톤, 중반은 따뜻한 노란 조명, 후반은 빨강/노랑 회식장 조명으로 잡으면 음악의 전환이 영상에서도 잘 보입니다.실제 회사 로고는 피한다
특정 회사 이름은 노래 가사나 콘셉트에는 들어갈 수 있지만, 이미지나 영상에서는 실제 로고를 노출하지 않고large Korean semiconductor company처럼 표현하는 것이 안전합니다.
과정 중에 어떤 시행착오를 겪었나요?
처음에는 단순히 노래 가사만 만들면 충분할 것이라고 생각했습니다. 하지만 실제로 영상을 만들려고 하니 노래 길이, 장면 수, 캐릭터 통일성 문제가 생겼습니다.
특히 4분 55초 영상을 10초 단위로 나누면 약 29개 장면이 필요하지만, Grok 작업 효율을 위해 핵심 장면만 뽑아 25개 장면으로 압축했습니다.
이 과정에서 모든 가사를 그대로 영상화하기보다는, 노래의 핵심 감정선인 질투 → 처절한 부탁 → 자기 회복 → 신나는 한턱 떼창을 중심으로 구성했습니다.
또한 처음에는 인물들이 너무 현실적으로 보일 수 있어서, 이후에는 눈이 크고 귀여운 캐릭터 스타일을 추가했습니다. 이렇게 하니 처절한 내용도 너무 무겁지 않고, 코믹한 뮤직비디오 분위기가 살아날 수 있다고 판단했습니다.
도움이 필요한 부분이 있나요?
앞으로 실제 Grok에서 이미지를 생성한 뒤, 캐릭터가 일정하게 유지되는지 확인이 필요합니다.
만약 장면마다 얼굴이 달라진다면, 캐릭터별 기준 이미지를 먼저 만든 후 그 이미지를 참조 이미지로 사용해서 영상 프롬프트를 다시 조정할 필요가 있습니다.
또한 Suno에서 나온 음악의 실제 구간별 분위기에 맞춰, 25개 영상 장면의 순서를 조금 더 세밀하게 조정하면 완성도가 올라갈 것 같습니다.
앞으로의 계획이 있다면 들려주세요.
앞으로는 다음 순서로 작업할 계획입니다.
Grok에서 4명의 캐릭터 기준 이미지를 먼저 생성
마음에 드는 캐릭터 이미지를 고정
10초짜리 영상 25개를 순서대로 생성
CapCut 또는 편집 프로그램에서 Suno 음악과 영상 싱크 맞추기
초반은 처절하게, 후반은 회식장 축제처럼 보이도록 자막과 효과음 추가
마지막 장면에 “예약은 내가, 계산은 네가” 코믹 엔딩 삽입
최종 목표는 AI 노래 + AI 캐릭터 + AI 영상 프롬프트를 결합한 짧은 코믹 뮤직비디오 완성입니다.
도움 받은 글
참고한 지피터스 글이나 외부 사례를 알려주세요.
이번 작업은 특정 외부 글을 직접 참고하기보다는, ChatGPT와 대화하면서 아이디어를 확장했습니다.
도움을 받은 부분은 다음과 같습니다.
Suno용 노래 콘셉트 정리
처절한 발라드에서 신나는 트로트 록으로 전환되는 구조 설계
가사 작성 및 후렴구 구성
4분 55초 노래를 10초 영상 단위로 나누는 장면 구성
Grok 이미지 생성을 위한 캐릭터별 프롬프트 작성
캐릭터를 귀엽고 큰 눈의 스타일로 통일하는 방향 설정
외부 사례를 추가한다면, 비슷한 참고 방향은 다음과 같습니다.
AI music video workflow examples using Suno + image generation + short video generation
Korean comedy music video references
Character consistency prompt examples for AI video generation
Cute cartoon-realistic character prompt exampleshttps://www.youtube.com/watch?v=i3IHFsKQtso