Gemini, 챗GPT와 Veo3로 비전보드 영상화하기

소개

짧은 프롬프트만으로 인공지능에게 결과를 요청하면 컨트롤하기 어렵다는 느낌이 들었습니다. 그래서 이번에는 제 비전 보드의 한 장면을 기반으로, 더 디테일하고 내가 원하는 스타일로 영상을 만들어보는 시도를 해봤어요. 핵심은 챗GPT와 Gemini를 활용해 더 정교한 프롬프트를 구성하고, 그것을 Veo3에 적용하는 것이었습니다.

진행 방법

먼저 비전 보드 이미지를 어떻게 영상화해야 할지 이미지 가이드를 달라고 했어요.

한국어 앱의 스크린 샷

여기서 제시된 내용을 기반으로, 챗지피티에게 5가지 스타일로 프롬프트를 작성해 달라고 요청했습니다.

(제가 편의를 위해 오디오 인식 기능을 이용하다 보니까 띄어쓰기에 오타가 있기도 합니다)

한국어 앱의 스크린 샷

이제 감을 좀 잡아서 제가 원하는 이미지를 만들기 위해 프롬프트를 아예 변경해 보았습니다.

한국어 문자 메시지의 스크린 샷

이후, "이 스타일을 영상으로 만들어줘"라는 식으로 Veo3에 적용할 수 있는 프롬프트로 재가공했습니다. 점점 더 디테일하게 수정하면서, 제가 원하는 느낌에 가까워지도록 조율했어요. 아래에 제시된 프롬프트 다섯 가지를 조합하여 첫 번째 프롬프트를 완성했어요.

한국의 한 페이지 스크린 샷

이미지는 제미나이에 가서 만들기 시작했습니다.

처음에 나온 이미지는 제가 원하는 것도 과는 살짝 달라서 편집해 달라고 했더니 한국에서는 그 기능이 지원되지 않는다고 답변이 왔어요.

남자와 여자 사이의 대화의 스크린 샷

그래서 직전에 사용했던 프롬프트를 복사해 살짝 수정하는 방식으로 이미지와 영상을 생성했습니다.

Create an image of an Asian woman aged 00:
A confident, vibrant woman wearing an elegant home dress in the morning under natural lighting  reading The Intelligent Investor and reviewing investment charts on a cozy balcony with a cup of tea and notes — serene, thoughtful atmosphere, representing wisdom in financial decisions, classy outfit, intelligent and warm look.  The balcony is located right outside a modern home office, surrounded by books on finance and a peaceful atmosphere — symbolizing wise and mindful investing, elegant and composed, warm tones.

사용한 프롬프트 예시

아래와 같이 명령을 했더니

I want to make the image into a video, so help me with creating prompts. I want to write guidelines about timeline(which lasts 8 seconds), action, and audio. I think at the end of the video, my husband, who is an asian man gently coming from behind the curtain of the home office hug behind me, would be a perfect ending.

영상 묘사 프롬프트에 대한 이런 결과를 얻었습니다.

Video Production Guidelines: "Mindful Morning"

This 8-second video will capture a serene and insightful morning routine, culminating in a warm, loving embrace. The goal is to convey wisdom in financial decisions and a peaceful, harmonious home life.

Overall Mood: Serene, thoughtful, warm, loving.
Video Title: Mindful Morning

Timeline & Action Breakdown (8 Seconds)

Timeline & Action Breakdown (8 Seconds)

* 0-0.5 Seconds: Gentle Fade In & Establishing Shot

* Action: Video gently fades in to an establishing shot of the woman on the balcony, engrossed in her book ("The Intelligent Investor") and charts. The setting is bright with natural morning light, emphasizing the cozy yet sophisticated atmosphere.

* Visual Focus: Woman, book, charts, tea cup, balcony railing, and a hint of the home office in the background.

* 0.5-3 Seconds: Focused Engagement & Subtle Gestures

* Action: The camera slightly zooms in or subtly pans to focus on the woman. She occasionally sips her tea, makes a small note, or softly taps her finger on a chart, indicating deep concentration and thoughtful review. Her expression remains calm and intelligent.

* Visual Focus: Closer shot of the woman's face and hands, highlighting her engagement with the material.

* 3-5 Seconds: Transition & Glimpse of Home Office

* Action: The camera subtly pulls back, showing more of the balcony and the connection to the modern home office. Perhaps a soft breeze rustles the notes slightly. The woman might briefly look up, a slight, knowing smile on her face, before returning to her reading. This brief moment signifies her contentment and the peace of her environment.

* Visual Focus: Balcony decor, open doors to the home office, bookshelves, overall peaceful ambiance.

* 5-7 Seconds: Husband's Approach

* Action: From the depths of the home office, behind a soft, elegant curtain or doorway, her husband (an Asian, gentle-looking man) subtly emerges. He moves quietly and gracefully towards her, his expression warm and affectionate. He approaches from behind her chair.

* Visual Focus: Husband's entrance, his gentle demeanor, the elegant home office background.

* 7-8 Seconds: Loving Embrace & Gentle Fade Out

* Action: The husband reaches the woman and gently wraps his arms around her from behind, resting his head near hers. The woman leans into the hug, a contented and loving smile on her face. The scene holds for a brief moment, then gently fades to black.

* Visual Focus: The intimate embrace, both faces showing warmth and affection.

Audio Guidelines

The audio should complement the visual narrative, enhancing the feeling of peace, intellect, and love without being distracting.

* 0-3 Seconds: Soft, Ambient Morning Sounds & Subtle Classical/Lo-Fi Music

* Sound Effects: Very subtle, distant birdsong; faint, gentle rustling of leaves (if applicable to balcony setting); soft clink of a teacup.

* Music: A very gentle, low-volume instrumental track – perhaps a calming solo piano piece, soft acoustic guitar, or a refined lo-fi beat. The music should evoke a sense of calm focus and peaceful intelligence.

* 3-5 Seconds: Music Continues, Ambient Sounds Subside Slightly

* Sound Effects: The subtle ambient sounds may lessen slightly to allow the music to take a tiny bit more presence, or remain consistent.

* Music: The instrumental music continues at a steady, calming volume.

* 5-7 Seconds: Subtle Footsteps & Music Swells Gently

* Sound Effects: Very soft, almost imperceptible footsteps as the husband approaches.

* Music: The calming instrumental music subtly swells in warmth and volume, becoming slightly more melodic, hinting at the loving interaction to come.

* 7-8 Seconds: Warm Embrace & Final Chord/Fade Out

* Sound Effects: The softest, most tender sound of a gentle hug (e.g., rustle of clothing, a soft sigh of contentment). No dialogue.

* Music: The instrumental piece resolves into a warm, harmonious final chord that gently fades out as the video fades to black, leaving a feeling of peace and love.

결과와 배운 점

단순히 "영상 만들어줘"보다, 내가 원하는 걸 명확하게 정의하고 설명할수록 AI가 더 원하는 결과를 내줬어요. ( 사실은 제가 생각한 것보다는 조금 느끼해서 수정하고 싶었지만 시간이 없었네요 ㅋ;;)

Veo3와 Gemini를 조합해서 쓰는 게 꽤 강력하다는 걸 체감했습니다.

그리고 제가 제시해준 예시 이미지에 없는 인물도 나타나게 할 수 있다는 점이 굉장히 큰 레슨런이었어요!

도움 받은 글 (옵션)

스타트업 실험실 2주차 라이브 특별 프롬프트 자료에서 몇 가지 키워드를 참고했습니다. 제이님 감사합니다!

2

뉴스레터 무료 구독

👉 이 게시글도 읽어보세요