홍진경
🐶 AI 찐친
📚 학습반장
🚀 SNS 챌린지 달성자

이미지/영상 AI 도구 비교 (feat. 한국 삼겹살집 저녁무드)

소개

5초 쇼츠 컨셉으로 간단하게만 해보려고 했는데, 어느새 풀스택을 달리고 있네요...😄


물결님의 가이드에 따라, 키워드 3개로 같은 주제 프롬프트를 만들어서

다양한 AI 이미지 및 영상 생성 도구에 넣어서, 어떤 결과물이 나오는지 비교해봤습니다.

한국적인 환경(삼겹살, 소주, 식당 분위기 등)을 각 도구가 얼마나 잘 이해하고 표현하는지가 궁금했거든요!

진행 방법

  • 키워드 : 삼겹살집 식당, 5명 모임, 친목모임

  • 사용 프롬프트 (번역 버젼)
    밤의 북적이는 한국식 바비큐 레스토랑 내부, 숯불 그릴에 지글지글 구워지는 삼겹살이 놓인 나무 테이블, 소주잔을 굽는 다섯 명의 한국인 친구(남자 3명, 여자 2명), 따뜻한 호박색 조명, 피어오르는 김, 영화적 심도, 세밀한 텍스처, 16:9 종횡비, 영화적 컬러 그레이딩 --v 5 --ar 16:9 --q 2

  • 사용한 도구들

    • 이미지 생성: ChatGPT (DALL·E), Midjourney, Flux

    • 영상 생성: Kling, Veo3, Whisk, Midjourney (비디오 모드)

  • 비교 기준

    • 한국 문화 요소가 자연스럽게 표현되었는지 (삼겹살, 소주, 조명 등)

    • 현실성과 디테일, 이미지/영상의 분위기

    • 프롬프트에 충실한 결과이미지

결과와 배운 점

🖼 이미지 도구 결과

  • ChatGPT (DALL·E 기반)

    • 한국적 맥락 반영이 가장 뛰어났어요!

    • 삼겹살, (시키지도 않은 소주병, 소주잔이) 꽤 자연스럽게 등장했음.

    • 단점은 전체 이미지 톤이 조금 어둡게 나오는 편. 16:9 로 안 나옴.

  • Midjourney

    • 색감이 풍부하고 분위기가 살아 있어서, '밤에 모임하는 느낌'을 잘 살렸습니다.

    • 한국에서 기대하는 소주잔이 아니고, 와인잔이 등장함. (추가 묘사를 하면 될지도)

  • Flux

    • 기본적인 구도는 따라가지만, 한국적인 맥락은 다소 약하게 표현됨. 삼겹살이 아님.

  • Whisk

    • 한국적인 맥락 유사하게 반영됨.

  • 비교이미지

한 무리의 사람들이 음식과 함께 테이블에 앉아 있습니다

🎞 영상 도구 결과 (이미지 to 비디오)

  • (Midjourney to) Midjourney

    • 자동모드 : 주어진 이미지 기반으로 자연스러운 영상이 만들어짐

    • 수동모드+프롬프트 : 초단위로 카메라행동을 반영한 점은 꼼꼼한데 과한동작이 재현되기도 했음

  • (Flux to) Kling 1.6 Pro

  • (Genspark AI image to) VEO3

    (Gemini to) VEO3 : 같은 플랫폼인데 연결성이 없음. 패스함.

  • (Whisk to) Whisk

  • 비교영상

    https://youtu.be/dZhoBGGmBko?si=CvMftE4z5PFvF_LL

느낀 점 😊

  • 같은 프롬프트로 다양한 도구를 실험해보는 것, 정말 재미있고 배울 게 많았어요!

  • 도구마다 강점과 약점이 뚜렷하게 드러나서, 표현하는 장면의 맥락과 스타일에 따라서 선호하는 도구가 다를 수 있음!

  • 특히 “한국적인 문화 요소”는 여전히 AI 도구들이 학습이 부족한 부분도 많아서, 반복 실험과 커스터마이징이 필요하겠다는 생각도 들었습니다.

도움 받은 글

https://www.gpters.org/marketing/post/what-you-dont-know-grbzySNAg1K37lV


키워드 3개로 바로 시작해보셔도 좋아요! 💡 AI 도구 실험은 정말 새로운 시각을 열어줍니다 🙌

2
1개의 답글

뉴스레터 무료 구독

👉 이 게시글도 읽어보세요