삼AI세끼 나만의 비교기(유튜브 쇼츠 자동화에는 뭐가 제일 좋을까?)

소개

AI는 주로 코딩에 관한 내용만 다뤄서 이미지 제작이나 비디오 생성은 거의 모르는 상황입니다.
최근 AI 쇼츠 자동화에 대해서 관심이 생겨서,
ChatGPT, Claude, Gemini를 활용하여 쇼츠를 자동화한다고 했을 때
어떤 LLM 모델을 쓰는 것이 가장 좋을지 가볍게 테스트를 진행해봤습니다.

진행 방법

처음 목적은 각각의 LLM을 사용해서
동일한 프롬프트로

1. 소재를 검색하고,
2. 스크립트를 제작하고,
3. 관련 이미지들을 생성하여
4. 이 이미지들을 연결해서 이어 붙여서 영상까지 제작하는 것
이었습니다.

그래서 아래와 같은 동일한 프롬프트를 바탕으로
세개의 LLM에서 테스트를 진행해봤습니다.

구글의 새로운 한국 검색 엔진

  1. 최초 스크립트 생성 요청

최근 할리우드 이슈에 대해서 검색해줘.
그 중 최대 이슈가 되고 한국 사람들이 관심을 가질만한 내용을 하나 골라줘. 
해당 내용을 바탕으로 1분 길이의 유튜브 쇼츠를 제작하려고 해. 
이에 맞는 스크립트도 작성해줘.
  1. 이후 이미지 생성 요청

제공해준 내용을 바탕으로 쇼츠를 제작하려고 해.
이에 맞게 이미지 최대한 여러개 제작해주면, 이를 바탕으로 쇼츠를 제작해볼게.

한국어 텍스트가있는 앱의 스크린 샷

그런데 클로드와 Gemini가 LLM 내부에서 image 생성이 안되고,
ChatGPT는 스크립트를 바탕으로 이미지 생성을 요청했는데,
부적절한 컨텐츠라면서 이미지 생성을 중단하고
gemini는 중간에 먹통이 되는 등.
LLM 에서 자체적으로 쇼츠 제작을 끝까지 완성하는 것은
불가능했습니다.

그래서 각각의 LLM 서비스들을 바탕으로
1. 핫한 이슈를 검색하고,
2. 그 이슈 중 한국인들이 관심 가질만한 소재를 선정하고
3. 해당 소재를 바탕으로 1분 쇼츠를 위한 스크립트 작성해주는것
까지만 LLM에게 요청하였습니다.

그리고 나서는 세개의 스크립트를 바탕으로
모두 Vrew에서 바로 Text -> Video 기능을 동일하게 사용해서
유튜브 쇼츠를 완성하였습니다.

Mac에서 비디오 편집기의 스크린 샷

결과물 영상

할리우드 사인 앞의 한국 여배우

  1. ChatGPT

2. Claude

3. Gemini

결과와 배운 점

  1. 세개의 영상을 봤을 때
    어떤 영상이 가장 마음에 드시나요?
    제 마음속에는 완벽히 하나의 LLM으로 기울었습니다.
    한글 작성은 여전히, 단연코 Claude 인것 같습니다.
    이는 블로그 글 등과 같은 컨텐츠 뿐만 아니라
    Youtube 쇼츠를 위한 스크립트에서도 월등히
    Claude가 앞서는 것 같아요.

  2. Hallucination 은 세가지 LLM 모두 어마어마하게 발생합니다.
    실제로 youtube에 업로드까지 진행하기 위해서는 팩트 체크는 필수일 것 같습니다.

  3. 유튜브 쇼츠 자동화 테스트를 시작해보려고 하는데
    당연하게도 LLM 하나만 가지고는 불가능하고,
    n8n 및 다른 외부 AI 툴을 합쳐서 테스트를 해봐야 할것 같습니다.
    유튜브 쇼츠 자동화도 어느정도 테스트를 해본후 결과를 공유드리겠습니다 :)

👉 이 게시글도 읽어보세요