GPT로 목소리 만드는 법

원래는 축구 해설을 자동으로 나오게 하는 프로그램을 만들려고 했었어요.

근데 금방 끝날 거 같지가 않고 서비스 사용법도 배울 겸 글을 입력하면 목소리를 만드는 TTS (text_to_speech) 모델을 간단하게 만들어 봤습니다.

사실 너무 간단하고 별거 없어서 보여드리기도 민망한 내용이지만,

GPT를 통해서 내가 알지 못하는 것을 빠르게 학습할 수 있다는 점을 보여드릴 수 있다면 좋을 거 같아요.

그리고 'AI로 음악 만들기' 방에서 다들 멜로디나 가사를 만드시는 거 같아서 목소리를 만들 수 있다면 더 신선할 거 같았어요.

제가 3년 전에 코딩을 공부했을 때는 오류나 모르는 거 하나하나 영어로 구글에 찾아봤어야 했어요.근데, 지금은 GPT로 코딩을 할 때 어떤 오류가 있는지, 어떤 과정을 거쳐야 하는지 파악하기 엄청 쉬워진 거 같아요.

사실 코딩은 거의 다 까먹어서 처음 해보는 거랑 비슷하다고 보시면 좋을 거 같아요.



제가 직접 TTS 모델을 만들지 않고 이미 자연스러운 목소리를 학습한 모델의 API를 가져오는 방법입니다.


처음에는 축구 해설을 인공지능으로 만들려고 했었어요.



그러다가 Cloud 서비스에 대해서 알게 되었고



구글 cloud console의 AI 서비스를 사용해보기로 했어요.




이게 구글 클라우드 서비스인데, 유저들이 사용하기 쉽게 미리 학습된 모델이나 AI 서비스들을 제공해요.


이렇게 윈도우 쓰는데 리눅스랑 맥에서 쓰는 코드를 주는 상황에서는 윈도우에서 쓰는 코드를 달라고 하면 됩니다.
위는 자바스크립트 코드였고 저는 파이썬으로 다시 달라고 해봤어요.


그리고 모르는 거 있으면 그냥 하나하나 다 물어보면 됩니다.



구글 cloud console에서 준 코드를 사용했어요.

Key는 개인정보라서 잘랐습니다.



다들 저보다 잘 아시겠지만 오류가 생기면 그 오류 그대로 복사해서 GPT에게 물어보는 것만으로도 잘 해결되는 경우도 있어요.


오류가 나오면 그냥 전부 복사해서 물어봤어요.


GPT가 위 대화 내용을 까먹고 저도 기억이 희미해지면 위 내용을 정리할 수도 있어요.

원래 정말 간단해야 하는데, 뭔가 자꾸 문제가 생겼습니다.



파이썬이랑 CMD 사용법도 다 까먹어서 많이 헤맸어요


이건 세 번의 수정을 거쳐서 GPT가 만들어준 코드에요.




그리고 나서도 자꾸 파일 관련 문제가 생겼어요.


그렇게 계속 하다가 결국 문제를 일으키는 거를 찾았어요.
파이썬 설치 경로에 문제가 있었어요. 그래서 다시 삭제하고 설치했더니 오류가 나지 않더라고요.

파이썬 사용법도 그냥 예시 코드를 하나 만들어서 배웠어요.
저는 1+1이랑 코드를 만들어서 2라는 결과를 도출하게 했습니다.


같은 방식으로 TTS python 코드도 똑같이 작동하게 했어요.


그렇게 오류랑 사용법 정말 하나부터 열까지 GPT에게 다 물어보고 TTS 프로그램을 만들었어요.



그 원래 이렇게 복잡한 일이 전혀 아닌데, 아무것도 몰랐고, 또 파이썬 경로 문제랑 겹쳐서 많이 헤맸어요.
결국 텍스트를 가지고 Google Cloud Console에서 TTS API를 가져와서 텍스트를 집어넣으면 목소리가 나오는 프로그램을 만들었습니다.


결과는 다음과 같아요.

/

output4.mp3

내용은 지피터스는 창업가들을 위한 멋진 커뮤니티이고, 함께해서 좋다는 뜻입니다.


사실 음악은 아니지만, GCC와 GPT를 사용해서 목소리를 생성할 수 있다는 것과, 문제를 해결하면서 새로운 기술들을 배울 수 있다는 것을 보여드리고 싶었어요. 🙃

3
2개의 답글

(채용) 유튜브 PD, 마케터, AI엔지니어, 디자이너

지피터스의 콘텐츠 플라이휠로 고속 성장할 팀원을 찾습니다!

👉 이 게시글도 읽어보세요