랭체인을 활용하여 K드라마 유튜브 동영상으로 한국어교육 콘텐츠 제작하기 1: 프로세스 기획하기

배경 및 목적

외국 사람들이 K 드라마를 좋아하는 점을 고려하여 K 드라마 제작사들이 유튜브에 올린 홍보용 드라마 영상 클립을 활용하여 한국어를 배우는 외국 사람을 위한 한국어교육 콘텐츠를 제작해보기로 했습니다.

참고 자료

어떤 K 드라마를 외국 사람들이 좋아하는지 구글 검색을 통해 알아보았습니다. 아래는 참고한 기사입니다.

https://www.yna.co.kr/view/AKR20240907026700005

랭체인을 이용하기 위해 아래 도서를 참고하였습니다.

  • 타무라 하루카. (2024). 랭체인 완벽 입문 (최용 역). 위키북스.

  • 서지영. (2024). 랭체인으로 LLM 기반의 AI 서비스 개발하기. 길벗.

VSCode를 본격적으로 써보기 위해 아래 책을 읽으면서 업무 효율성을 높여보았습니다.

  • 리브로웍스. (2024). 비주얼 스튜디오 코드 가이드 (김은철, 유세라 역.) 영진닷컴.

또한 지피터스의 아래 포스팅도 유용하였습니다.

활용 툴

VSCode에 랭체인 패키지를 필요한 대로 설치하였습니다.

추가적인 패키지도 설치하였습니다.

STT 부분을 보완하기 위해 Yout 사이트와 Daglo 사이트를 활용했습니다.

https://yout.com/

https://daglo.ai/

실행 과정

활용할 K 드라마 유튜브 동영상 찾기

고려사항: 인기 드라마, 5분 이내 동영상, 대화가 한국어 학습에 유용한 동영상, 드라마 제작사가 올린 동영상

동영상에서 대본 추출하기

참고사항: 대본이 제대로 추출되지 않을 경우 동영상의 오디오 부분을 내려받아 STT 서비스를 이용하여 이 오디오 파일로 텍스트를 추출함

대본에서 단어 목록과 문법 목록을 생성함

OpenAI API와 랭체인 패키지를 이용해서 단어 목록과 문법 목록을 텍스트 파일로 생성함

대본과 단어 목록과 문법 목록을 이용해서 단어 문제와 문법 문제를 생성함

고려사항: 문제의 유형을 토익 스타일로 만들어달라고 함

폴더에 있는 파일 목록의 스크린샷

결과 및 인사이트

제 수준에서 프로젝트의 프로세스가 가능하다는 것을 확인하였습니다.^^ 기획의 성과라고 생각합니다.

하지만 각 단계별로 생성되는 콘텐츠의 정확도와 완성도에서 미흡한 점이 있어 단계별로 수작업이 필요했습니다. 즉, 구현한 프로세스의 효과가 아직까지는 미흡합니다.

콘텐츠의 정확도와 완성도를 높이기 위한 방안이 필요하다는 것을 느낍니다. 두 번째 글에서는 그런 부분에 초점을 맞춰 프로젝트를 진행해보고자 합니다.

3

👉 이 게시글도 읽어보세요