인프런(Inflearn), 패스트 캠퍼스(Fast Campus), 클래스 101(Class 101) 등의 온라인 강의 사이트에서는 영상 아래에 자막은 제공해도, 유데미(Udemy) 처럼 대본까지는 제공하지 않는 경우가 대부분입니다.
이런 경우 브라우저의 녹음 기능을 이용한 대본 생성을 생각해볼 수 있습니다. 오늘 소개 드리는 두 방법 역시 녹음 기능을 활용하는 것입니다. 하지만 아쉽게도 유료기능이라 지출이 필요하니, 예산과 향후 활용에 따라 구매를 고려하시기 바랍니다.
오늘 설명드릴 앱은 Whisper Transcription 입니다. 위의 Slid가 윈도우에서만 사용 가능하다면, 이번 방법은 맥북에서만 사용 가능합니다. 저는 Macbook Pro M1(16GB)를 사용하여 대본이 없는 경우 대본을 만들어 사용해왔습니다.
최근 생겨난 Whisper Transcription는 OpenAI에서 발표한 Whisper라는 딥러닝 모델을 사용합니다. 이를 맥북에서 오프라인으로 동작시키기 때문에 인터넷 연결이 없이도 동작 가능하다는 장점이 있습니다.
연간 구독은(Year Subscription) $17.99, 평생 사용(Whisper Pro)는 $39.99 로 저렴하진 않지만 저는 잘 사용하고 있습니다.
처음 프로그램을 켰을 때 이와 같이 모델을 고르도록 하게 되어있습니다. 향후 메인 화면에서 Manage Models에 가보시면 같은 화면을 볼 수 있습니다.
저희는 한국어 강의를 들을 것이기 때문에, 저희가 자주 쓰게 될 모델은 Multiple Language 모델입니다. 저는 Large 모델, Large V3 모델을 다운받아 사용했습니다.
만약 영어 강의인 경우 Medium을 사용해도 충분한 정확도를 보입니다.
하단의 Input Language는 Auto로 해도 됩니다. 저도 굳이 한국어로 설정해서 쓰진 않았습니다. Quality에 따라 사용할 모델이 달라지며, 큰 모델을 사용할 수록 더 높은 정확도를 보입니다.
인터넷 강의를 듣는다면 Record App Audio를 누르고
Chrome 브라우저를 선택해서 Chrome에서 나오는 오디오만 캡쳐할 수 있도록 합니다. All System Audio를 사용할 수도 있지만, 카톡등의 알림이 오디오 녹음에 방해가 될 수도 있습니다. "Record Google Chrome" 버튼을 누르고 원하는 강의의 녹음을 시작합니다. 한 번 녹음을 했다면 녹음파일이 생성되며, 나중에 이 녹음파일로 다른 모델을 적용해볼수도 있습니다.
녹음 중 화면입니다. 녹음이 다 되었다면 Stop Recording을 눌러줍니다.
하단의 Transcribe recording을 눌러 번역을 시작합니다. 대본을 만드는데 약간 시간이 필요합니다.
강사에 따라 다르지만, 정확한 발음을 가지고 계시다면 대부분 큰 문제 없이 대본을 볼 수 있는 수준입니다. 저는 주로 1.5배속으로 녹음하는데, 큰 퀄리티의 저하없이 비교적 빠르게 대본을 만들 수 있습니다. 단, 2배속 오디오는 대본을 잘 못만드는 것 같습니다.
주의해야할 점은 다음과 같습니다.
1. 강의 중간에 오디오가 비는 경우 잘 안되는 때가 있습니다.
2. Large V3가 더 나은 정확도와 퀄리티의 대본을 만들어주지만, 반복되는 문자를 뱉는 문제가 간혹 있습니다.
3. 한국어로 이루어지는 강의 중간에 영어를 많이 쓰신다면, 퀄리티의 저하가 있을 수 있습니다.
다음 시간에는 이렇게 만들어진 스크립트를 어떻게 다듬을 수 있는지 알아보는 시간을 갖겠습니다.
해당 글은 블로그에서 먼저 작성되었습니다. 블로그에는 추가로 Windows에서도 쓸 수 있는 Slid에 대한 설명이 간략하게 되어있습니다.