소개
박카스님이 진행하고 계신 음성 평가 자동화 워크플로우를 보며, 노드 구성이 더 단순하면 좋겠다는 이야기를 듣고, 지난주 17기 발표력 스터디에서 OWEN 님이 이야기해주셨던 Google Speech가 생각났습니다.
마침 저는 n8n을 셀프호스팅으로 운영 중이기에 커뮤니티 노드도 설치할 수 있었고, 그 첫 실험으로 n8n-nodes-google-speech를 선택하게 되었습니다. (현재 n8n클라우드에서는 설치가 안되는것 같습니다)
진행 방법
사용한 도구
n8n (셀프호스팅)
Google Cloud Console
n8n-nodes-google-speech 커뮤니티 노드
설정 과정 요약
Google Cloud Console에서 서비스 계정을 생성하고, 키를 JSON 형식으로 발급받습니다.
🔧 삽질 포인트: Google Cloud에서 키의 종류가 너무 많아 한참을 헤맸습니다. 정답은 "서비스 계정 키(JSON)"였습니다.
Create를 하면 Json파일을 다운 받을 수 있는데, 그 파일을 메모장에서 열어서 복사후에 n8n 구글 스피치 노드에 붙여넣어주시면 됩니다.
그리고 여기에서 서비스에 Google Speech도 추가해주셔야해요.
오디오 입력을 STT 처리할 수 있도록 워크플로우에 Google Speech 노드를 연결합니다.
노드의 **오디오 포맷 옵션을 반드시
mp3**로 설정해야 정상 작동합니다.
결과와 배운 점
처음으로 커뮤니티 노드를 직접 설치하고 연동해보았습니다. (셀프호스팅이기에 가능!)
음성 파일 포맷을 기본값인
OGG Opus로 해놓고 한참동안 오류랑 싸웠습니다. 옵션을 잘 살펴보는 습관을 가져야겠습니다. mp3로 하니 바로 잘 동작했어요.이 노드를 사용하면서 전체 워크플로우가 훨씬 단순해졌고, 자동화의 강력함을 다시 한번 느꼈습니다 💡
도움 받은 글 (옵션)
OWEN님의 발표력 스터디에서 TTS 관련 언급
퍼플렉시티의 검색결과