회의나 음성 대화를 녹음해두고, 그걸 다시 들으며 회의록을 쓰는 건 꽤 번거로운 일이었어요. 그래서 "녹음파일을 특정 폴더에 넣으면 자동으로 전사해주고, 회의록까지 정리되면 얼마나 좋을까?" 하는 생각이 들었죠.
처음엔 GPT에게 물어가며 n8n + NotebookLM을 써보려고 했지만, 그 길은 삽질의 연속이었어요 😅 결국 방향을 틀어 n8n + Whisper API 조합으로 전사 자동화를 시도하게 되었습니다.
진행 방법
이번 프로젝트에 사용한 주요 도구는 다음과 같아요:
n8n: 노코드 자동화 플랫폼
Google Drive: 녹음 파일 저장용
OpenAI Whisper API: 음성 → 텍스트 전사
(선택) Slack or Email: 알림 전송
전체 흐름은 아래와 같아요:
[Google Drive Trigger]
↓ (파일 생성 감지)
[Function Node] - 파일 타입 검증
↓
[Google Drive - Download]
↓ (바이너리 데이터)
[HTTP Request - Whisper API]
↓ (전사 텍스트)
[Set Node] - 데이터 정리
↓
[Google Drive - Upload] ← 텍스트 파일 저장
↓
[Slack/Email] - 완료 알림 (선택사항)
💡 진행 중 성과:
Google Drive 클라이언트 ID 발급 및 OAuth 인증 성공
특정 폴더 트리거 설정 완료
Whisper API 요청 흐름 설계 완료
😥 현재 문제:
HTTP Request 노드 설정에서 인증 혹은 파일 업로드 형식 문제가 있어 전사 단계에서 막혀 있음
결과와 배운 점
이번 시도를 통해 확실히 느낀 건 하나예요:
기초를 쌓지 않고 고급으로 가면 100% 막힌다.
처음엔 도구를 조합하면 쉽게 될 줄 알았는데, 실제로는 인증 처리, 바이너리 데이터 다루기, API 응답 파싱 등 기본적인 개념이 빠지면 계속 막히더라고요.
그럼에도 불구하고:
OAuth 설정을 직접 해봤고
n8n에서 바이너리 데이터 흐름을 이해했고
Whisper API의 요청 구조도 경험했어요
🚀 다음 단계 계획:
HTTP 요청 부분 디버깅 (multipart/form-data 처리 재확인)
전사된 텍스트를 요약하는 GPT 워크플로우 추가하기!
n8n 이번에 처음써보지만..
다음 글에선 "전사된 텍스트 → 회의 요약 → 구글 문서 자동 정리"까지 가보고 싶네요 😎