소개
ChatGPT 의 도움을 받아서 내가 생각하는 회의록 작성 AI Agent 의 구상의 도움을 받고자 했습니다.
회의록 작성 AI Agent 의 중요 역할은 다음과 같습니다.
녹음된 회의록을 음성인식을 통해 텍스트로 만들기. 단, 언어 인식이 필요
음성인식의 오류를 수정하고 요약본 만들기
요약된 내용은 다국어로 번역하여 저장하기. 단, 번역에서는 기존 번역을 참고하여 번역할 것
진행 방법
OpenAI ChatGPT o1 을 이용해서 도움을 받았습니다. 아이디어만 얻을 예정이여서 중요 내용만 적어서 요청했습니다.
n8n 을 이용해서 회의록 관리 워크플로우를 만들고 싶어. 회의록은 녹음된 파일을 사용하고 업로드를 하면 STT 를 통해 텍스트로 만든 후 작업해야해. 텍스트는 STT 를 통해 작성되었기 때문에 회의 맥락을 확인하여서 일부 오류로 보이는 부분을 수정하는 작업을 하고 회의록 원본으로 저장해야해. 그리고 다음으로는 회의록 원본을 통해 회의의 배경, 논의 아젠다, 논의사항, Action Item 등을 요약정리해야해. 다음으로는 회의록을 영어, 한국어, 일본어 3개의 버전으로 번역해서 저장해야해. 번역할 때는 기존 번역 사항을 참고해서 번역해야해. 3개의 버전으로 번역된 회의록은 마크업으로 작성해서 md 파일로 만들었으면 해.
결과와 배운 점
ChatGPT 결과
아래는 n8n을 활용하여 오디오 파일 업로드부터 STT, 오타/오역 교정, 원본 회의록 저장, 요약, 여러 언어 번역, 번역본 마크업(md) 작성까지의 전 과정을 자동화하는 예시 워크플로우 설계입니다. 큰 그림을 먼저 잡고, 이후에 노드 구체 예시를 적어볼게요.
1. 전체적인 워크플로우 구조
파일 업로드 트리거
사용자가 녹음된 오디오 파일을 업로드하면 워크플로우를 시작합니다.
예) n8n의 Webhook Node를 활용하거나, FTP Node, Google Drive Trigger Node 등을 사용할 수 있습니다.
STT 서비스 호출
업로드된 오디오 파일을 STT API로 전달해서 텍스트로 변환합니다.
예) HTTP Request Node로 구글 클라우드 STT, 네이버 CLOVA Speech, Azure Speech 등 원하는 STT 서비스를 호출합니다.
초기 회의록 텍스트 저장
STT 결과물(텍스트)은 회의록 원본 후보로 저장해야 합니다(오류가 있을 수 있으므로).
예) DB(Node)나 Google Sheets(Node)에 임시로 저장합니다.
오류 교정(수동 확인 단계)
STT로 작성된 텍스트는 완벽하지 않을 수 있으므로, 사람이 교정하는 단계가 필요합니다.
n8n에서는 Wait / Pause 후에 수동으로 교정된 텍스트를 다시 입력받는 방식을 쓸 수도 있고, Google Docs 등을 연동해서 교정을 진행한 뒤, 교정된 결과를 다시 가져올 수도 있습니다.
교정된 최종 텍스트를 “회의록 원본”으로 다시 저장합니다.
요약(회의 배경, 아젠다, Action Item 등)
교정된 원본 텍스트를 기반으로 AI 요약(예: GPT API)을 수행합니다.
HTTP Request Node를 이용해 OpenAI의 ChatGPT API나 Azure OpenAI를 호출하여, “배경 / 논의 아젠다 / 논의사항 / Action Item” 등을 구조화해서 추출할 수 있습니다.
구조화된 요약 결과를 DB 등 원하는 저장소에 보관합니다.
기존 번역 기록 참조 & 3개 언어(영/한/일) 번역
번역을 위해서는 번역 메모리(Translation Memory)가 있다면, 이를 DB나 구글 시트, 혹은 사전에 로드한 JSON 파일 형태로 가지고 있을 수 있습니다.
번역 API(Google Translate, Papago, DeepL, Azure Translator, GPT 등)와 연동할 때, 우선 번역 메모리에 등록된 기존 번역이 있는 키워드/문장이 있는지 확인 후, 없으면 번역 API를 통해 번역을 수행합니다.
n8n에서는 이를 여러 노드로 쪼갤 수 있습니다.
요약 텍스트에서 문장 단위 분할
DB/Sheet에서 기존 번역(메모리) 매칭
매칭 안 된 문장만 번역 API 호출
최종 결과 합치기
최종적으로 영어, 한국어, 일본어 총 3가지 버전의 번역된 회의록 텍스트가 생성됩니다.
Markdown 형식 파일로 저장
번역된 각 언어별 텍스트를 Markdown 형태로 변환하고 파일(.md)로 저장합니다.
저장 방식:
n8n의 File Node로 Markdown 파일을 생성하고,
S3 Node(Amazon S3)나 FTP Node 또는 Git으로 push하는 방식으로 저장할 수 있습니다.