소개
타이핑이 아니라, 음성으로 생각을 말하고 기록하고픈 욕구는 누구나 있습니다. 그리고 이미 AI 시대에 이 작업을 자동화 할 수 있는 워크플로우와 앱들, 아이폰 단축어, 플라우드 노트와 같은 기기들도 있고요.
그러나 저는 아주 간편하게 안드로이드폰도 차별없이(?) 언제 어디서든 녹음하고 내 노션에 혹은 옵시디언에 저장하고 싶었죠~
그래서 간단하게 혼자서 사용할 자동화 서비스가 웹에 배포하는 웹서비스까지 빌드업이 될지 몰랐;;;;
진행 방법
🛠 사용한 도구 및 기술 스택
초기 개발: Claude Desktop, Playwright-stealth
중기 리팩토링: Claude Code (Pro 요금제) + Rails 8.0.2
인프라: Docker, Digital Ocean (6달러/월)
백엔드: FastAPI → Ruby on Rails (리팩토링)
프론트엔드: HTML, JS, CSS
🎯 워크플로우 설계
웹앱 접속 → 실시간 음성 녹음 or 파일 업로드
Whisper API로 음성 텍스트 변환
GPT-4o-mini로 요약 및 메타 정보 생성
구조화된 데이터 → Notion DB에 저장
진행 순서
아이디어 구상 및 최초 단순 웹버전 구현 : 처음 에는 클로드 데스크톱에서 작업하고 바이브코딩 프로젝트를 만들고 MCP를 붙였습니다.
Desktop commmander : 터미널
playwright-stealth : 테스트, 자동화
cotext7 : 최신 문서 레퍼런스
파이썬 (벡엔드) + HTML + JS + CSS (프론트) 사용
단순한 웹사이트가 아니라, 요약하는 간단한 벡엔드가 필요했다. Python 기반 FastAPI 프로젝트를 구축 : FastAPI 뭔지 이번에 처음 알게 됨
사용성을 위해 간단한 프론트 uI 가 필요 : HTML 의 간단한 바이브코딩은 쉽게 구축 가능, 잘못된 부분은 캡쳐 떠서 수정해줘 신공 사용!!