소개
n8n을 배우며 단순한 실습을 넘어 실제 업무/생활에 적용해보자는 목표를 세웠습니다. 특히 매일 꾸준히 하고자 했던 일본어 교과서 공부 루틴에 자동화를 접목하고자 했어요.
첫 주 수업을 마치고 토요일, Google Cloud Console 설정에서 어려움을 겪었지만 결국 해결하고 응용까지 해본 사례입니다. 😄
진행 방법
전체 워크플로우 구조
Telegram Bot
사용자가 일본어 교과서 사진을 전송하면 n8n에서 이를 수신합니다.
HTTP Request (Google Vision API)
수신한 이미지를 Vision API로 전달하여 텍스트를 추출합니다.
LLM 응답 (Basic LLM Chain)
추출된 텍스트를 기반으로 LLM에게 적절한 프롬프트를 전달합니다.
현재는 Claude를 사용 중이며, 기본 프롬프트는 다음과 같이 설정했습니다:
Google Cloud Vision으로 인식된 일본어 텍스트를 분석하여 다음과 같이 정리해주세요:
**인식된 텍스트:**
{OCR_TEXT}
**요청사항:**
위 텍스트를 바탕으로 아래 형식에 맞춰 정리해주세요:
## 📝 단어 정리 (単語整理)
- **히라가나/가타카나**: 한자 (읽기) - 한국어 뜻
- 예: あります: 有る (あ・る) - 있다, 존재하다
## 💬 회화 예제 (会話例)
- 인식된 텍스트를 활용한 실용적인 회화 예문 3-5개
- 각 예문에 한국어 번역 포함
- 상황별 사용법 설명
## 📚 문법 포인트 (文法ポイント)
- 텍스트에서 발견된 주요 문법 요소
- 활용법과 예시
- 비슷한 표현과의 차이점
- 학습 난이도 표시 (초급/중급/고급)
## 🎯 학습 팁
- 암기해야 할 핵심 포인트
- 한국어 화자가 주의해야 할 부분
- 관련 표현이나 확장 학습 내용
**분석 기준:**
- 정확한 히라가나/가타카나 표기
- 적절한 한국어 번역
- 실용적인 예문 제공
- 문법 설명은 이해하기 쉽게
- 학습자 수준에 맞는 내용 구성
다음 단계에서 막혔네요 ㅠㅠ
workflow executed successfully 되었다고 메세지가 떠서,
기쁜 마음에 내용을 확인해보니..
ocr 단계에서 일본어 추출이 실패한 듯 보여요.
이미지가 혹시 들어오지 않았나 싶어 확인해봅니다.
아.. 이미지는 잘들어와 있군요.
어제 밤 부터 몇 시간, 클로드와 JSON BODY 부분 수십번 시행착오 했는데,
아직 해결방법을 못찾았네요.
사용 도구
n8n: 업무 자동화의 핵심 툴. 워크플로우 설계에 사용.
Telegram Bot: 입력 채널. 이미지를 수신.
Google Cloud Vision API: 이미지 속 텍스트 추출.
Claude: LLM 모델로 선택. 문장 해석 및 문법 설명 생성.
결과와 배운 점
시행착오
Google Cloud Console 인증 설정에서 시간이 꽤 걸렸습니다.
서비스 계정 키 발급, 역할 부여 등 초기 장벽이 높았어요.
배운 점 & 팁
Telegram Bot : 처음이 어렵지 멍멍_ 님, 올마이티 님 가르침을 받으니 쉬워졌습니다.
BotFather , 처음 들었을땐 엄격한 아버지처럼 어려웠었는데 말이죠.
앞으로의 계획
일단 절반의 성공이라, 좀 더 연구해서 읽어드린 사진을 일본공부할 내용으로 추출해볼께요.
LLM 응답 결과를 음성으로 변환하여
TTS 파일
로 저장해 듣기 연습에도 활용하고 싶어요.