[ 17기 n8n 실전예제 ] 텔레그램봇 만들고 n8n 연결해 OCR 추출하 (절반의 성공)

소개

n8n을 배우며 단순한 실습을 넘어 실제 업무/생활에 적용해보자는 목표를 세웠습니다. 특히 매일 꾸준히 하고자 했던 일본어 교과서 공부 루틴에 자동화를 접목하고자 했어요.

첫 주 수업을 마치고 토요일, Google Cloud Console 설정에서 어려움을 겪었지만 결국 해결하고 응용까지 해본 사례입니다. 😄

진행 방법

전체 워크플로우 구조

흐름도의 스크린 샷
  1. Telegram Bot

    • 사용자가 일본어 교과서 사진을 전송하면 n8n에서 이를 수신합니다.

  2. HTTP Request (Google Vision API)

    • 수신한 이미지를 Vision API로 전달하여 텍스트를 추출합니다.

  3. LLM 응답 (Basic LLM Chain)

    • 추출된 텍스트를 기반으로 LLM에게 적절한 프롬프트를 전달합니다.

    • 현재는 Claude를 사용 중이며, 기본 프롬프트는 다음과 같이 설정했습니다:

Google Cloud Vision으로 인식된 일본어 텍스트를 분석하여 다음과 같이 정리해주세요:

**인식된 텍스트:**
{OCR_TEXT}

**요청사항:**
위 텍스트를 바탕으로 아래 형식에 맞춰 정리해주세요:

## 📝 단어 정리 (単語整理)
- **히라가나/가타카나**: 한자 (읽기) - 한국어 뜻
- 예: あります: 有る (あ・る) - 있다, 존재하다

## 💬 회화 예제 (会話例)
- 인식된 텍스트를 활용한 실용적인 회화 예문 3-5개
- 각 예문에 한국어 번역 포함
- 상황별 사용법 설명

## 📚 문법 포인트 (文法ポイント)
- 텍스트에서 발견된 주요 문법 요소
- 활용법과 예시
- 비슷한 표현과의 차이점
- 학습 난이도 표시 (초급/중급/고급)

## 🎯 학습 팁
- 암기해야 할 핵심 포인트
- 한국어 화자가 주의해야 할 부분
- 관련 표현이나 확장 학습 내용

**분석 기준:**
- 정확한 히라가나/가타카나 표기
- 적절한 한국어 번역
- 실용적인 예문 제공
- 문법 설명은 이해하기 쉽게
- 학습자 수준에 맞는 내용 구성

  1. 다음 단계에서 막혔네요 ㅠㅠ

    workflow executed successfully 되었다고 메세지가 떠서,
    기쁜 마음에 내용을 확인해보니..
    ocr 단계에서 일본어 추출이 실패한 듯 보여요.

    한국 텍스트가 강조된 한국 텍스트 편집기의 스크린 샷

이미지가 혹시 들어오지 않았나 싶어 확인해봅니다.

문서와 메모장을 보여주는 화면의 스크린 샷


아.. 이미지는 잘들어와 있군요.
어제 밤 부터 몇 시간, 클로드와 JSON BODY 부분 수십번 시행착오 했는데,
아직 해결방법을 못찾았네요.

사용 도구

  • n8n: 업무 자동화의 핵심 툴. 워크플로우 설계에 사용.

  • Telegram Bot: 입력 채널. 이미지를 수신.

  • Google Cloud Vision API: 이미지 속 텍스트 추출.

  • Claude: LLM 모델로 선택. 문장 해석 및 문법 설명 생성.

결과와 배운 점

시행착오

  • Google Cloud Console 인증 설정에서 시간이 꽤 걸렸습니다.

    • 서비스 계정 키 발급, 역할 부여 등 초기 장벽이 높았어요.

배운 점 & 팁

  • Telegram Bot : 처음이 어렵지 멍멍_ 님, 올마이티 님 가르침을 받으니 쉬워졌습니다.

    • BotFather , 처음 들었을땐 엄격한 아버지처럼 어려웠었는데 말이죠.

앞으로의 계획

  • 일단 절반의 성공이라, 좀 더 연구해서 읽어드린 사진을 일본공부할 내용으로 추출해볼께요.

  • LLM 응답 결과를 음성으로 변환하여 TTS 파일로 저장해 듣기 연습에도 활용하고 싶어요.

👉 이 게시글도 읽어보세요