소개
지난 주 토요일 댕댕이멍멍님 특강에서 배운 영수증정리법을 보고
내가 이미지를 주고 정리하고 싶은 내용은 무엇이 있지? 라는 생각을 하면서 기존에 교육받았던 수료증 또는 자격증을 스프레드시트 또는 md파일로 저장하면어떨까 하는 생각을 하게 되었습니다.
이미지에서 텍스트 추출하고 정리하는 내용은 유사해서 흐름대로 따라가 보았습니다.
진행 방법
사용Tool: n8n, Google Drive/Spread Sheet/Gemini
1) 트리거 설정
구글 드라이브에 새로운 이미지(교육 수료증 또는 자격증)이 업로드되는지 확인
2) 액션
구글 드라이브에서 파일 다운로드
바이너리 코드로 AI Agent 전달
Gemini를 통해 이미지에서 텍스트 내용 추출
결과값을 정리하기 위한 Parsing 후 구조화
구조화된 결과 스프레드시트 정리 (미완)
3) pdf 파일 처리를 위한 OCR 적용 (미완)
4) n8n 프로세스 정리
구글 드라이브 트리거
파일 바이너리 다운로드
이미지, pdf 파일 일 경우 실행
텍스트 추출
첨부된 수료증 또는 자격증 파일(pdf 또는 이미지)을 분석하고, 그 파일의 **실제 내용만**을 기반으로 다음 항목을 추출해줘. **절대 네가 알고 있는 일반적인 자격증/수료증 예시나 상식을 사용하지 말고**, 오직 파일에서 직접 추출한 정보만 사용해. 파일에 포함된 내용 외의 정보는 생성하지 마. pdf파일은 이미지 또는 이미지 기반 PDF입니다. OCR 처리를 통해 텍스트를 추출하고, 해당 정보를 기반으로 다음 JSON 구조에 맞춰 결과를 출력해줘. # 출력 형식 (JSON 배열): [ { "구분": "자격증 또는 수료증 (예: 수료증)", "이름": "교육 또는 자격 제목", "시작일자": "YYYY.MM.DD", "종료일자": "YYYY.MM.DD", "발행기관": "발급 기관명", "인정시간": "숫자 (없으면 '-')" } ] # 주의사항: - 인식이 애매한 경우에도 추측하지 말고 해당 항목에 "-"를 입력해 - 다수의 과정이 하나의 파일에 있을 경우, 항목을 개별 객체로 나누어 배열에 넣어줘파싱
결과와 배운 점
어렵네요. 배웠으니까 금방 되겠지 했는데..
pdf ocr도 연결해야 하고, md파일로 저장해서 자격증과 수료증을 구분해서 정리하고, 카테고리화 하고 싶었는데.. 시간이 걸려서 여기까지만 하고 우선 업로드 하게 되었습니다.
그래도 뭐라도 시작할 수 있게 해주시는 스타트업실험실 스터디장님들께 감사드리고, 여정을 함께하는 도반을 만날 수 있어서 행복한 18기였던 것 같습니다.
도움 받은 글 (옵션)
토요일 오프모임 댕댕이멍멍님, 타이칸님 특강