image/pdf에서 텍스트 추출 후 내용 정리 (마무리)

소개

이미지에서 텍스트 추출해서 나에게 활용할 수 있는 사례가 뭘까? 고민하다가

그동안 교육받고 받았던 수료증, 시험보고 받았던 자격증 등을 구글 스프레드 시트로 정리해두어야겠다는 생각이 들었습니다.

이전 사례에서 1차 만들었던 버전을 지난주 토요일 스타트업실험실 해커톤에서 좀 더 디벨롭 해보기로 했습니다.

사용툴: n8n, Google Drive/sheet/Gemini

1) 기존 n8n 워크플로우에서 pdf파일과 이미지를 모두 처리하도록 switch로 분기하는 모듈을 추가하였습니다.

2) image파일일 경우는 기존 워크플로우를 그대로 두고, pdf파일일 때는 추가적인 처리를 하려고 했습니다.

다만 pdf파일을 ocr로 인식할 수 있도록 하는 방법을 몰라서 댕댕이 멍멍님께 여쭤보고 ocr과 관련된 api를 제공해주는 ocr.space라는 훌륭한 서비스를 활용하고자 합니다.

ocr.space는 api를 제공하면서도 무료플랜에서 한장짜리 pdf파일(1MB이하)은 부담없이 사용할 수 있기에 바로 가입, api key를 받았습니다.

OCR api를 받은 후 HTTP Request모듈을 통해 api를 호출할 수 있도록 하였습니다. 그런데 자격증 pdf파일을 올렸는데 영어만 읽어오는 문제가 있어, 댕댕이멍멍님께 여쭤보고 kor옵션을 추가하였습니다.

덕분에 pdf파일 또는 image파일과 상관없이 데이터를 잘 가져오는 것을 확인할 수 있었습니다.

3) 구글 드라이브에 2개 폴더(certi-unprocessed, certi-processed)를 만들고, 처리전 폴더에서 작업이 완료되면 google sheet에 업데이트 후 처리완료 폴더로 이동하도록 하여 진행전과 후를 명확히 구분할 수 있도록 하였습니다.

배운 내용을 어떻게 내가 필요한 기능으로 만들어낼 수 있는지 고민해볼 수 있는 시간이었습니다.

스타트업실험실을 끌어주시는 여행가J님과 타이칸님, 댕댕이멍멍님, 개발자F님 스터디장님들 덕분에 포기하지 않고 뭐라도 만들어보는 연습을 루틴화 할 수 있는 것 같습니다.

정말 고맙습니다

지난 토요일 스타트업실험실 해커톤에서 좌 리부티너님, 우 그이름님.

그리고 질문에 언제나 해답을 제시해주시는 댕댕이멍멍님

덕분에 실제 사례 한개 더 만들어 볼 수 있었습니다. 감사합니다!