PDF 안의 이미지 글자를 읽는 Claude 비서 만들기 (OCR)
를 만들어 봤습니다.
저는 한자로 된 전문서적을
편하게 데이터화 하고 싶은 욕망이 있습니다.
그걸로 간이 RAG를 구축하면
전공지식 활용도가 엄청 올라가고
제 2의 뇌로 활용할 수 있을 것 같았거든요!
근데 한자책을 스캔해서 ocr 하자니까
기존 프로그램이 너무 비싼데
체험판 돌려보니 결과물도 그냥 그래서..
스레드에 푸념했다가
구글클라우드 vision API 라는 존재를 알게 되었지만
어 역시 실제로 활용하는 건
생각보다 어려웠고 포기하고 있었습니다.
그리고 이번에 지피터스에 와서
MCP 특강을 들으면서 그 존재를 알게 되었습니다.
이거라면.. 어쩌면 해볼만 할지도 모르겠다 싶어서
일단 테스트부터 해보자는 마음으로
MCP만들기에 도전해봤습니다.