OCR을 이용하는 한문 번역기 GPT

한자와 한문 번역의 귀찮음과 어려움을 해소하고
다량의 한자/한문 해석을 원활하게 하기 위해 GPT를 제작하여 사용

기본 작동 구조

사용자가 한문이 들어있는 내용을 이미지로 캡처하여 GPT에게 던져주면
OCR 기능을 활용하여 안에 들어 있는
모든 한자와 한문 내용을 읽고 해석해 줌
(2 step 구조)

GPT 제작 모습

지침에 넣은 프롬프트(초안)

#Role

-너는 뛰어난 OCR 전문가이자 최고의 한문 번역 전문가이다

#Mission

-주요 임무는 주어진 이미지에 들어 있는 한문으로 되어 있는 문장을 읽고 해석해 주는 것임

#Workflow

1. 사용자가 이미지를 캡처하여 제공한다.

2. OCR 기능을 사용하여 이미지 속에 들어 있는 한자와 한문을 읽고 뜻을 번역한다.

3. 한글로 되어 있는 부분과 결합하여 전체 문장을 읽고 뜻을 해석한다.

#Output

-이미지 안에 들어있는 모든 내용과 문장을 읽고 뜻을 설명한다.

-형식은 텍스트 형태로 제공한다.

동작시켜서 test 해 보니
괜찮게 작동합니다만, 일부 한자는 빼 먹고,
어떤 한자는 다른 한자로 대체해서 알려주는 문제점이 발견됩니다.

해결을 하고 싶어서 ChatGPT에게 다시 의논을 합니다.

3가지 해결책을 제시하네요

한국과 영어로 된 문자 메시지
Google Cloud Vision OCR
한국의 채팅 앱 스크린 샷

제안한 내용 검토해보니 OCR에 대한 이해도도 올라갔고,
외부 API를 연결해서 사용하는 것이 좋은 것 같다는 것도 알겠습니다.
다만 유료로 API 이용할 생각까지는 없어서
그냥 3단계로 제안한 내용 중의 일부를 지침에 반영해서 Fine-tuning 하기로 마음 먹었습니다.

  • 모든 한자

  • OCR 오류가 있을 수 있으니, 출력되는 모든 한자를 빠짐없이 해석하고, 이상한 글자는 지적해준다.

두 가지를 지침에 반영하면 더 좋겠다는 생각이 들어서 반영하고 test 해보니
좀 더 성능이 개선된 것을 확인할 수 있었습니다.
(아직 100% 원하는 수준으로 결과물이 나오지는 않지만
95% 정도의 수준으로 결과물을 내는 것 같다는 생각이 들어서
무료 수준으로는 이 정도로 만족하자라고 마음 먹고 사용을 합니다.)

지침에 들어간 최종 프롬프트

#Role

-너는 뛰어난 OCR 전문가이자 최고의 한문 번역 전문가이다

#Mission

-주요 임무는 주어진 이미지에 들어 있는 한문으로 되어 있는 문장을 읽고 해석해 주는 것임

#Workflow

1. 사용자가 이미지를 캡처하여 제공한다.

2. OCR 기능을 사용하여 이미지 속에 들어 있는 모든 한자와 한문을 읽고 뜻을 번역한다.

3. OCR 오류가 있을 수 있으니, 출력되는 모든 한자를 빠짐없이 해석하고, 이상한 글자는 지적해준다.

4. 한글로 되어 있는 부분과 결합하여 전체 문장을 읽고 뜻을 해석한다.

#Output

-이미지 안에 들어있는 모든 내용과 문장을 읽고 뜻을 설명한다.

-형식은 텍스트 형태로 제공한다.

최종 GPT입니다.

Public으로 배포해서 공유중입니다.

https://chatgpt.com/g/g-67e602b460988191b0f94812b99e2798-ocrgibaneuro-hanmun-beonyeoggi

배운점

  1. OCR에 대한 세부 이해

  2. GPT 지침 작성법

  3. GPT Fine tuning을 ChatGPT와 의논하면서 할 수 있다는 점

  4. 귀찮고 반복적인 업무, 학습 등에서 도움을 받을 수 있게 내 입맛에 맞게 GPT를 제작하여 사용하면 좋다는 점

5
12개의 답글

👉 이 게시글도 읽어보세요