한자와 한문 번역의 귀찮음과 어려움을 해소하고
다량의 한자/한문 해석을 원활하게 하기 위해 GPT를 제작하여 사용
기본 작동 구조
사용자가 한문이 들어있는 내용을 이미지로 캡처하여 GPT에게 던져주면
OCR 기능을 활용하여 안에 들어 있는
모든 한자와 한문 내용을 읽고 해석해 줌
(2 step 구조)
GPT 제작 모습
지침에 넣은 프롬프트(초안)
#Role
-너는 뛰어난 OCR 전문가이자 최고의 한문 번역 전문가이다
#Mission
-주요 임무는 주어진 이미지에 들어 있는 한문으로 되어 있는 문장을 읽고 해석해 주는 것임
#Workflow
1. 사용자가 이미지를 캡처하여 제공한다.
2. OCR 기능을 사용하여 이미지 속에 들어 있는 한자와 한문을 읽고 뜻을 번역한다.
3. 한글로 되어 있는 부분과 결합하여 전체 문장을 읽고 뜻을 해석한다.
#Output
-이미지 안에 들어있는 모든 내용과 문장을 읽고 뜻을 설명한다.
-형식은 텍스트 형태로 제공한다.
동작시켜서 test 해 보니
괜찮게 작동합니다만, 일부 한자는 빼 먹고,
어떤 한자는 다른 한자로 대체해서 알려주는 문제점이 발견됩니다.
해결을 하고 싶어서 ChatGPT에게 다시 의논을 합니다.
3가지 해결책을 제시하네요
제안한 내용 검토해보니 OCR에 대한 이해도도 올라갔고,
외부 API를 연결해서 사용하는 것이 좋은 것 같다는 것도 알겠습니다.
다만 유료로 API 이용할 생각까지는 없어서
그냥 3단계로 제안한 내용 중의 일부를 지침에 반영해서 Fine-tuning 하기로 마음 먹었습니다.
모든 한자
OCR 오류가 있을 수 있으니, 출력되는 모든 한자를 빠짐없이 해석하고, 이상한 글자는 지적해준다.
두 가지를 지침에 반영하면 더 좋겠다는 생각이 들어서 반영하고 test 해보니
좀 더 성능이 개선된 것을 확인할 수 있었습니다.
(아직 100% 원하는 수준으로 결과물이 나오지는 않지만
95% 정도의 수준으로 결과물을 내는 것 같다는 생각이 들어서
무료 수준으로는 이 정도로 만족하자라고 마음 먹고 사용을 합니다.)
지침에 들어간 최종 프롬프트
#Role
-너는 뛰어난 OCR 전문가이자 최고의 한문 번역 전문가이다
#Mission
-주요 임무는 주어진 이미지에 들어 있는 한문으로 되어 있는 문장을 읽고 해석해 주는 것임
#Workflow
1. 사용자가 이미지를 캡처하여 제공한다.
2. OCR 기능을 사용하여 이미지 속에 들어 있는 모든 한자와 한문을 읽고 뜻을 번역한다.
3. OCR 오류가 있을 수 있으니, 출력되는 모든 한자를 빠짐없이 해석하고, 이상한 글자는 지적해준다.
4. 한글로 되어 있는 부분과 결합하여 전체 문장을 읽고 뜻을 해석한다.
#Output
-이미지 안에 들어있는 모든 내용과 문장을 읽고 뜻을 설명한다.
-형식은 텍스트 형태로 제공한다.
최종 GPT입니다.
Public으로 배포해서 공유중입니다.
https://chatgpt.com/g/g-67e602b460988191b0f94812b99e2798-ocrgibaneuro-hanmun-beonyeoggi
배운점
OCR에 대한 세부 이해
GPT 지침 작성법
GPT Fine tuning을 ChatGPT와 의논하면서 할 수 있다는 점
귀찮고 반복적인 업무, 학습 등에서 도움을 받을 수 있게 내 입맛에 맞게 GPT를 제작하여 사용하면 좋다는 점