PDF를 AI에게 학습시키기 위해선 'Chat PDF', 'Bing'등의 외부 서비스를 이용해야 했습니다.
개인적인 아쉬움은 GPT4.0의 성능을 백분 활용하지 못하고 여타 서비스를 이용해야 한다는 것이었는데
새로 업데이트 된 플러그인을 확인하던 도중 눈길을 끄는 문구가 적힌 플러그인을 발견했습니다!
ppt 자료:
사용방법은 다음과 같습니다.
개인적인 아쉬움은 GPT4.0의 성능을 백분 활용하지 못하고 여타 서비스를 이용해야 한다는 것이었는데
새로 업데이트 된 플러그인을 확인하던 도중 눈길을 끄는 문구가 적힌 플러그인을 발견했습니다!
ppt 자료:
사용방법은 다음과 같습니다.
1. 플러그인 사이트에 접속해서 pdf 파일을 업로드
아 래 창에 pdf 파일을 드래그해서 올려두면 됩니다.
(확실한 크기 제한은 모르겠지만 130페이지 분량의 보고서는 가능했고 1000페이지 분량의
문서는 업로드 실패가 발생했습니다.)
(확실한 크기 제한은 모르겠지만 130페이지 분량의 보고서는 가능했고 1000페이지 분량의
문서는 업로드 실패가 발생했습니다.)
2. 업로드한 pdf의 'dic_id'를 발급받으면 키를 복사한 뒤 GPT4.0에 붙여넣기
3. 'Chat PDF'와 하던 것과 비슷하게 GPT에게 질문하기
저는 다음과 같은 프롬프트로 GPT에게 질문했습니다.
3-1) 2023년 세계 경제 전망에 대하여 간단하게 5~6줄 정도로 설명해라.
위 질문에 GPT가 플러그인을 사용하여 PDF를 읽고 다음과 같이 대답했습니다.
3-2) 동남아, 북유럽 등 대륙의 국소적인 지역들의 전망도 설명해라.
위 질문에는 처음에 생각보다 잘 대답해서 PDF를 읽는 수준이 상당해서 원래의 GPT 성능과
결합하면 뛰어난 무기가 될거란 생각이 들었습니다.
결합하면 뛰어난 무기가 될거란 생각이 들었습니다.
허나 곧바로 문제가 발생했습니다. 플러그인 에러가 발생하며 처음 답변을 반복하다 멈추는 현상이 나타났습니다.
그리고 질문할 때 예시로 들었던 지역에 대한 답변만을 제공했습니다.
대륙의 경제 전망은 pdf에 없는 내용이라 빈칸으로 두고 1번 질문은 pdf에 존재하는 내용이라 답변을 한걸 보아 외부에서 추가적인 검색없이 파일 안에 있는 내용만을 가지고 답변한다는 것을 확인했습니다.
그리고 질문할 때 예시로 들었던 지역에 대한 답변만을 제공했습니다.
대륙의 경제 전망은 pdf에 없는 내용이라 빈칸으로 두고 1번 질문은 pdf에 존재하는 내용이라 답변을 한걸 보아 외부에서 추가적인 검색없이 파일 안에 있는 내용만을 가지고 답변한다는 것을 확인했습니다.
4. 반복 질문 학습
누락된 답변과 요구사항들을 포함한 피드백형 프롬프트를 작성하여 다시 질문을 해보았습니다. GPT :
플러그인의 사용 방식과 대답으로 보아 이 플러그인의 작동 방식은 PDF 파일을 '한계치' 분량만큼 학습한 뒤 사용자에게 답변하는 방식인것 같습니다. 약 120페이지라는 생각보다 많은 분량에 분석을 멈추고 학습한 부분에 대해서까지만 답변을 해주는 것 같습니다.
그래도 계속 'keep going'을 반복하며 프롬프트를 입력한 결과 원하는 대답에 도달할 수 있었습니다.
플러그인의 사용 방식과 대답으로 보아 이 플러그인의 작동 방식은 PDF 파일을 '한계치' 분량만큼 학습한 뒤 사용자에게 답변하는 방식인것 같습니다. 약 120페이지라는 생각보다 많은 분량에 분석을 멈추고 학습한 부분에 대해서까지만 답변을 해주는 것 같습니다.
그래도 계속 'keep going'을 반복하며 프롬프트를 입력한 결과 원하는 대답에 도달할 수 있었습니다.
Chat PDF에서도 자주 사용했던 질문 만들기와 그 답변까지 잘 수행해냈고 나아가 'O,X'퀴즈 만들기까지 시도해보았는데 성공적이었습니다. 120페이지 분량의 파일에서는 약간씩 오류가 발생하지만 학습한 부분에 대해서는 확실하게 대답해주는 모습을 확인할 수 있었습니다. 이보다 적은 몇십 페이지 분량의 pdf 파일에 대해서는 더 뛰어난 퍼포먼스를 보일 것 같습니다.
요약
요약
- 'Ask Your PDF' 플러그인을 통해 GPT에게 PDF 학습을 시키는 것이 가능하다.
(약 100페이지 내외 분량이 적절해보임) - 파일의 양이 많으면 플러그인 오류를 일으키며 답변을 작성하는 과정에서 pending이 발생한다.
- PDF에 없는 내용은 답변을 하지 않는 것으로 보아 외부 검색을 이용하지 않는 듯해보인다.
- 파일과 관련된 내용을 요약하는 능력이 뛰어나고 질문도 만드는 것으로 보아 GPT 내부에서 PDF를 읽고 쓰기에 충분히 좋은 수준.
- 아직은 'Chat PDF'를 능가한다고 하기는 애매하지만 PDF를 읽고 대답하는 능력은 확실히 향상된 모습이고, 추가적인 호환성 업데이트가 이루어진다면 더욱 기대해 볼만하다.