GPTs용 지식파일 만들기

현재 GPTs에 삽입 가능한 지식 파일은 20개이고, 용량은 최대 10G다.

10G면 용량은 충분한 듯 보이나 지식 파일의 용량이 10M, 아니, 1M가만 되어도 GPTs가 잘 검색하지 못한다.

이에 색인이나 목차 등이 문제가 있나 싶어서 여러 가지 방법으로 지식 파일의 형식을 바꿔보았다(저자가 사용했던 파일은 마이크로소프트 엑셀과 워드였다).

우선 엑셀 파일 부터! 단계별로 엑셀 구성을 살펴보자.

  1. 독과 영약, 도호, 법호 등의 첫 행을 병합하여 그 아래 항목이 첫 행(독, 영약, 도호 등)에 포함되도록 해보았다.

결과적으로 GPTs가 인식하지 못했다. 각각 분리하는 것보다 못하다는 걸 알게 됐다.


  1. 각 항목을 SHEET로 나누고 별도의 INDEX SHEET를 만들어 링크를 걸었다.

결론 : 조금 나아진 것 같지만 큰 차이가 없었다. 특히 문제가 되었던 점은 GPT4에 첨부파일로 넣으면 그나마 결과가 나오는데, GPTs에 넣으면 오히려 결과가 더 안 좋다는 것이다. 아마도 GPTS에 들어간 지식 파일이 많아서 그런 듯하다.


GPT4는 3개를 뽑아 달라고 했는데 2개밖에 뽑지 못한다. 반면,

같은 파일이 들어간 GPTs는 아예 해당 엑셀 파일을 열지 못한다고 나온다.

그래서 DB 형식으로 데이터를 만들어 주면 찾을 수 있겠느냐는 질문을 해보았다.

불가능하다는 답변이 돌아온다.


  1. 이번엔 지식 파일을 워드 문서로 만들어 보았다. 문서 내용은 다음과 같다.

참고로 여러 번 해 본 결과 가장 하위 항목에는 제목 분류를 안 하는 것이 데이터 검색에 유리하다는 사실을 알았다.


GPT4에 파일을 첨부해서 검색해 본 결과,

문서에 기록된 맨 상위 퇴법 3개를 정확히 찾아주는 걸 확인했다. 하지만 GPTs에 같은 파일을 넣고 검색해 본 결과,

데이터에 없는 다른 결과를 불러오는 것을 확인할 수 있었다. 물론 GPTs의 프롬프트에는 지식 파일→웹 검색→창작 순으로 설정해 놓은 상태이다.


결론: GPT4로 단일 파일에서 검색하게 하는 건 오히려 잘 되지만 GPTs에 다수의 파일을 업로드 하고 검색하게 했을 때는 좋은 결과를 얻을 수 없다.

팁1. 엑셀 파일은 목차 페이지를 별도로 만들고, 내용을 각 시트 별로 나눠 넣는 것이 검색에 더 도움이 된다.

팁2. 워드 파일은 가장 하위 항목에는 제목 지정을 안 하는 것이 검색에 더 도움이 된다.

팁3. 워드 파일은 참조>자동 목차를 생성해 놓는 것이 검색에 더 도움이 된다.


향후 목표: 파인튜닝이라는 것을 해보고 싶은데…, 할 수 있을지 모르겠다.

4
4개의 답글


👀 지피터스 AI스터디 13기 둘러보기

지피터스 채용

2천만 크리에이터의 원-소스 멀티-유즈 노하우를 함께 실행할 팀원을 찾고 있습니다!

수 백개의 AI 활용법을 발견하는

AI 스터디 13기 모집

⏰ ~10/31(목) 23:59까지

👉 이 게시글도 읽어보세요