김태현
김태현
Admin
🎻 루키 파트너

10만개 글자 문서 -- 그 정도로 긴 문서를 ChatGPT와 BARD 사용해서 요약하는 방법

제가 긴 문서를 요약해 보려고 이것 저것 써 보았더니 잘 안되더라구요.

  • Long text summarizer 라고 검색해서 나오는 무료 툴들은 보통 1,000자 혹은 2,000자를 넘지 못함

  • Jasper.AI에 요약기 있다고 유튜브에서 봤는데, 지금 바뀐 인터페이스에서는 기능을 찾을 수 없음

  • Wordtune, Quillbot 동작 안함


그러다가 수동으로 할 방법을 찾았습니다.

먼저 요약할 내용을 텍스트로 준비했습니다. PDF라면 텍스트 파일로 먼저 만드세요. 그런 다음에, 파일을 6,000자 단위로 쪼개 줍니다 (7,000자 까지도 가능한 것 같은데, 혹시나 해서 6,000자로 했어요).


번역된 프롬프트:


영어 원문:



다운로드 받은 파일을 보니 잘 짤려 있습니다.



그래서 각 텍스트 파일의 내용을 복사해 와서, ChatGPT에게 요약을 시켰습니다. 그런데, 너무 길다고 안됩니다. 그리고 속도도 느리고요.

그래서 BARD에게 가서 해 달라고 했습니다. 사실 위의 6,000자는 제가 BARD에게 최대한 길게 텍스트를 넣었을 때 잘 처리하는 지 살펴보면서 얻은 길이 단위입니다. BARD가 더 긴 텍스트를 받아 들이더라구요.



이걸 반복하면, 각각을 요약한 것을 얻을 수 있고, 그 결과를 연결해서 더 요약하거나 원하는 분석을 할 수 있습니다.


사실 처음에는

  • 긴 텍스트 파일을 ChatGPT의 Advanced Data Analsysis를 사용해서 1,000자 정도로 쪼갠 다음에 각 쪼갠 내용을 CSV 파일의 각 행의 첫 열(column)으로 넣어 달라고 해서 CSV 파일을 만들고

  • 그 CSV 파일을 구글 시트에서 불러온 다음, GPT() 확작앱을 사용해서 (즉, GPT API를 사용해서), 각 행의 내용을 요약하기

요렇게 시도해 봤는데요, 아쉽게도 GPT API를 구글 시트의 GPT 확장앱으로 100개 동시에 콜 하니까, 97개가 타임아웃 에러가 났었습니다. 그래서 수동으로 할 수 밖에 없었어요.


다른 분들에게도 도움이 되었으면 좋겠네요!






10
3개의 답글

👉 이 게시글도 읽어보세요