이미지 기반 논문자료를 GPT로 정리해보기: OCR+마크다운

소개

시도하고자 했던 것과 그 이유를 알려주세요.

  • 보통 스캔된 문서나 복잡한 PPT, 보고서 자료는 텍스트화가 어렵고 구조가 복잡해 GPT의 요약 정확도도 떨어지기도 함.

  • 예전에는 OCR 성능이 좋지 않거나 유료가 많아 활용이 어려웠음.

  • 논문 작성 중 PDF나 이미지로 되어 있는 참고 자료를 효과적으로 정리하고 요약하기 위해 OCR 마크다운 문서 구조화, ChatGPT 요약 기능을 결합한 워크플로우를 시도해 봄

진행 방법

어떤 도구를 사용했고, 어떻게 활용하셨나요?

도구

활용 목적

OnlineOCR

스캔된 논문 PDF나 이미지에서 텍스트를 추출하여 가공 가능한 형태로 변환함👉 https://www.onlineocr.net

ChatGPT

OCR로 추출한 텍스트를 바탕으로 논문 요약, 핵심 문장 정리, 항목별 정리 및 인용 문장 생성

Markdown 포맷 작성 (직접 작성)

GPT가 구조를 이해하기 쉽게 제목, 소제목, 항목, 표 등으로 문서 내용을 마크다운 형식으로 재구성

alttext.ai

이미지나 그래프가 포함된 경우, 대체 텍스트를 생성해 요약과 구조화에 활용👉 https://alttext.ai

Tip: 사용한 프롬프트 전문을 꼭 포함하고, 내용을 짧게 소개해 주세요.

흰색 배경에 한국어 텍스트

결과와 배운 점

배운 점과 나만의 꿀팁을 알려주세요.

  • 스캔 논문이라도 OCR을 활용하면 GPT 기반 요약이 가능하다는 걸 체험

  • 마크다운으로 문서 구조를 정리해주면, GPT가 본문과 주장을 더 정확히 요약해 줌.

과정 중에 어떤 시행착오를 겪었나요?

  • 이미지가 많은 PDF는 OCR이 제대로 안 되는 경우가 많아서 표, 그래프를 일일이 텍스트화 해야 하기도...

도움이 필요한 부분이 있나요?

  • 복잡한 수식이 포함된 이미지 처리 시 OCR + GPT 조합의 정확도를 더 높이는 방법이 궁금

  • PDF 내 참조 문헌까지 구조화해주는 방법이 있다면 적용하고 싶음

앞으로의 계획이 있다면 들려주세요.

  • 논문 전체를 마크다운 기반으로 구조화한 후, GPT를 활용해 요약, 인용, 키워드 분류 등 학술 콘텐츠를 자동 정리하는 실험을 추가로 진행할 예정

  • 체계적 문헌고찰(SLR) 논문 작성을 위한 사전 작업으로 활용하기 위함

도움 받은 글 (옵션)

참고한 지피터스 글이나 외부 사례를 알려주세요.

https://www.onlineocr.net/

https://alttext.ai/

https://www.markdownguide.org/

1개의 답글

뉴스레터 무료 구독

👉 이 게시글도 읽어보세요