보도자료 PDF 29개, 무료 로컬 LLM으로 자동 요약해서 옵시디언에 정리한 썰

한줄 요약

보도자료 PDF를 하나씩 열어서 읽고 정리하는 게 너무 귀찮아서, Claude Code + Ollama(무료 로컬 LLM)로 자동화했더니 29개 PDF가 한 번에 정리됨


이런 분들께 도움돼요

  • PDF 문서를 자주 읽고 정리해야 하는 분

  • 옵시디언에 자료를 체계적으로 정리하고 싶은 분

  • API 비용 없이 LLM을 활용하고 싶은 분

  • Claude Code로 실제 자동화를 만들어보고 싶은 분


소개: 시도하고자 했던 것과 그 이유

문제 상황

최근 정부기관의 보도자료를 29개 받아서 읽고 정리해야하는 일이 있었습니다. (너무 귀찮았어요.):

  1. PDF를 하나씩 열어서 읽고

  2. 핵심 내용을 파악하고

  3. 모르는 내용은 제가 이해할 수 있게 알아보고

  4. 내용을 쉽게 정리해서 옵시디언에 저장

전 과정이 너무 귀찮았습니다. 특히 제 전문 분야도 아닌 부분에서의 보도자료를 이해하고 정리하는건 정말 귀찮았어요.

목표

  • 29개 PDF를 자동으로 요약

  • 각 요약에 핵심내용 + 쉬운설명 + 파급효과 + 태그 포함

  • 옵시디언 노트로 자동 저장

  • API 비용 0원으로 해결


진행 방법: 어떤 도구를 사용했고, 어떻게 활용했나요?

사용한 도구

도구

역할

Claude Code

자동화 스크립트 개발 파트너

/clarify 명령어

요구사항 명확화 (6가지 질문)

pdfplumber

PDF에서 텍스트 추출

Ollama (qwen2.5:7b)

로컬 무료 LLM으로 요약 생성

Python

자동화 스크립트

진행 과정

1단계: /clarify로 요구사항 정리

Claude Code의 /clarify 명령어로 6가지 질문에 답하면서 뭘 만들어야 할지 명확히 했습니다:

  • 빈도: 월 1-2회

  • 소요시간: 2시간+

  • 가장 귀찮은 부분: 전 과정 다 귀찮음

  • 필수 출력: 제목, 핵심내용(불릿), 쉬운설명, 파급효과, 태그, 원본링크

2단계: LLM 선택 - 삽질의 시작

처음엔 Google Gemini API를 연결했는데... 무료 할당량이 너무 빨리 소진됐습니다.

그래서 무료 LLM을 찾다가 Ollama를 발견! 로컬에서 돌아가는 오픈소스 LLM이라 비용이 0원입니다.
또 여러 무료 LLM을 비교하다보니 Ollama qwen2.5가 한글 성능이 나쁘지 않다고하여, 사용해보기로 했습니다.

# Ollama 설치 (macOS)
brew install ollama

# 모델 다운로드
ollama pull qwen2.5:7b

3단계: 세션 끊김과의 사투

작업 중에 다른 난관도 있었습니다:

  1. 파일이 꼬여서 엎음 - 처음부터 다시 시작

  2. Claude Pro 할당량 초과 - Codex로 시도했으나 프로젝트 맥락을 이해 못해서 계속 에러

  3. Claude로 복귀 - 프로버전 할당량 리셋 후 다시 작업, 하지만 세션 맥락이 유실됨

배운 점: 세션이 끊기면 Claude가 맥락을 잃어서 다시 설명해야 합니다. 중요한 작업은 한 세션에서 끝내는 게 좋다고 생각했습니다.

4단계: 스크립트 완성

최종적으로 만들어진 스크립트 구조:

# summarize_pdfs.py 핵심 흐름

1. PDF 폴더 스캔
2. 각 PDF에 대해:
   a. pdfplumber로 텍스트 추출
   b. Ollama에 요약 프롬프트 전달
   c. 응답 파싱 (제목, 핵심내용, 쉬운설명, 태그 등)
   d. 옵시디언 마크다운으로 저장
3. 결과 JSON 출력

재사용 가능한 프롬프트

Ollama에 전달한 요약 프롬프트:

다음 보도자료를 분석하고 아래 형식으로 요약해주세요.
반드시 한국어로 작성하고, 지정된 형식을 정확히 따라주세요.

## 요청 형식:

1. **제목**: 보도자료의 핵심 제목

2. **핵심 내용**: 불릿포인트 형식으로 정리
   - **[서브헤딩1]**: 첫 번째 주요 포인트
     - 세부 내용

3. **쉬운 설명**: 비전문가도 이해할 수 있도록 1-2문장으로 설명

4. **예상 파급효과**: 이 보도자료가 가져올 영향 1-2문장

5. **태그**: 관련 키워드 3-5개

6. **발행기관**: 보도자료를 발행한 정부 부처명

결과와 배운 점

결과

항목

Before

After

처리 방식

수동으로 하나씩

스크립트 한 번 실행

처리 시간

2시간+

약 15분 (자동)

처리 개수

귀찮아서 미룸

29개 일괄 처리

비용

-

0원 (Ollama 무료)

생성된 노트 예시

---
source: 20260127 중기부, 중소기업 기술거래 기반조성 사업 본격 추진.pdf
created: 2026-02-02
tags: ["인공지능", "정책", "지원사업"]
---

# 중소기업 기술거래 지원 강화, '26년부터 본격 추진

## 핵심 내용
- **스마트테크브릿지 플랫폼 활용**: 중소벤처기업부는 2026년부터...
- **글로벌 진출 지원 확대**: 해외 기술 수출을 준비하는 기업에...

## 쉬운 설명
중소기업들이 필요한 기술을 빠르고 효과적으로 찾고 이용할 수 있도록
정부가 제공하는 다양한 지원 서비스입니다.

## 예상 파급효과
중소기업들이 혁신적인 기술을 활용해 경쟁력을 높일 수 있는 환경을 마련...

생성된 결과물 (예시)

한국어와 영어가 적힌 문서

배운 점

  1. 무료 LLM도 꽤 쓸만하다

    • Ollama로 로컬에서 돌리니 API 비용 0원

    • 성능은 Claude보다 떨어지고 속도도 느리지만, 반복 작업엔 충분

    • 지금 나에겐 무료가 최고!

  2. Claude Code 할당량도 아낄 수 있다

    • 요약은 Ollama가 하고, Claude Code는 개발만 담당

    • 프로요금제를 쓰기때문에 한도를 아껴야해요..ㅠㅠ (근데, 맥스로 가는게 답인듯합니다)

  3. 세션 맥락 유지가 중요하다

    • 세션이 끊기면 처음부터 다시 설명해야 함

    • 중요한 작업은 한 세션에서 끝내기


향후 계획

앞으로 다양한 정보를 자동으로 옵시디언에 정리하는 기능을 더 만들어보고 싶습니다:

  • 뉴스레터 자동 정리

  • 유튜브 영상 요약 → 옵시디언

  • 논문/리포트 자동 요약


실행 방법 (따라하기)

1. 사전 준비

# Ollama 설치
brew install ollama

# 모델 다운로드
ollama pull qwen2.5:7b

# Python 패키지 설치
pip install pdfplumber ollama

2. 스크립트 실행

python summarize_pdfs.py \
  --input-dir "/path/to/pdf/folder" \
  --output-dir "/path/to/obsidian/vault" \
  --model "qwen2.5:7b"

3. 옵션

옵션

설명

--force

기존 파일 덮어쓰기

--single "file.pdf"

단일 파일만 처리

--skip-existing

이미 처리된 파일 건너뛰기 (기본값)


마무리

PDF 수동 정리가 귀찮으셨다면, Claude Code + Ollama 조합을 추천드립니다.

  • Claude Code가 스크립트를 만들어주고

  • Ollama가 무료로 요약해주고

  • 옵시디언에 깔끔하게 정리됨

무료로 자동화하는 맛을 느껴보세요!

뉴스레터 무료 구독

👉 이 게시글도 읽어보세요