Claude Code 커스텀 스킬로 문헌 분석 자동화

소개

문헌 고찰(literature review)을 보다 체계적으로 관리하고자 이 자동화를 시작했습니다.
논문 수가 늘어나면서 반복적인 분석 보고서 작성과 엑셀 매트릭스 업데이트 과정이 점점 더 복잡해졌고, 특히 연구 방법에 따라 분석 포맷을 유연하게 커스터마이징해야 하는 요구가 생겼습니다.

이 과정에서 분석 기준의 일관성을 유지하기 어려운 문제가 발생했고, 이를 해결하기 위해 Claude Code의 커스텀 스킬을 활용한 자동화를 시도하게 되었습니다.

진행 방법

1. 사용한 도구와 전체 구조

이번 자동화는 다음과 같은 도구를 중심으로 구성했습니다.

Claude Code: 커스텀 스킬(SKILL.md)로 반복 절차를 명령어화
Python: docx 생성 및 엑셀 업데이트 자동화
PyMuPDF (fitz): PDF를 이미지로 변환하여 OCR 처리
Excel: 논문 비교 매트릭스 및 진행 상황 추적

입력: `/analyze-papers {저자명}`
  ↓
[1] papers/ 폴더에서 "저자명" 포함 PDF 탐색
[2] 파일명 규격화 (연도-저자-제목.pdf)
[3] PDF 읽기 및 내용 분석
[4] 15개 섹션 분석 보고서 작성
[5] python-docx로 구조화된 docx 파일 생성
[6] 엑셀 3개 시트에 16개 필드 동시 등록
[7] 완료 보고 생성
  ↓
출력: 분석 보고서(docx) + 엑셀 매트릭스 업데이트 + 요약 보고

2. 핵심 구현 요소

폴더 구조 예시는 다음과 같습니다.

프로젝트폴더/
└── .claude/
    └── skills/
        └── analyze-papers/
            └── SKILL.md

다음은 실제 사용한 SKILL.md의 핵심 구조입니다.

---
name: analyze-papers
description: PDF를 읽고 15개 섹션 분석 보고서를 작성합니다.
---

## 사용법
- `/analyze-papers 저자명` → 해당 논문 1개 분석
- `/analyze-papers` → 미분석 목록 표시

## 실행 절차
1. 대상 논문 결정
2. 파일명 규격화
3. PDF 읽기
4. 분석 보고서 작성
5. docx 파일 생성
6. 엑셀 매트릭스 등록
7. 완료 보고

3. 자동화 설계에서 중요했던 원칙 3가지

원칙 1. 입력-처리-출력을 명확히 정의하기

자동화가 안정적으로 동작하려면, 다음 세 가지가 명확해야 합니다.

입력: 어떤 명령이 들어오는가
처리: 어떤 단계를 거치는가
출력: 무엇이 생성되는가

원칙 2. 분석 프레임워크를 스킬 안에 내장하기

일관성 있는 구조를 만들기 위해 SKILL.md 안에 직접 정의했습니다. 특히 논문 유형(예: 양적 연구, 질적 연구, 혼합 연구)에 따라 중간 분석 섹션이 자동으로 분기되도록 설계하여, 동일한 프레임워크를 유지하면서도 연구 방법에 맞는 맞춤형 분석이 가능하도록 구현했습니다.

Part A. 공통 분석
1. 기본 정보 (Basic Info)
2. 연구 영역의 중요성 (Significance)
3. 연구 Gap 식별 (Research Gap)
...

Part B. 유형별 분석
- 양적 연구: 변수, 측정, 표본, 통계, 결과
- 질적 연구: 참여자, 자료수집, 분석방법

원칙 3. 자동화 코드에 검증 로직을 포함하기

엑셀에 필수 필드가 누락되었을 때 경고하도록 만들었습니다.

def add_to_matrix(data):
    REQUIRED_KEYS = [
        "citation", "year", "type", "theory", "gap",
        "relevance", "findings", "method", "purpose",
        "evidence", "analysis_file",
    ]

    missing = [k for k in REQUIRED_KEYS if not data.get(k)]

    if missing:
        print(f"WARNING: 필수 필드 누락 {len(missing)}개: {missing}")

결과와 배운 점

수작업으로 문헌을 관리하던 시기에는 논문을 읽고 정리하는 작업 자체에 많은 시간이 소요되었습니다. 하지만 자동화를 도입한 이후에는 분석 속도가 크게 향상되면서, 각 문헌이 연구에서 어떤 역할을 하는지에 대한 구조적인 판단을 훨씬 빠르게 수행할 수 있게 되었습니다.

특히 각 논문이 내 연구 주제와 어떤 방식으로 연결되는지를 명시적으로 기록하기 시작하면서, 향후 논문화 과정에서 참고 문헌을 다시 찾고 정리하는 부담이 줄어들고, 문헌 활용의 효율성과 일관성이 높아질 것으로 기대하고 있습니다.

현재는 개인 워크플로우로 이 구조를 실험하고 있는 단계이지만, 향후에는 연구팀 단위에서 동일한 분석 기준을 공유하고 협업할 수 있는 형태로 확장하여 팀 단위의 연구 퍼포먼스를 향상시키는 것을 목표로 하고 있습니다. 더 나아가, 연구 과정의 주요 역할을 기준으로 AI 에이전트를 구성하여 AI 기반 연구 협업 팀을 구축하는 것을 장기적인 방향으로 설정하고 있습니다.

20개의 주제를 확인해보세요! AI 스터디 슈퍼 얼리버드 시작🕊️