n8n으로 논문 요약하고 리뷰 달아보기

소개

시도하고자 했던 것과 그 이유를 알려주세요.
n8n을 활용하여 논문을 자동으로 요약하고 리뷰하는 서비스를 로우 코드 방식으로 개발하고자 했습니다.
이 서비스를 통해 사용자는 논문 검색어와 제목을 입력하면, 관련 논문을 찾아 자동으로 요약 및 리뷰할 수 있도록 하고자 했습니다.
특히, 많은 논문을 효율적으로 요약하는 방법으로 refine 방식과 map reduce 방식을 검토하였습니다.


진행 방법

어떤 도구를 사용했고, 어떻게 활용하셨나요?

  • n8n: 논문 검색 및 파싱, 요약 자동화를 위한 워크플로우 구성

  • Hugging Face Transformers: 논문 요약 모델 활용 (Refine,map reduce 방식 검토 중)

  • GPT API: 요약 및 리뷰 자동화를 위한 LLM 활용, 추후 fast api를 사용하여 정교하게 구현예상

  • 논문 데이터셋: Semantic Scholar API 및 arXiv API를 통해 논문 검색 및 수집

사용한 프롬프트 전문

개별 프롬프트

### 목표 ###
아래 질문지에 대하여 응답할 수 있는 것만 질문과 함께 대답을 하고 응답할 수 없는 것에 대해선 대답하지 마세요.

### 질문 ###

## 1. 논문 정보
- **제목**: 
- **저자**: 
- **출처 (학회/저널/ArXiv 등)**: 
- **발행연도**: 

## 2. 연구 목적
- **핵심 연구 질문**: 
- **연구의 필요성 및 기여도**: 

## 3. 방법론
- **사용한 모델 및 알고리즘**: 
- **데이터셋 및 실험 환경**: 
- **학습 방식**: 
- **평가 방법 및 메트릭**: 

## 4. 주요 결과
- **성능 비교 (Baseline vs. Proposed Method)**: 
- **주요 성과 및 발견**: 

## 5. 결론 및 시사점
- **연구의 한계점**: 
- **추후 연구 방향**: 

## 6. 추가 참고 자료
- **관련 연구 및 참고 논문**: 
- **코드/데이터셋 공개 여부 및 링크**: 

### 문서 ###
{{ $json.result }}

Tip

  • n8n에서 HTTP Request 노드를 활용하여 논문 검색 및 파싱을 자동화

  • Refine 방식을 도입하기 위해, 요약을 단계적으로 다듬는 구조를 검토


결과와 배운 점

프로세스를 보여주는 컴퓨터 화면의 스크린샷

배운 점과 나만의 꿀팁을 알려주세요.

  • 논문 요약 방식: 한 번의 요약보다는 Refine 방식(기존 요약을 개선하는 방식)이 효과적일 가능성이 있음

  • 요약 모델 선택: gpt - 4o 등의 모델을 비교해 볼 필요가 있음

  • 자동화의 한계: 논문마다 형식이 달라, 완벽한 자동화보다는 일부 수동 검토가 필요할 가능성

과정 중에 어떤 시행착오를 겪었나요?

  • 논문을 적절히 파싱하는 것은 성공했으나, 다수의 논문을 요약할 때 refine 방식이 어떻게 작동하는지에 대한 개념 정리에 많은 시간이 소요됨

  • API 호출을 통해 논문을 가져올 때, 데이터 포맷이 일정하지 않아 파싱에 추가적인 작업이 필요했음

도움이 필요한 부분이 있나요?

  • 다수의 논문을 빠르게 요약하는 최적의 워크플로우 설계

앞으로의 계획이 있다면 들려주세요.

  • 논문 리뷰 기능을 추가하여, 논문의 한계점 및 연구 방향을 자동으로 제안하는 기능 구현

  • WhisperX를 활용하여 논문을 음성으로 읽어주는 기능 검토

2
1개의 답글

👉 이 게시글도 읽어보세요