단순하게 시작했는데… 꼬이고 또 꼬였다? n8n + GPT 뉴스봇 삽질기

소개

시장 흐름을 빠르게 파악하고 싶다는 생각에 뉴스 요약 봇을 만들기로 결심했습니다. 처음엔 단순하게 시작하면 되겠지 싶어서, 뉴스를 긁어서 슬랙으로 쏴주는 흐름만 구성했어요.

생각보다 금방 성공! "오, 너무 쉽네?" 싶었죠. 그런데... 문제는 그 다음부터였습니다. 😇

구조 요약 (초간단)

RSS (50개)
    ↓
Split in Batches (1개씩)
    ↓
LLM 스코어링 (score + summary + category)
    ↓
Merge (collect all 50개)
    ↓
Code Node (score 기준 내림차순 정렬)
    ↓
상위 10개만 slice
    ↓
Slack 메시지 생성

네이버도 동일:

Naver API (50개)
    ↓
Split → LLM → Collect → 상위10개

그 다음 최종적으로:

최종 RSS 10개 + 네이버 10개 → Score 다시 정렬 → 상위 10개만 Slack


진행 방법

🛠 사용한 도구

  • n8n: 전체 워크플로우 구성

  • Slack: 슬랙 웹훅을 통해 메시지 전송

  • GPT (LLM): 뉴스 요약 및 메시지 예쁘게 출력

🧩 구현 흐름

  1. RSS나 API 등으로 뉴스 데이터 수집

  2. 필요한 필터 추가로 불필요한 토큰 낭비 방지

  3. GPT에게 "예쁘게 정리해줘" 프롬프트 전달 → 진짜 이쁘게 나옴 ✨

  4. 결과를 Slack으로 전송 (기업용 슬랙이면 웹훅 설정 따로 필요)

  5. 결과물 전/후를 캡처해서 품질 비교도 해봤어요!


머신러닝 시스템의 프로세스를 보여주는 다이어그램

Tip: 활용 이미지나 캡처 화면을 꼭 남겨주세요.

몇 번의 수정을 거쳐...

관련도가 높은 뉴스를 추려냈습니다!

llm에 넣었던 프롬프트.!

[관련도 기준] 다음 항목이면 "관련도 매우 높음":

  • AI 기반 소재 개발 / 고분자 / 화학 / 신소재 R&D

  • 소재 시뮬레이션 / MD / DFT / Materials Informatics

  • 정부의 R&D 지원 정책, 기술개발 예산, 정부지원사업

  • 삼성/LG/SK/한화/포스코/코오롱 등 소재·화학·배터리 R&D 투자

  • Dow, BASF, Sabic 등 글로벌 화학기업 기술/투자

  • 제조업 AI/시뮬레이션/DX 관련 산업 동향

  • Material Informatics 경쟁사 (Citrine, Schrodinger 등) 소식

다음은 "관련도 낮음 → 제외":

  • 정치, 외교, 부동산, 범죄, 연예, 일반 사회/경제

  • AI·소재와 무관한 단순 정책


[작업 단계]

  1. 각 기사를 Polymerize와의 관련도를 0~100점으로 평가한다.

  2. 55점 이상 기사만 남긴다.

  3. 다음 4개 카테고리 중 하나로 분류한다.

    • 정부지원사업

    • 산업동향

    • 업계소식

    • 경쟁사

  4. 최종 출력은 아래 JSON 형식을 정확히 그대로 따라야 한다.


[출력 JSON 형식] { "articles": [ { "category": "정부지원사업", "title": "", "url": "", "summary": "" } ] }

규칙:

  • Slack 포맷(>, <URL|제목>, 줄바꿈 등)은 절대 만들지 말 것.

  • URL 앞뒤에 공백/개행/문장 부호 절대 넣지 말 것.

  • JSON 외의 설명을 절대 하지 말 것.


뉴스 데이터: {{ $json["items"] }}

다시 디자인도 손봐야지.!!

성공인줄 알았으나..! ㅎㅎㅎ 링크를 들어가보니..! 링크가 깨지는 현상이...있어요... 그래서 지금까지 계속 수정하고 업데이트 하고 있습니다!!

휴대폰의 웹북 앱 스크린샷

결과와 배운 점

배운 점과 나만의 꿀팁을 알려주세요.

과정 중에 어떤 시행착오를 겪었나요?

멍멍님 께서 도와주신 플로우 정리..!!

하지만 아직 남은 문제..!! 1. 키워드가 여러개 있으나 하나만 선택되는 문제..!

한국어 응용 프로그램의 스크린샷
  1. 아직 슬랙 연결이 잘 되지 않은 문제가 있어요 (아직 정확히 시도해보지 못함)

  • ✅ 단순 구조로 시작했을 땐 정말 깔끔하게 작동!

  • ❌ 하지만 링크가 깨지거나 포맷이 뒤틀리는 문제가 발생...

  • 🤯 GPT랑 채팅 너무 많이 하다 보니 혼돈 상태에 빠짐 (생각 정리 필요!)

  • 🔁 필터 추가하고, 프롬프트 수정하면서 최적화 시도 중

  • 🙌 멍멍님이 중간중간 도와주셔서 방향을 잡을 수 있었어요

💡 배운 점

  • "너무 복잡하게 시작하지 말자!"

  • "가끔은 쉬었다가 다시 시도하자!"

  • GPT는 예쁘게 출력해달라고 하면 진짜 예쁘게 해줍니다 ㅎㅎ

  • 구조와 토큰 최적화는 반드시 고려할 것!

3
4개의 답글

뉴스레터 무료 구독

👉 이 게시글도 읽어보세요