뉴스 기사 요약 자동화: Airtable에 제목 + 5줄 요약 정리 성공

소개

  • 여행 유튜브 영상 요약을 시도하려다 프롬프트 결과가 부정확해 요약을 실패했습니다.

  • 크롤링을 성공해보는 것이 목표라 실제 기사를 활용한 요약 연습을 시도했습니다.

진행 방법

  • Airtable + Make.com (Scenario 구성)

  • GPT, Cluely 를 사용해 화면을 캡쳐해서 질문하고, 해결하는 방식으로 진행했습니다.

세부 내용

  • 수업에서 배운 시나리오 흐름:

    • 1. http 홈페이지 가져오기

    • 2. Text parser로 뉴스 기사 링크 정보 추출하기 (제목, 링크)

    • 3. 본문 내용 가져오기

    • 4. Text parser로 전체 내용을 텍스트로 변환하기

    • 5. Iterator로 배열(기사)를 하나씩 꺼내서 다음 모듈로 보내주기

    • 5. 본문 전처리 (gpt)

    • 6. 5줄 요약 (gpt)

    • 7. array aggregator로 배열 순서 만들기

    • 8. airtable로 데이터 보내

  • 강의를 따라했지만 아래 이미지처럼 Title과 Summary 값이 정확하게 나오지 않았습니다.

  • 전체 흐름을 잘 이해하지 못한 상태에서 블럭 매핑을 하려니까 시행착오가 있었습니다.

많은 숫자가있는 녹색 화면
한국 숫자가 강조된 스프레드 시트
  • 모듈이 돌아간 후 위에 뜨는 숫자로 원하는 내용을 확인했고, 결과적으로 summary는 잘 나왔는데, summary에 title이 같이 뜨고, 정작 title 값엔 뭘 넣어도 제목이 나오지 않았어요.

    녹색 배경이있는 메시지 화면의 스크린 샷

  • 데이터는 잘 가져오고 있어서, 5줄 요약 프롬프트를 수정했습니다. 이렇게 하니 제목과 5줄 요약이 깔끔하게 분기되어 에어테이블에 쌓였습니다.

  • meaage1 의 프롬프트에서 제목과 내용을 분리하라고 요구

    • - You are an automation expert.

      - You write a draft for a thread post by summarizing the incoming news article into five bullet points only (no boldface).

      - Please summarize the content in Korean using the "~했어요" style.

      - At the end, add a sentence summarizing the insights of the entire content.

      - Output ONLY the five-line summary for the summary field.

      - The article title will be provided separately and should NOT be included in the summary.

      - Answers must be in Korean.

  • message 2 에서 Aritcle title 제목 표기

프로세스의 다른 단계를 보여주는 다이어그램
  • 한 번에 여러 개의 기사를 에어테이블에 적재하고 싶어서 Iterator에서 번들 값 기준을 설정했습니다.

스프레드 시트의 한국 번호 목록
화면의 한국어 목록
  • 그래서 최종 타이틀과, 5줄 요약이 분리된 크롤링을 성공했습니다.

  • 순서를 지정하지 않아서 1~10번이 순서와 상관없이 추출되었지만 내용이 잘 나왔어요.

결과와 배운 점

  • Array Aggregator 매핑에서 많은 시행착오 → 정확한 분리 프롬프트가 핵심

  • 모델은 초반에 간단한 걸로 시도 후, 안정화되면 고성능 모델로 업그레이드 추천 (API 한도 이슈 경험)

  • 기사 순서가 섞였지만 원하는 기사 목록을 가져오는 데 성공

  • Cluely가 GPT보다 시나리오 구조를 잘 보여주는 경우도 있었음. 강의 내용을 복습하거나 화면에 대한 질문을 할 때는 Cluely가 압도적

2
1개의 답글

뉴스레터 무료 구독

👉 이 게시글도 읽어보세요