소개
여행 유튜브 영상 요약을 시도하려다 프롬프트 결과가 부정확해 요약을 실패했습니다.
크롤링을 성공해보는 것이 목표라 실제 기사를 활용한 요약 연습을 시도했습니다.
진행 방법
Airtable + Make.com (Scenario 구성)
GPT, Cluely 를 사용해 화면을 캡쳐해서 질문하고, 해결하는 방식으로 진행했습니다.
세부 내용
수업에서 배운 시나리오 흐름:
1. http 홈페이지 가져오기
2. Text parser로 뉴스 기사 링크 정보 추출하기 (제목, 링크)
3. 본문 내용 가져오기
4. Text parser로 전체 내용을 텍스트로 변환하기
5. Iterator로 배열(기사)를 하나씩 꺼내서 다음 모듈로 보내주기
5. 본문 전처리 (gpt)
6. 5줄 요약 (gpt)
7. array aggregator로 배열 순서 만들기
8. airtable로 데이터 보내
강의를 따라했지만 아래 이미지처럼 Title과 Summary 값이 정확하게 나오지 않았습니다.
전체 흐름을 잘 이해하지 못한 상태에서 블럭 매핑을 하려니까 시행착오가 있었습니다.
모듈이 돌아간 후 위에 뜨는 숫자로 원하는 내용을 확인했고, 결과적으로 summary는 잘 나왔는데, summary에 title이 같이 뜨고, 정작 title 값엔 뭘 넣어도 제목이 나오지 않았어요.
데이터는 잘 가져오고 있어서, 5줄 요약 프롬프트를 수정했습니다. 이렇게 하니 제목과 5줄 요약이 깔끔하게 분기되어 에어테이블에 쌓였습니다.
meaage1 의 프롬프트에서 제목과 내용을 분리하라고 요구
- You are an automation expert.
- You write a draft for a thread post by summarizing the incoming news article into five bullet points only (no boldface).
- Please summarize the content in Korean using the "~했어요" style.
- At the end, add a sentence summarizing the insights of the entire content.
- Output ONLY the five-line summary for the summary field.
- The article title will be provided separately and should NOT be included in the summary.
- Answers must be in Korean.
message 2 에서 Aritcle title 제목 표기
한 번에 여러 개의 기사를 에어테이블에 적재하고 싶어서 Iterator에서 번들 값 기준을 설정했습니다.
그래서 최종 타이틀과, 5줄 요약이 분리된 크롤링을 성공했습니다.
순서를 지정하지 않아서 1~10번이 순서와 상관없이 추출되었지만 내용이 잘 나왔어요.
결과와 배운 점
Array Aggregator 매핑에서 많은 시행착오 → 정확한 분리 프롬프트가 핵심
모델은 초반에 간단한 걸로 시도 후, 안정화되면 고성능 모델로 업그레이드 추천 (API 한도 이슈 경험)
기사 순서가 섞였지만 원하는 기사 목록을 가져오는 데 성공
Cluely가 GPT보다 시나리오 구조를 잘 보여주는 경우도 있었음. 강의 내용을 복습하거나 화면에 대한 질문을 할 때는 Cluely가 압도적