자피어, 에어테이블 없이 무료로 콘텐츠 소재 수집하기


[배경]

  • AI로 업무 자동화하기에 참여하며 세운 목표는 “뉴스레터 발행 자동화”

  • 자피어, 에어테이블을 사용해 본 적이 없어 유료 결제를 해도 활용하는 데 리소스가 더 많이 필요한 상황

  • 비개발자


[해결하려는 문제]

뉴스레터 제작에 아래 1~2번에 리소스 투입량은 예측이 되지 않을 뿐더러, 번거로운 작업

  1. 주제 선정

  2. 자료 찾기(주로 해외 관련 기업 블로그)

  3. 타겟에 맞춰 내용 각색

  4. 최대 2개 정도의 아티클 제작하여 발송


업무자동화반 리더 고상혁님의 포스트에서 에어테이블에 소재를 아카이빙하고 여기서 자동으로 콘텐츠를 생성하는 프로세스를 참고하였지만, 평소 관련 아티클을 잘 찾아보지 않기 때문에 습관처럼 수집이 어렵다는 문제가 있었음.

→ 가장 귀찮은 1,2번을 쉽게 해결하고자 다양한 툴을 시도해 본 후, 어느 정도 작동하는 프로토타입 완성


[프로토타입 셋팅 과정]

1.자료 수집 자동화

  1. Google Alerts에 키워드 등록하여 아래와 같이 메일 수신


  2. Gmail에 Google Alerts에서 온 메일에 라벨을 붙여 분류


2.GPT를 통해 Gmail로 온 Google Alerts의 링크를 불러오는 코드 생성

  1. 아래 3가지 요청사항을 시작으로 how to 구체화


  2. 추천해준 방식 중 무료인 Google Apps Script를 활용한 방식 채택


  3. GPT가 Google Apps Script에서 사용할 수 있는 코드를 작성해주었으며, 이 코드를 통해 추출된 링크는 Spread sheet를 연결하여 받도록 연결함

    정상작동시 스프레드시트에 이렇게 쌓임


  4. 그러나 초기에 오류가 많아서 오류 뜬 화면을 캡쳐 or 복붙해서 계속 제공하며 수정요청 - 검증을 반복함

    *GPT가 제공한 코드에 스프레드시트 링크주소나 지메일 라벨명이 다르게 적힐 때가 있어서 이건 계속 확인해야

  5. 코드 요청사항 정리

    1. 특정 라벨이 붙은 메일에서 링크를 추출해줘.

    2. png로 끝나는 링크는 이미지 파일이니 제외해줘.

    3. 메일함에 새로 들어온 메일만 대상으로 지정해줘.

    4. 정규 표현식을 사용한 링크만 추출해줘.

    5. 중복 데이터가 있으면 제외해줘.

    6. 메일 속 링크 개수와 추출된 링크 개수가 안맞는데 이걸 해결해줘.

    7. 원치않는 출처의 링크는 제외해줘.


3.스프레드 시트에 GPT를 연결하여 1차 스크리닝

  1. 스프레드 시트 구성은 아래와 같이 셋팅

    1. 스크래핑 : apps script에서 자동으로 링크가 꽂히는 공간

    2. 검수 : 링크를 1차 스크리닝하는 공간 (현재 여기까지 구축)

    3. 초안 : 셀렉한 링크로 초안 만드는 공간

    4. 아카이빙 : 나중을 위해 아카이빙할 공간


  1. 검수 시트

    1. 분석 플로우

      1. 링크 → 영문 요약 → 한글 번역 → 영문/한글 주제 도출

      2. 링크 → 분석해서 대분류, 소분류에 제공된 키워드 1~2개 선택

      3. 링크 → SEO 관점 분석

      *원래는 링크에서 바로 타이틀을 찾아서 추출해주길 바랬는데, 멘토님 피드백을 받아 요약을 시키고 요약에서 주제를 뽑아내게 하니 더 깔끔하게 정리가 됨. 데이터를 많이 활용하는 게 GPT 특성상 더 잘 맞기 때문인 것으로 보임.

2. SEO 관점 분석 : GPT에 SEO 품질 평가 어떻게 하는지 질문


▼ SEO 관점 분석 열의 명령어

“이 글의 품질이 궁금한데, 아래 질문에 대응해서 분석하고 '예'가 5개 이상이면 '최적화', '예'가 4개면 '보통', '예'가 3개 이하면 '부적합'으로 표시해줘.

1. 페이지 로딩 속도가 평균보다 빠른가?

2. title, meta name이 적절한 키워드를 포함하고 있나?

3. 헤더 태그가 적절하게 사용되고 있나?

4. 원문 내용이 1천 자 이상인가?

5. 원문 내용에 중요한 키워드가 적절히 포함되어 있나?

6. 모바일 친화적인가?”


[향후 목표]

  1. apps script에서 매일 자동으로 링크를 추출해주는데, 시트에 데이터가 있으면 추출 양식이 깨짐 → 문제 해결 필요

  2. google alerts를 통해 콘텐츠가 꽂히다보니, 여기에 등록한 키워드를 점차 다듬어야 함.

  3. 현재는 아카이빙까지 대충 해결한 상태인데 앞으로 콘텐츠 초안 작성까지 셋팅하고자 함.

  4. 1일 1콘이 가능할 정도로 양과 질을 잡을 수 있는 방법을 모색하고자 함.

10
5개의 답글

👉 이 게시글도 읽어보세요