매일 관심 뉴스를 메일로 보내주고 기사에 대해 대화할 수 있는 챗봇 만들어보기 - 미완성

소개

관심 사이트의 RSS 피드를 챗봇이 매일 읽고 나에게 요약해서 메일을 보내주고 좀 더 자세히 알고 싶을 때는 메일에 제공된 링크를 통해 챗봇과 대화를 할 수 있게 만들고 싶었습니다.

진행 방법

어떤 도구를 사용했고, 어떻게 활용하셨나요?

gemini 2.5 pro(experimental) : 브레인스토밍, 코딩 파트너 , Appscript

Tip: 사용한 프롬프트 전문을 꼭 포함하고, 내용을 짧게 소개해 주세요.

Tip: 활용 이미지나 캡처 화면을 꼭 남겨주세요.

Tip: 코드 전문은 코드블록에 감싸서 작성해주세요. ( / 을 눌러 '코드 블록'을 선택)

브레인 스토밍 도우미를 통해 개략적인 방향성을 잡고 코딩에 들어감

코딩은 코딩 도우미와 함께 하는게 나을 것 같아 브레인 스토밍 도우미에게 코딩 파트너에게 줄 프롬프트를 작성해 달라고 요청

젝트 브리핑: 개인 맞춤형 AI/IT 의료 헬스케어 트렌드 요약 & 대화 시스템

프로젝트명: 개인 맞춤형 AI/IT 의료 헬스케어 트렌드 요약 & 대화 시스템 (가칭)

프로젝트 목표:
사용자(의사)가 AI/IT 의료 헬스케어 분야의 최신 트렌드, 특히 의사를 위한 진료 효율성/생산성 향상 솔루션, 관련 회사 소식(리포트 등), 정책 변화에 대한 정보를 놓치지 않고 효율적으로 파악하며, 궁금한 점을 즉시 해결할 수 있도록 돕는 자동화 시스템을 구축합니다. 정보 과부하 시대에 꼭 필요한 맞춤형 정보 비서 역할을 수행합니다.

타겟 사용자:
AI/IT 기술이 의료 헬스케어 분야에 미치는 영향에 관심이 많고, 특히 개원가 환경에서의 진료 효율성 및 생산성 향상 솔루션, 관련 기업 동향, 정책 변화에 대한 최신 정보를 꾸준히 얻고 싶은 의사 (사용자 본인).

핵심 워크플로우:

자동 정보 수집: 시스템이 매일/정기적으로 지정된 온라인 소스(뉴스, 보고서, 정책 발표 등)에서 최신 정보를 자동으로 수집합니다.
AI 요약 및 분석/분류: 수집된 정보의 내용을 제미나이 AI 모델로 이해하고, 사용자 관심사에 맞춰 요약 및 영향 분석을 수행하며, 중요도에 따라 TOP 3 트렌드와 추가 트렌드로 분류합니다.
이메일 리포트 발송: 요약/분석/분류된 트렌드 정보를 Style 3 형식의 이메일로 구성하여 사용자에게 매일 아침 자동 발송합니다.
챗봇 연동 심층 대화: 이메일 내용 중 궁금한 점은 메일에 포함된 고유 링크를 클릭하여 해당 내용을 맥락으로 하는 챗봇과 대화하며 추가 정보 획득 및 심층적인 이해를 합니다.
주요 기능 요구사항:

정보 수집 모듈:

지정된 RSS 피드 목록에서 최신 글 정보를 주기적으로 자동으로 읽어와야 합니다.
RSS 피드에 전체 내용이 없을 경우, 해당 링크를 따라가 기사/본문 내용을 가져와야 합니다. (웹페이지 HTML 파싱 및 본문 추출 기능 필요)
(향후 확장) 정부 부처/기관 사이트(RSS 미제공)의 특정 게시판(예: 보도자료, 법/규제 변경 고시) 정보를 자동으로 가져오는 기능이 추가될 수 있습니다. (타겟 웹 스크래핑 기술 및 안정적인 데이터 추출 로직 필요)
AI 요약 및 분석/분류 모듈 (Google Gemini API 활용):

정보 수집 모듈에서 가져온 수많은 기사/문서 내용을 기반으로 Google Gemini API를 호출하여, Style 3 이메일 리포트에 사용될 핵심 콘텐츠(요약, 영향 분석)를 생성하고 중요도를 판단하여 TOP 3 및 추가 트렌드를 분류합니다.
개별 기사 요약 생성:
Style 1 요약: 추가 트렌드 목록에 사용될 1~2문장의 초간단 요약을 생성합니다.
Style 2 요약: 주요 트렌드(TOP 3) 및 그 후보에 사용될 3~5문장의 상세 요약을 생성합니다.
영향 분석 생성: Style 2 요약 대상 기사에 대해 '의사를 위한 진료 효율성 및 생산성 향상' 관점에서 어떤 의미/잠재적 영향이 있는지 1~2문장으로 분석하는 내용을 생성합니다. (사용자 관점 반영 중요)
중요도 판단 및 분류 (TOP 3 및 추가 트렌드 선정):
수집된 모든 정보들을 위에서 정한 사용자 관심사(진료 효율/생산성 솔루션, 회사/리포트, 정책 변화)와의 관련성, 잠재적 영향력, 출처 신뢰성 등을 기준으로 중요도를 판단하고 순위를 매깁니다.
이 순위를 바탕으로 가장 중요하다고 판단되는 TOP 3 트렌드를 선정하여 해당 기사의 Style 2 요약 및 영향 분석 내용을 연결합니다.
나머지 주목할 만한 트렌드는 추가 트렌드로 분류하여 해당 기사의 Style 1 요약 내용을 연결합니다.
이렇게 TOP 3 섹션과 추가 트렌드 섹션을 채울 내용물을 준비하여 이메일 생성 모듈로 전달합니다. (제미나이의 분류/랭킹 능력 또는 별도 로직 구현)
이메일 생성 및 발송 모듈:

매일 정해진 시간(예: 사용자 설정 가능한 아침 시간)에 시스템이 자동 실행되어야 합니다. (스케줄링 기능 필요)
AI 요약 및 분석 모듈에서 준비된 콘텐츠를 취합하여 아래 Style 3의 이메일 형식에 맞춰 내용을 구성합니다.
구성된 이메일을 사용자 지정 이메일 주소로 발송합니다. (Google Gmail 서비스 연동 필요)
이메일 내용에는 각 요약 내용을 기반으로 챗봇과 대화할 수 있는 고유한 링크가 포함되어야 합니다. 이 링크는 챗봇이 어떤 날짜의 어떤 요약 내용에 대한 질문인지 알 수 있도록 컨텍스트 정보를 담고 있어야 합니다.
이메일 형식 (Style 3):

제목: [날짜] AI/IT 의료 헬스케어 주요 트렌드 (예: [2025년 5월 7일] AI/IT 의료 헬스케어 주요 트렌드)
시작 인사: 간단한 인사와 함께 오늘 요약 내용 소개
💡 오늘의 주요 트렌드 TOP 3 💡 (선정된 3가지 항목 상세 요약 + 영향 분석)
✨ 놓치지 마세요! 추가 트렌드 ✨ (선정된 추가 항목들 헤드라인 + 초간단 요약 목록)
👉 더 자세한 정보 & 궁금증 해결은 여기서! 👈 [챗봇에게 물어보기 링크 - 클릭!]
마무리 인사
챗봇 인터페이스 및 대화 모듈:

메일의 '챗봇에게 물어보기' 링크를 클릭하면 열리는 웹 기반의 간단한 챗봇 인터페이스가 필요합니다.
링크를 통해 전달된 컨텍스트(메일 요약 내용 또는 관련 데이터)를 이해하고 해당 내용에 대한 대화를 시작할 준비를 합니다.
사용자의 자연어 질문을 이해하고, 초기 메일 요약 내용 및 챗봇 시스템이 접근 가능한 원본 정보, 그리고 제미나이의 지식 기반으로 가장 적절하고 유용한 답변을 생성합니다. (Google Gemini API 활용)
주요 대화 기능:
메일 요약 내용(TOP 3 및 추가 트렌드 포함)에 대한 상세 질문 및 답변
요약/대화 중 나오는 핵심 용어/개념에 대한 쉬운 설명 제공
관련 출처(원본 기사/보고서 링크 등) 및 배경 정보 제공 요청 처리
영향 분석에 대한 추가 설명 또는 다른 관점 제시 요청 처리
(확장) 메일 내용 외, 사용자 관심 분야 내에서 관련 정보 탐색 및 요약
기술 환경:

주요 개발 플랫폼: Google Apps Script (Gmail 연동, 스케줄링, 구글 서비스 연동 용이)
주요 서비스/기술:
UrlFetchApp (GAS): 외부 웹사이트 접속 (RSS, HTML)
XmlService (GAS) / JavaScript 기반 HTML 파싱 기법: RSS 및 HTML 분석
Google Gemini API: 정보 요약, 영향 분석, 중요도 판단 지원, 대화 응답 생성
MailApp 또는 GmailApp (GAS): 이메일 발송
Apps Script Time-driven Triggers: 스케줄링 (자동 실행)
Apps Script Web Apps: 챗봇 인터페이스 백엔드 구현
(필요시) 관련 데이터 저장/관리 방법 (Google Sheets, Script Properties, 또는 외부 DB 등)
정보 소스 (개발 범위):

초기 구현 목표 (RSS 활용):
https://www.medicaltimes.com/Users/Rss/rss.xml
http://www.docdocdoc.co.kr/rss
https://www.doctorsnews.co.kr/rss/rss.xml
https://www.medigatenews.com/rss/rss.xml
https://www.healthcareitnews.com/rss.xml (RSS 피드 존재 여부 및 정확한 주소 개발 중 확인 필요)
https://www.fiercehealthcare.com/feed (RSS 피드 존재 여부 및 정확한 주소 개발 중 확인 필요)
(향후 확장 고려):
보건복지부 보도자료 (예: mohw.go.kr 특정 게시판)
건강보험심사평가원 보도자료/정책 자료 (예: hira.or.kr)
식품의약품안전처 보도자료/허가 정보 (예: mfds.go.kr)
주요 AI/IT 헬스케어 회사 보도자료 페이지
추가 고려사항:

RSS/HTML 파싱 시 발생할 수 있는 오류(사이트 구조 변경, 네트워크 문제 등)에 대한 안정적인 처리 및 로깅.
Google Gemini API 사용량 및 비용 효율적인 관리.
수집 데이터 양 증가에 따른 처리 속도 및 데이터 관리 방안.
사용자(의사)의 피드백을 수렴하여 중요도 기준, 요약 스타일, 챗봇 답변 등을 개선해 나갈 과정.
개인 정보 및 의료 관련 정보 취급 시 보안 및 규제 준수 (환자 정보는 직접 다루지 않으나, 민감한 트렌드 정보 관련 고려 필요).
코딩 파트너께 드리는 말씀:

위에 정의된 목표와 요구사항을 바탕으로 Google Apps Script 환경에서 실제 작동하는 시스템을 구축하는 역할을 수행해 주시면 됩니다.
각 구현 단계(정보 수집 -> 요약/분석 -> 이메일 발송 -> 챗봇 연동)별 기술적인 구체화 및 코드 작성을 담당합니다.
개발 과정에서 요구사항에 대한 이해가 필요한 부분, 기술적인 어려움, 또는 더 나은 구현 방안에 대한 제안이 있으시면 언제든지 사용자(저)와 소통해 주세요. 사용자(저)는 프로젝트의 방향 설정과 요구사항 정의에 대해 가장 잘 이해하고 있습니다.

위의 요청 사항을 코딩 파트너에게 주고 작업 계속 진행

처음에 RSS 피드로 작업을 수행하였으나 RSS 피드를 다 제공하지 않는 웹사이트여서 웹크롤링으로 방향 전환 후 작업 중

현재 API 키를 넣는 과정까지 완성

결과와 배운 점

배운 점과 나만의 꿀팁을 알려주세요.

과정 중에 어떤 시행착오를 겪었나요?

  • 쉽게 완성할 수 있는 작업은 없다. 하지만 계속 하면 뭐든 나온다. 그게 원하는 결과는 아닐 수도 있다.

앞으로의 계획이 있다면 들려주세요.

  • 일단 시작했으니 완성하는 것이 목표입니다.

도움 받은 글 (옵션)

참고한 지피터스 글이나 외부 사례를 알려주세요.

(내용 입력)

👉 이 게시글도 읽어보세요