Make에 입문한 건축가, '아이디어를 음성으로 말하면 카카오톡, 구글캘린더, 노션에 텍스트로 기록!'

A. 소개

  1. 아이디어는 순간적으로 떠오르고 금방 잊혀집니다.
    운전 중이나 산책 중, 갑자기 떠오른 생각을 메모하거나 기록하기란 쉽지 않았습니다.

  2. 떠오른 아이디어를 음성으로 말하면,
    자동으로 정리된 형태로 캘린더/노션/카카오톡에 저장되도록 하고자 했습니다.
    아이디어 기록을 자동화해 ‘기록 스트레스’를 줄이고 싶었습니다.

  3. 예전에는 잠들 때 머리맡에 노트와 펜을 놓고 잠들기도 했었는데,

    이제 핸드폰만 놓고 잠들면 될 것 같습니다.

.

.

B. '초기 아이디어 구상' 및 '시나리오 진행'

1.초기 아이디어 구상 흐름

Webhook으로 음성 수신 → Whisper로 텍스트 변환 → GPT-4o로 분류 및 요약 → 구분값에 따라 캘린더/노션/카카오톡 자동 기록

2.시나리오 흐름도

비즈니스 프로세스의 다른 단계를 보여주는 다이어그램
  • Webhook (음성 업로드)

  • Whisper (음성을 텍스트로 변환)

  • GPT-4o (아이디어/내용/구분 추출)

  • Router (구분값에 따라 분기)

    • 캘린더: Google Calendar에 일정 등록

    • 노션: Notion에 아이디어 등록

    • 카카오톡: Webhook 응답

.

.

C. 진행 방법

1.사용앱

  • Make.com: 전체 시나리오 설계 및 자동화

  • OpenAI Whisper: 음성을 텍스트로 변환

  • GPT-4o: 텍스트 요약 및 분류

  • Google Calendar: 일정 등록

  • Notion: 아이디어 목록 저장

  • Webhook 응답 (카카오톡 테스트): 응답 확인


2.핵심 흐름 요약

2.1 Webhook으로 음성 수신

아이콘이 다른 흰색 화면

(위) iPhone 단축어를 통해 음성을 말하면, 자동으로 음성파일을 업로드하고, Webhook으로 음성 수신

.

.

2.2 Whisper로 음성을 텍스트로 변환

한국어가있는 한국 앱의 스크린 샷

.

.

2.3 GPT-4o로 텍스트 분석 및 분류

녹색 화면이있는 웹 사이트의 스크린 샷

.

.

2.4 Router 모듈로 분기

녹색 버튼과 보라색 버튼이있는 웹 페이지의 스크린 샷

(위) 구분값이 "캘린더"이면 → Google Calendar에 일정 등록

.

다양한 유형의 정보를 보여주는 웹 페이지의 스크린 샷

(위) 구분값이 "노션"/"notion"이면 → Notion DB에 페이지 생성

.

다양한 유형의 정보를 보여주는 웹 페이지의 스크린 샷

(위) "카카오톡"이면 → Webhook 응답으로 테스트 메시지 반환

.

2.5 Google Calendar 연동

흐름도를 보여주는 웹 페이지의 스크린 샷

(위) 아이디어 = 일정 제목 / 내용 = 설명 / 시간 = now()

중국어가있는 캘린더

(위) 음성으로 입력한 아이디어가 구글캘린더에 등록된 화면

.

2.6 Notion 연동

중국어가있는 앱의 스크린 샷

(위) 음성으로 입력한 아이디어가 노션에 등록된 화면

  • 아이디어 = 제목 필드

  • 내용 = 설명 필드

  • 일시 = now()

.

2.7 카카오톡 연동

흐름도를 보여주는 화면

(위) 웹훅 설정

.

남자와 여자의 사진과 함께 한국 앱의 스크린 샷

(위) 음성으로 말한 아이디어가 텍스트로 정리되고, 텍스트를 Webhook으로 응답한 후 카톡에 전송된 이미지

.

.

D. 결과와 배운 점

  1. 머릿속에 번뜩 떠오른 아이디어는 있었지만, 수많은 시행착오를 거쳐 완벽히는 구현하지 못할 것이라는 두려움도 있었습니다.

  2. 하지만, 2번의 사례발표를 겪으며 조금씩 성장하고 있는 것을 느낍니다.

  3. Make를 접한지 2~3주밖에 안됐지만, 비전문가도 생각하는 아이디어를 구현하려는 의지만 있다면 불가능하지 않구나? 라는 것을 배웠습니다.

  4. 제가 발표한 지난 사례(아래 참조)에서 시행착오를 통해 배웠던 'GPT-4o의 JSON 분류출력'은 이후 자동화를 간편하게 만들었고, 이를 통해 음성으로 입력한 내용을 캘린더/노션/카카오톡으로 구분해서 보낼 수 있었습니다.

    지난사례 링크

.

.

E. 시행착오 및 해결이 필요한 부분

1.해결이 필요한 항목

1.1 아이디어 유형에 따라 자동 분류 정확도를 높이는 방법
→ 현재는 "캘린더", "노션", "카카오톡" 등 문자가 저장되는 장소를 키워드 기반으로 분기하지만, → 저장장소를 자주 사용하는 곳으로 지정하고, 아이디어의 종류에 따라 분기할 수도 있습니다.

1.2 아이디어 내용이 복잡한 경우 요약 또는 분류가 명확하지 않음
→ GPT 프롬프트 개선 필요

1.3 Webhook 응답으로 카카오톡 실제 전송되는 텍스트는 줄바꿈이 안되어, 인지가 쉽도록 개선이 되는지 고민중입니다.

.

2.추가 계획

- iPhone 단축어와 연동하여 Siri로도 아이디어 등록 가능하게 설정 예정

9
2개의 답글

👉 이 게시글도 읽어보세요