박카스
박카스
🎻 루키 파트너
🚀 SNS 챌린지 달성자

충격, 아직도 손으로 블로그 쓰시나요? 카톡방에 '키워드'만 던지면 끝나는 현실

안녕하세요, AI 블로그자동화 스터디장 박카스입니다.

당신은 오늘도 퇴근 후 지친 몸을 이끌고 책상 앞에 앉아 깜빡이는 텅 빈 화면을 보며 한숨 쉬고 있겠군요. 블로그로 수익화를 하겠다고 다짐했지만 막상 글감을 찾고 자료를 조사하고 문장을 다듬는 데만 두세 시간이 훌쩍 지나가지 않나요. 저도 그랬습니다. 마우스 스크롤만 내리다가 결국 유튜브만 보다가 잠들곤 했으니까요.

컴퓨터와 책상에 앉아 있는 만화 곰

하지만 그게 바로 당신이 실패하는 이유입니다. 글쓰기는 노동이 아니라 설계여야 합니다. 저는 이 지긋지긋한 '백지 증후군'에서 탈출하기 위해, 내 손안의 카카오톡을 최고의 비서로 만들기로 결심했습니다. 단순히 챗GPT에게 말을 거는 수준이 아닙니다. 내가 침대에 누워 "이거 써줘"라고 키워드만 던지면, 알아서 자료를 찾고, 분석하고, 심지어 내 말투로 글을 완성해주는 '자동화 시스템'을 구축했습니다. 이건 마법이 아니라 기술입니다.

<진행 방법>

저는 Python(FastAPI)으로 뇌를 만들고, JavaScript(메신저봇)로 손발을 만들었습니다. 그리고 그 뇌에는 Google Gemini 2.5 Flash 모델을 이식했죠. 당신이 생각하는 것처럼 복잡한 서버 장비는 필요 없습니다. 구글 클라우드에 작은 서버 하나만 띄우면 됩니다.

숫자 목록을 보여주는 컴퓨터 화면의 스크린샷

핵심은 구조입니다. 메신저봇이 사용자의 명령을 듣고 서버로 신호를 보냅니다. 서버는 그 신호를 받아 인터넷을 뒤지고 영상을 분석한 뒤, Gemini에게 "이 데이터를 바탕으로 글을 써"라고 명령합니다.

1. 뇌를 담당하는 서버 (Python + FastAPI + Gemini)

가장 중요한 부분입니다. 저는 Gemini에게 단순한 요약이 아니라 '페르소나'를 부여했습니다. 특히 유튜브 영상을 분석할 때 자막이 없으면 포기하는 반쪽짜리 봇들과 달리, 자막이 없으면 영상을 오디오로 다운로드하여 직접 Gemini에게 '들려주는' 기능을 넣었습니다. 이게 기술 격차입니다.

# FastAPI 서버 핵심 로직 (유튜브 오디오 분석 및 AI 글쓰기)
@app.get("/summarize")
def summarize_url(url: str):
    # ... (중략)
    # 자막이 없을 경우 오디오를 다운로드하여 Gemini에게 직접 듣게 함
    audio_file = f"temp_{video_id}.mp3"
    try:
        # yt_dlp로 오디오 추출
        with yt_dlp.YoutubeDL(ydl_opts) as ydl: ydl.download([url])
        
        # Gemini 멀티모달 기능을 이용해 오디오 파일 업로드 및 분석
        uploaded = genai.upload_file(audio_file)
        model = genai.GenerativeModel("models/gemini-2.5-flash")
        prompt = "이 오디오의 내용을 듣고, 핵심 정보를 5~7개의 글머리 기호로 상세히 요약해주세요."
        res = model.generate_content([prompt, uploaded])
        return "유튜브 요약 (오디오)", res.text.strip()
    except Exception as e:
        return "실패", f"분석 불가: {str(e)}"

2. 손발이 되는 메신저봇 (JavaScript)

서버가 아무리 똑똑해도 접근성이 나쁘면 안 씁니다. 카카오톡 봇을 통해 언제 어디서든 서버를 호출할 수 있게 만들었습니다. 단순히 링크를 던지면 요약해주고, "키워드"를 던지면 글을 써줍니다.

한국어로 된 문자 메시지의 스크린샷
// 카카오톡 봇 스크립트 (서버 통신)
if (content.startsWith("카스야 키워드")) {
   var keyword = content.replace("카스야 키워드", "").trim();
   send(msg, "🤖 AI 작가가 '" + keyword + "' 집필 중... (15초 소요)");
   
   // 파이썬 서버로 작업 요청 전송
   var resKeyword = httpPostJson(API_BASE + "/relay/auto_blog", { keyword: keyword });
   
   if(resKeyword) {
      var jsonKey = JSON.parse(resKeyword);
      send(msg, "✅ 전송 완료!\n제목: " + jsonKey.generated_title + "\n\n집 PC가 곧 처리합니다.");
   }
}
어두운 방에 있는 코드 편집기의 스크린샷

3. 영혼을 불어넣는 프롬프트

가장 중요한 것은 AI에게 '어떻게' 시키느냐입니다. 단순히 "글 써줘"라고 하면 기계적인 글만 나옵니다. 저는 AI에게 '마케팅 캡틴'이라는 구체적인 역할을 주고, 검색 기반 팩트 체크와 독자 타겟팅을 강제했습니다. 아래 프롬프트가 제 비법 소스입니다.


사용된 시스템 프롬프트 (System Prompt): 당신은 '20기 블로그 마케팅'의 총괄 전략가이자 실행 파트너, '마케팅 캡틴'입니다.

[제 1원칙: 검색 기반 팩트 체크 (Search-First)]
사용자가 키워드를 던지면, 무조건 Google 검색 도구를 먼저 실행하여 검증하세요.

[제 2원칙: 철저한 빙의와 신분 세탁]
절대로 블로그 본문 안에 "AI", "언어 모델" 같은 말을 쓰지 마세요.

오직 **0단계에서 설정한 [블로그 닉네임]**으로만 자신을 지칭하세요.

[제 3원칙: 꿈의 고객에게 1:1로 말하기]
불특정 다수("여러분")에게 말하지 마세요.

꿈의 고객 한 명을 당신 앞에 앉혀두고 편지를 쓰듯이 글을 작성하세요.

(중략... 4단계 프로세스 및 시각화 지침 포함)

<결과와 배운 점>

결과는 놀라웠습니다. 퇴근길 지하철에서 "카스야 키워드 아이폰16 출시일"이라고 톡 하나만 보내면, 집에 도착했을 때 이미 완벽하게 구조화된 초안이 저를 기다리고 있었습니다. 제가 한 일이라곤 퇴근길에 톡만 보낸 것뿐인데 말이죠.

이 과정에서 뼈저리게 느낀 점은, '자동화'는 버튼 한 번으로 완성되는 마법이 아니라, 치열한 '조율'의 결과라는 것입니다. 처음에는 그저 코드를 복사해서 붙여넣으면 끝날 줄 알았습니다. 하지만 서버와 메신저봇이 손발이 안 맞아 삐걱거릴 때마다, 그리고 AI가 뱉어낸 글이 기계적인 번역투 같아서 실망했을 때마다 수없이 무너졌습니다.

하지만 포기하지 않고 Gemini를 스승 삼아 밤새 파이썬과 자바스크립트 코드 한 줄 한 줄을 최적화하고, 무엇보다 AI에게 '사람의 영혼'을 불어넣기 위해 프롬프트를 깎고 또 깎았던 그 지루한 시간들이 결국 빛을 발하더군요. 남들이 "AI 글쓰기는 어색해서 못 써"라고 포기하고 돌아설 때, 그 한 끗 차이를 만들기 위해 견뎌낸 인내의 시간이 결국 압도적인 퀄리티의 격차를 만듭니다.

혹시 파이썬 코드가 어렵다고 생각하시나요. 그건 당신이 개발자가 되려 하기 때문입니다. 우리는 개발자가 아니라 '설계자'가 되어야 합니다. 코드는 도구일 뿐이고, 중요한 것은 당신이 어떤 파이프라인을 설계하느냐입니다.

이제 노동하지 말고 지휘하시기 바랍니다:)

건물 꼭대기에 서 있는 남자와 그 위에 로봇이 있는 이미지
11

뉴스레터 무료 구독

👉 이 게시글도 읽어보세요