내 카톡을 AI로 자동화하기
개인이 자기 카카오톡을 AI가 대신 읽고 답하게 만들 수 있을까? 실제로 만들어 검증한 기록으로, 4가지 길과 함정을 AI 입문자 눈높이에서 풀었다.
📅 2026-07-04🧪 실제 PoC(개념검증) 기록 기반🏷 FnB AI Lab · 장사는 AI빨
✓결론: 가능하다 — 단 ‘편법’이라버너(예비) 계정 필수
01 카톡 AI 자동화의 핵심 요약
길게 읽기 전에, 이 문서가 답하는 4가지를 먼저.
✅
AI 자동응답 가능성
개인 카톡방을 AI(Claude)가 실시간으로 읽고 자동 답장하게 만들 수 있다. 우리가 실제로 만들어 STEP 5까지 작동을 확인했다.
⚠️
비공식 경로의 위험성
개인 톡방 자동화는 전부 ‘편법’. 그래서 ① 계정정지 위험과 ② PC/맥 24시간 가동이라는 비용이 따라온다.
⚖️
다양한 접근 방법
쉬운 대신 반쪽(텍스트만)부터, 사진까지 완전한 대신 위험한 길까지 4가지. 안정성 ↔ 완전성은 맞바꿈이다.
🔑
버너 계정의 중요성
무슨 길을 가든 본계정 말고 버너(예비) 계정으로. 정지돼도 괜찮은 계정으로 시작한다.
이 문서는 4가지 길을 입문자 눈높이로 풀고, 우리가 직접 밟은 길(iris)은 삽질과 함정까지 공개한다.
02
AI 자동화 전 알아야 할 5가지 개념
이 다섯 단어만 알면 나머지는 다 읽힌다. 한 줄씩.
🔐
카톡 DB (SQLCipher)
카톡이 모든 대화를 폰/맥 안에 암호로 잠가 저장하는 ‘금고’. 앱은 자기 금고만 열 수 있게 돼 있다.
🗝️
루팅 (rooting)
안드로이드 폰의 관리자 열쇠(마스터키)를 얻는 것. 이게 있어야 카톡 금고를 강제로 연다.
📱
에뮬레이터
PC 안에 띄우는 가상 안드로이드 폰(LDPlayer 등). 진짜 폰 대신 PC 에서 루팅 카톡을 굴린다.
👆
접근성 API
원래 보조기능. 앱이 화면을 대신 읽고 버튼을 대신 눌러줄 수 있어 자동화에 전용된다.
🧯
버너 계정
정지돼도 타격 없는 예비 계정. 자동화 실험은 무조건 여기서 한다.
💸
구독 CLI 호출 = API $0
AI를 API(사용량 과금) 대신 Claude 구독 CLI로 직접 호출하면 추가 API 비용이 $0. 이 문서 모든 방식이 이걸 쓴다.
03
카톡 AI 자동화의 4가지 방법
위로 갈수록 쉽고 안전하지만 반쪽, 아래로 갈수록 완전하지만 위험하다.
1
알림 리스너 앱
폰에 뜨는 카톡 알림을 읽고 알림의 ‘답장’으로 회신 · 루팅 없이 텍스트 자동응답 · 사진 못 읽음
정지 낮음~중
2
맥 네이티브 (kakaocli · kmsg)
맥용 카톡 로컬 DB를 읽고 접근성으로 답장 · 루팅·에뮬 불필요 · 텍스트 강함, 사진 수신추출은 아직 불안정
정지 중간
3
접근성 자동화 (매크로류)
안드 접근성 권한으로 카톡 화면을 읽고 조작 · 화면 떠 있어야 함 · 느리고 불안정, UI 바뀌면 깨짐
정지 중간
4
DB 옵저버 — iris 우리가 해본 길
루팅 폰에서 카톡 DB를 직접 열어 복호화 · 모든 대화·사진 원본을 실시간 완전 수신 · 루팅 필수, 약관 위반
정지 높음
한 줄 정리 — 텍스트만 급하면 길 1(제일 쉬움), 루팅 싫고 맥 있으면 길 2, 사진 원본까지 AI가 실시간으로 읽는 완전한 형태는 사실상 길 4(iris)뿐이다. ※ 카카오 공식 챗봇(비즈니스 채널)은 개인 1:1·단톡방엔 못 붙어 이 표에서 뺐다.
04
쉬운 방법 — 알림 리스너 & 화면 자동화
“일단 카톡 자동응답이 뭔지 30분 만에 체감” 하려면 여기서 시작한다.
길 1 · 알림 리스너 ★★★ 입문 최고
원리: 앱이 ‘알림 읽기 권한’을 얻으면 카톡 알림의 보낸사람·내용을 가로챈다. 안드 알림엔 ‘답장’ 액션이 있어 그 칸에 글자를 넣어 회신한다.
되는 것: 루팅 없이 텍스트 자동응답. 받은 글을 AI에 넘겨 답 생성까지.
막히는 곳: 사진을 못 읽는다(“사진을 보냈습니다”만 뜸). 방 음소거·절전·긴 글이면 샌다.
길 3 · 접근성 자동화 ★★ 비추
원리: 안드 접근성 권한으로 카톡 화면 자체를 읽고 버튼·입력을 대신 조작한다.
되는 것: 화면에 보이는 건 다 읽고 자동입력. 루팅 없이 사진 ‘존재’ 인식 정도.
막히는 곳: 카톡이 화면에 떠 있어야 하고, 느리고 불안정. 카톡 UI가 바뀌면 깨진다. 실전 자동화엔 약함.
두 길은 ‘맛보기’ 단계다 — 개념은 잡히지만 사진·안정성이 부족하다. 진지해지면 길 2(맥)나 길 4(iris)로 올라간다.
05
맥 네이티브 방법 (루팅 없이, 요즘 활발)
맥 카톡은 대화를 맥 안 로컬 DB에 저장한다. 루팅·에뮬 없이 읽고, 접근성으로 답장하는 오픈소스가 2026년 여럿 나왔다.
맥 오픈소스 툴 현황 2026-07 · 1차소스 직접 확인
툴
텍스트
사진
첨부
특징
kakaocli
✅ 완전
읽기+쓰기
❌ “DB에 보이지만 렌더 안 됨”
❌
로컬 DB 읽기전용 + 접근성 전송. 텍스트 전용 대표주자
kmsg 222★
✅ read/send (JSON)
🟡 보내기만 (send-image)
🟡 보내기만
DB 아닌 접근성 API 기반. has_image 표시만, 받은 사진 추출 없음
kmsg-mcp
✅ read/send
🟡 전송(저자 “불안정”)
✅ 받은 첨부 download
kmsg 감싼 MCP. ‘받은 첨부 꺼내기’에 가장 근접한 유일 사례
katok / k-skill
✅ 읽기+검 색만
❌
❌
NomaDamas · Apple Silicon 전용. 전송 기능 없음
정직한 정리직접 리서치
텍스트는 선택지가 많아졌다 — 읽기·쓰기 완성툴이 여럿이라 입문 난이도가 확 낮아졌다. 하지만 사진·첨부는 반쪽이다: ‘보내기’는 되지만 ‘받은 사진을 자동으로 꺼내 AI에 읽히기’까지 안정 구현·공개한 툴은 없다. “받은 사진을 스케줄로 긁어 어느 톡방 건지 매칭”하는 배치 자동화는 2026-07 현재 공개 완성품이 없어 직접 개발 영역이다.
계정정지는 맥이라고 안 사라진다주의
카카오 운영정책이 “매크로·자동화 도구 사용 = 비정상 이용 → 이용 제한 대상”이라 명시한다. kakaocli 개발자도 “이 사용으로 인한 계정 제한 등에 책임 안 진다”고 못 박았다. → 버너계정 원칙은 맥에서도 동일.
100만원대
Mac mini M4 최소사양(2026) · 기존 맥 있으면 0원
월 몇천원
24h 가동 전기료 (맥 저전력)
$0 API
툴 무료 오픈소스 + Claude 구독 직접 호출
추천도 ★★ — 루팅이 무섭고 맥이 있으면 가장 깔끔한 텍스트 자동화. 단 사진까지 원하면 아직 직접 개발 각오.
06
iris DB 옵저버 방법 (우리가 끝까지 해본 길)
사진 원본까지 AI가 실시간으로 읽는 완전한 자동화가 목표면 결국 여기로 온다. 가장 강력하고 가장 위험하다.
카톡은 대화를 폰 안 암호 금고(DB)에 잠가둔다. 루팅은 그 금고의 마스터키를 얻는 것, iris는 그 키로 금고를 열고 암호를 풀어 새 대화가 올 때마다 밖으로 알려주는 ‘금고 감시원’이다.
— 내 프로그램은 감시원이 넘긴 대화·사진을 Claude에 보여주고, AI 답을 다시 감시원을 통해 카톡방에 써넣는다
데이터 흐름
🖥 Windows PC (24시간 ON)
📱 안드로이드 에뮬레이터 (LDPlayer · 루팅)
K카카오톡 (버너계정)
대화·사진을 내부 DB에 저장
🛡 iris (금고 감시원)
DB 열어 복호화 → HTTP로 실시간 송출(:3000) · 텍스트+사진
▼새 메시지 실시간 전달▼
🐍 파이썬 봇Windows 실행
사진이면 파일로 저장 → Claude에 전달 → AI가 텍스트/사진 읽고 답 생성 → 카톡방에 전송
무료
iris · 에뮬 · 파이썬 전부 오픈소스
$0 API
Claude 구독 CLI 직접 호출
전기+구독
이게 사실상 비용 전부
우리가 실제 밟은 테스트 여정
0
STEP 0 · 조사✓ iris 채택
어떤 방식이 실제로 살아있나
예전 유명하던 node-kakao는 2023년 사망(로그인 자체 안 됨) → 폐기.
1
STEP 1 · 환경✓ 구동
루팅 에뮬 + 버너 카톡 + iris 구동
에뮬/루팅이라고 로그인이 막히진 않았다. 단 iris는 켤 때 카톡 알림 1건을 받아야 내부 인증이 열림(함정).
2
STEP 2 · 송수신✓ 왕복
톡방 글이 프로그램까지 오고 답장이 나가나
!echo 왕복 성공. 봇이 자기 답을 다시 받아 무한루프 도는 것 방지 장치 필요.
3
STEP 3 · 사진✓ 원본
사진을 원본 화질로 받나
4000×3000 원본 수신. 단 사진 1장은 원본, 여러 장 묶음은 썸네일(저화질)만 올 수 있음.
4
STEP 4 · 텍스트 AI✓ 자동응답
대화를 AI가 읽고 답하나
성공. 매 답이 AI 콜드스타트라 첫 답 5~20초 걸림(정상).
5
STEP 5 · 사진 AI (핵심)✓ 작동 확인
사진을 AI가 읽고 답하나
카톡이 사진과 설명글을 별개 메시지로 보냄 → “직전 사진을 기억했다가 붙이는” 처리로 해결. 텍스트·사진 모두 실시간 자동응답 확인.
밟으면서 실제로 걸린 함정 3가지
iris가 조용히 안 켜짐 → “카톡 알림을 1건 받아야” 내부 인증이 뚫리는 구조였음.
AI가 “사진이 안 보여요” → 카톡이 사진과 캡션을 따로 보내서, 질문 메시지엔 사진이 안 붙어 있었음. 방마다 직전 사진을 기억하게 고쳐 해결.
WSL(리눅스)에선 봇이 카톡에 못 닿음 → 연결이 Windows 쪽에만 열려서, 봇은 Windows에서 실행하기로 확정.
07
AI 자동화 운영 시 주의사항
“된다”와 “계속 안정적으로 된다”는 완전히 다른 문제다. 특히 길 4는 강력한 만큼 굴리기 어렵다.
한순간도 꺼지면 안 되는 4개 (약한 사슬)
1
PC가 켜져 있어야 함 (24시간)
2
에뮬레이터 + 카톡 로그인 유지
3
iris 감시원 프로세스 — 재부팅·앱 강종에 잘 죽음 (가장 약한 고리)
4
봇 프로그램
4개가 동시에 살아있어야 하고, 하나라도 죽으면 그동안 온 메시지를 통째로 놓친다.
계정정지 리스크가장 큼
원인은 루팅/에뮬 탐지가 아니라 ‘봇처럼 행동하는 것’(사람보다 빠르거나 많은 응답 = 약관 위반). 방어 = ① 버너계정만 ② 며칠 워밍업 ③ 응답 속도·양을 사람 수준 제한. 그래도 정지 가능성은 0이 안 된다(맥도 동일).
카톡 업데이트에 깨질 수 있음주의
iris는 카톡 내부 DB 구조를 직접 읽어서, 카톡이 업데이트로 구조를 바꾸면 하루아침에 먹통. 대응 = “일정 시간 메시지 0건이면 자동 경보”(슬랙 등)로 조용히 죽은 걸 즉시 감지하는 장치가 필수.
성능 한계주의
매 답이 콜드스타트라 첫 답 5~20초. 여럿이 빠르게 치는 바쁜 단톡방엔 부적합(답 밀림). → 1:1·조용한 방·문의성 방에 적합.
아직은 사람이 지켜봐야 함한계
GUI 에뮬(LDPlayer)이라 PC 화면 세션이 유지돼야 함(원격데스크톱 끊김·화면잠금 취약). 진짜 무인 24시간은 화면 없는 서버형(redroid 등) 이관이 필요 — 도커·커널 손 많이 감. 아직 안 넘어간 단계.
08
카톡 AI 자동화 선택 가이드
완벽한 하나는 없다. 목표에 맞춰 단계를 올린다.
🧭 입문자 추천 동선
① 자동응답 체감부터 → 길 1 알림 리스너(30분 맛보기)
② 텍스트 진지해지고 맥 있으면 → 길 2 맥 네이티브(kakaocli·kmsg)
③ 사진까지 실시간으로 필요하면 → 길 4 iris(우리가 검증한 길)
화면 매크로(길 3)는 불안정해서 건너뛰길 권함
🚫 무슨 길이든 금지
본계정 사용 — 정지되면 내 카톡이 통째로 날아감
사람보다 빠른·많은 응답 — 봇 패턴 = 정지 급행
“맥이면 사진·첨부 다 된다”는 착각 — 수신 사진 추출은 아직 직접 개발 영역
미션 크리티컬(결제·예약 확정)에 맡기기 — 조용히 죽는 특성상 사고
개인 카톡방에 AI 붙일 수 있나?
가능. 실제 구현·검증함(길 4 iris).
제일 쉬운 시작은?
길 1 알림 리스너 — 루팅 없이 텍스트 자동응답, 30분 맛보기.
사진도 AI가 읽나?
읽는다 — 길 4는 원본 실시간. 맥(길 2)은 아직 사진 수신추출이 불안정.
루팅 없이 하려면?
맥(길 2) — kakaocli/kmsg. 단 텍스트 위주.
공식 기능인가?
아니다(전부 편법). 그래서 정지위험·상시가동 부담이 따른다.
가장 큰 위험은?
계정 정지 → 버너계정 필수(맥 포함).
언제 깨지나?
카톡 대규모 업데이트 시 → “0건 경보”로 즉시 감지.
비용은?
AI 구독료 + 전기값(추가 API $0). 맥이면 하드웨어 100만원대(기존 맥 있으면 0).
무인 24시간 되나?
지금은 PC/맥 켠 반자동. 완전무인은 서버형 이관 추가공사 필요.
한 줄 인사이트
카톡 자동화의 진짜 킬러밸류는 ‘자동답장’이 아니라 ‘사진을 읽는다’는 데 있다.
텍스트 자동응답 앱은 널렸지만, 카톡에 온 사진(영수증·메뉴판·발주서)을 그 자리에서 읽어 정리해주는 건 흔치 않다. 그래서 사진까지 가는 길 4(iris)의 난이도·리스크가 정당화된다 — 목표가 ‘사진 비서’라면.
이 설명서가 도움이 됐다면 — 외식·자영업 사장님을 위한 AI 활용법을 유튜브에서도 풀고 있어요. 편하게 구경 한번 오세요.