무지성으로 AI 시켜서 날로 먹으려다가 맞이한 처참한 실패 사례

소개

아는 분이 혹시 자동화 해줄 수 있냐고 주신, 특정 지역에 대한 분석 내용을 담은 xls 문서를 하나 가지고 있었다.
보니까 여러가지 데이터를 가져와서 보기 좋게 만든 파일이다.
(아래와 같은 식으로 결과물이 출력되는 파일)

그래프와 차트가 포함된 사업 계획 템플릿


어서 사례글도 써야 하고 왠지 AI에게 분석부터 전부 시키면 알아서 하지 않을까? 하는 생각으로 터미널을 열고 클로드코드를 불러서 무작정 시작 했다.
다른 업무 보면서 한번씩 잘하고 있나 확인만 하고, 필요해 보이는 API 발급 받아서 던져주고, 호출 메뉴얼도 받아서 주고 알아서 하라고 했다.

결론은! 그냥 이렇게 막무가내로 시켜면 망한다는 거였다.
사례글로 쓰기 부끄럽지만, 다시는 이렇게 하지 않겠다는 다짐으로 기록을 남긴다.

여기서 부터는 AI가 분석한 필요한 데이터다.

#### A. MOIS (행정안전부) API
1. **인구통계 API**
   - 엔드포인트: `https://apis.data.go.kr/1741000/stdgPpltnHhStus`
   - 액션: `selectStdgPpltnHhStus`
   - 데이터: 인구수, 세대수 (시도/시군구별)
   - **매핑**: Ⅰ-2-가. 인구변동추이

2. **행정구역 API**
   - 엔드포인트: `https://apis.data.go.kr/1741000/LocalGovernment`
   - 액션: `getLocalGovernment`
   - 데이터: 행정구역 정보
   - **매핑**: Ⅲ-1. 행정구역 현황

#### B. SGIS (통계지리정보시스템) API
1. **센서스 통계 API**
   - 엔드포인트: `https://sgis.mods.go.kr/openapi/EmdAnnlSta/getEmdAnnlSta`
   - 데이터: 사업체수, 종사자수
   - **매핑**: Ⅱ-1. 사업체 현황

#### C. MOLIT (국토교통부) API
- **필요 API**:
  1. 아파트 실거래가
  2. 지가변동률
  3. 표준지공시지가
  4. 미분양주택 현황

### 4.2 추가 필요 API

#### A. 높은 우선순위

1. **국토교통부 - 지가변동률 API**
   - 목적: Ⅴ-1. 지가변동률 데이터 수집
   - 필요 데이터: 지역별, 용도별, 월별 지가변동률
   - **가장 중요한 섹션**

2. **국토교통부 - 표준지공시지가 API**
   - 목적: Ⅴ-2. 표준지공시지가 변동률
   - 필요 데이터: 연도별 표준지 공시지가

3. **국토교통부 - 아파트 실거래가/매매가격지수 API**
   - 목적: Ⅴ-3. 아파트 매매가격지수
   - 필요 데이터: 지역별, 월별 아파트 매매가격지수

4. **국토교통부 - 미분양주택 현황 API**
   - 목적: Ⅰ-2-다. 미분양주택 현황
   - 필요 데이터: 지역별, 연도별 미분양 호수

#### B. 중간 우선순위

5. **통계청(KOSIS) - 주택통계 API**
   - 목적: Ⅰ-2-나. 주택수 및 보급률
   - 필요 데이터: 주택 유형별 호수, 주택보급률
   - **현재 SGIS에서 일부 가능할 수 있음**

6. **행정안전부/지자체 - 예산정보 API**
   - 목적: Ⅱ-2. 예산규모 및 재정자립도
   - 필요 데이터: 일반회계, 특별회계, 재정자립도
   - **수동 입력 가능성 높음**

#### C. 낮은 우선순위 (수동 입력 권장)

7. **의료기관 정보**: 건강보험심사평가원 또는 수동
8. **학교 정보**: 교육부 또는 수동
9. **주요개발사업**: 지자체 공고 또는 수동

분석을 잘했다는 생각으로,
이제 데이터 API로 가져와서 워드 파일로 보고서 만들라고 시켰다.
아래 내용은 3일간 진행한 토큰 낭비 결과다.

# 3일 동안 노력한 지역분석 자동화 시스템

> 목표 : "손으로 일일이 복붙하던 지역분석 보고서, 이제 클릭 한 번으로 만들자"

## 📌 프로젝트 한눈에 보기

- **프로젝트명**: 지역분석 보고서 자동 생성 시스템
- **개발 기간**: 2026년 3월 31일 ~ 4월 2일 (3일)
- **사용 도구**: Claude Code (AI 코딩 어시스턴트)
- **주요 성과**:
  - 5개 정부 API 자동 연동
  - 50,099개 법정동코드 데이터베이스 구축
  - Word 보고서 자동 생성
  - 수작업 대비 **95% 시간 절감하려 했으나 실패**

---

## 🎯 왜 이 프로젝트를 시작했나요?

### 반복되는 업무의 고통

매번 새로운 지역을 분석할 때마다:
- 5개 정부 사이트를 일일이 방문해서 데이터 다운로드
- 엑셀에서 수작업으로 데이터 정리
- Word에 표를 일일이 만들고 복사-붙여넣기
- **하나의 보고서 완성에 평균 4-6시간 소요**

"자동화할 수 있을 텐데..." 라는 생각으로 무작정 시켜봤습니다.

### AI 코딩 도구

Claude Code 열고 니가 분석해서 만들어로 시작했습니다.

---

## 🚀 3일간의 여정

### Day 1 (3월 31일): "알아서 하지 않을까?"

**오전**: AI에게 프로젝트 아이디어 설명
```
"내가 주는 엑셀파일 분석해서 워드 문서로 최종 결과물 나오게 만들어줘"
```

**AI의 반응**: 즉시 프로젝트 구조를 제안하고, 필요한 기술 스택을 추천
- FastAPI (웹 프레임워크)
- python-docx (Word 문서 생성)
- httpx (API 호출)

**오후**: 첫 번째 API 연동 성공
- 국토교통부 아파트 실거래가 API 연동 
- 다 됐다고 했지만 다 안된거였음. 몇번이나 다시 수정하라고 시킴

**저녁**: 한국부동산원 API 통합 시도
- 공식 기술문서 제공
- AI가 문서를 읽고 자동으로 코드 생성
- 60개 데이터 정상 수신 -> 엄청 여러번 다시 작업 시킴

**Day 1 성과**: 기본 뼈대 완성, 2개 API 연동

다 됐다고 했지만 실제로는 안되는게 허다했음. 워드 결과물에 데이터란은 빈칸 투성이였음. 몇번이나 다시 수정하라고 시킴

### Day 2 (4월 1일): "다됐나?? 아니군... "

**오전**: 나머지 API 통합
- 행정안전부 (인구통계)
- 통계청 SGIS (사업체 통계)
- VWorld (지도/지가 정보)

**오후**: 미분양 데이터 수집 기능 추가
- CSV 파일 자동 다운로드
- 엑셀 대신 자동으로 데이터 정리

**저녁**: 첫 테스트 - 서울 강남구 보고서 생성
- 10분 만에 20페이지 보고서 완성
- "이게 된다고...? 아 안되는구나."

**Day 2 성과**: 5개 API 모두 연동 시도, 첫 보고서 생성 성공
보고서는 생성되었으나 자연어 외에 모든 데이터란은 비어 있었음.
---

### Day 3 (4월 2일): "디버깅의 늪"

**오전**: 전주시 완산구 보고서 시도
- 결과물 확인... **모든 표가 비어있음** 😱
- "아니, 어제는 그래도 일부는 됐는데..."

**문제 발견 1**: 법정동코드 처리 오류
- 10자리 법정동코드 vs 5자리 행정구역코드
- AI가 행정안전부 공식 법정동코드 파일(2.2MB, 50,099개 코드) 로딩 시스템 구축

**점심**: 또 다른 문제 발견
- 2024년 "전라북도"가 "전북특별자치도"로 변경
- 코드 체계가 45xxx → 52xxx로 바뀜
- AI가 자동으로 양쪽 코드를 모두 시도하는 호환성 로직 추가

**오후**: 세 번째 문제의 진실
- 데이터는 잘 수집되는데, Word 문서에 표시만 안 됨
- 원인: 문서 생성 코드가 실제 데이터 대신 빈 템플릿만 생성하고 있었음
- AI가 5개의 새로운 함수를 만들어 데이터를 제대로 표시하도록 수정

**저녁**: 최종 성공 ✅
- 전주시 완산구 보고서 완성
- 293개 인구 데이터, 39개 지가 데이터 정상 표시
- 4개 표에 실제 데이터 출력, 나머지는 "데이터 없음" 명확히 표시

**Day 3 성과**: 

차트실종에 지맘대로 샘플데이터 넣고...지가변동율은 그냥 나열하고...ㅠ.ㅜ 망했다.
현재 상황에서 이녀석과 더 티키타카 하는 건 시간 낭비, 토큰 낭비다. 

### 5개 정부 API 통합

각 정부 기관마다 API 방식이 완전히 다릅니다:
- 국토교통부: JSON 응답
- 행정안전부: XML 응답
- 통계청: OAuth 인증 필요
- 한국부동산원: CSV 파일 다운로드
- VWorld: RESTful API

**혼자였다면**: 각 API 문서를 읽고 이해하는 데만 일주일 이상 걸렸을 것입니다.

**AI와 함께**: 기술문서 PDF를 AI에게 주니, 알아서 읽고 표준화된 코드로 변환. 3일 안에 5개 모두 통합했지만.... 여전히 가져와 지지 않는 데이터가 있음.
----
### **디버깅의 마법**

**Day 3의 "빈 표" 문제**를 해결하는 과정:

나: "모든 표가 비어 있는데 왜 그런 거지?"

AI: (로그 확인) "데이터는 293개 수집됐는데, 문서 생성 코드를 확인해볼게요"

AI: (코드 분석) "아, 문제를 찾았습니다! `_add_placeholder_table()`만 호출하고 실제 데이터를 넣는 함수가 없네요. 5개 함수를 새로 만들겠습니다."

5분 후 → 문제 해결 ✅

일부데이터는 표기가 되었지만, 내가 생각한 방식의 집계가 아니었음.
내가 원하는 바를 명확히 설명하지 않았으니 모든게 내 잘못...

---

## 📊 구체적인 성과

### 개발 속도
| 작업 | AI 없이 예상 | AI와 함께 실제 | 단축률 |
|------|-------------|--------------|-------|
| API 연동 (5개) | 2주 | 2일 | **85%** |
| 법정동코드 시스템 | 1주 | 4시간 | **95%** |
| 버그 디버깅 | 3-5일 | 1일 | **80%** |
| **전체 프로젝트** | **1-2개월** | **3일** | **95%** |

### 업무 효율
| 지표 | 이전 (수작업) | 이후 (자동화) | 개선율 |
|------|-------------|-------------|-------|
| 보고서 1건 작성 시간 | 4-6시간 | 5분 | **98%** |
| 데이터 정확도 | ~85% (수작업 오류) | ~100% (API 직접 연동) | **+15%p** |
| 최신 데이터 반영 | 월 1회 | 실시간 | **∞** |

### 코드 규모
- **총 파일 수**: 32개
- **총 코드 라인**: ~3,500줄
- **AI 도구 사용 횟수**: 417회
  - 파일 수정: 81회
  - 명령 실행: 109회
  - 파일 읽기: 49회
  - 작업 추적: 50회

---

## 🎓 배운 교훈

### "빠른 시작"과 섣부른 시도는 나를 늪으로 인도 한다.

나도 제대로 분석해 보지 않은 문서를 AI에게만 맡긴 것은 너무 무모했다. 

### 사용되는 데이터에 대해 명확히 집계 방식을 설명해야 한다.
### AI에게 내가 어떻게 명령하면 어떤 결과가 나오는 걸 원한다고 말해줘야 제대로 만들었는지 AI도, 나도 알 수 있다.

실패 했고, 다시 수정하라고 시키자니 시간낭비 일꺼 같아서 과감히 포기한다.
괜찮다! 나에게는 발급 받아둔 API키가 남아 있고, 실패 경험이 있다. 
다시 제대로 시작해서 만들면 된다. 


뉴스레터 무료 구독

👉 이 게시글도 읽어보세요