소개
WMS(창고관리시스템) 현장에서 반복되는 수기 입력 작업을 줄이기 위해 OCR 기반 기능을 도입해보기로 했습니다. 현장의 효율을 높이고자 한 작은 시도였지만, 이 경험을 통해 AI 기반 워크플로우를 직접 설계하고 구현하는 데까지 확장되었습니다.
진행 방법
💸 외주 견적 vs 직접 구현
처음 견적을 받았을 땐 1천만 원 이상이 필요하다는 이야기를 들었어요.
하지만 현장에서 바로 피드백을 받고 빠르게 POC(Proof of Concept)를 반복하려면 직접 구현하는 것이 더 유연하다고 판단했습니다.
그래서 직접 바이브 코딩으로 빠르게 만들어보기로 결정!
🔧 사용한 도구 및 기술
FastAPI: API 서버 구축Supabase: 인증/DB 관리Tesseract: OCR 기능의 기본 엔진ViT 모델: 이미지 이해력을 높이기 위한 비전 트랜스포머 적용Google Vision: OCR 성능 비교 및 대안 실험
처음 접하는 기술이 대부분이어서 많이 막막했지만, 스터디 동기분들의 도움 덕분에 하나씩 이해하고 적용할 수 있었어요 🙌
결과와 배운 점
기술 하나하나가 처음에는 벽처럼 느껴졌지만, 작은 단위로 실험하고 적용해보니 어느 순간 연결되기 시작했어요.
외주로는 느낄 수 없는 ‘내 일처럼 붙잡고 이해하는 경험’이 정말 소중했습니다.
그리고 무엇보다 크게 와닿은 한 마디:
막막해도 시작하면 하나씩 보인다.
도움 받은 글 (선택)
(추후 추가 가능)
😀 함께 스터디 하며 실전에서 얻은 경험을 공유하게 되어 뿌듯합니다.
혹시 이와 비슷한 고민 있으신 분들은 부담 없이 시도해보세요.
정말 하나씩 보이기 시작하 거든요!