[1주차] 데이터 리터러시를 위한 데이터베이스 기반 챗봇 개발 - 계획

목적

데이터 리터러시를 향상시키기 위해 RAG와 Text-to-SQL기반의 데이터베이스 챗봇을 개발하고자함. 이를통해 데이터 접근성을 높이고 데이터기반 의사결정을 가능하게하여 업무의 효율성 및 생산성을 향상하고자 한다.

주요 기능 (우선순위)

  • 자연어 질의 처리 및 SQL 쿼리 생성

사용자의 자연어 질문을 이해하고 적절한 SQL 쿼리를 생성하여 제공

  • SQL 쿼리 해석 및 검증

생성된 쿼리의 의미를 해설하고, 문법 오류나 실행 오류를 검증하여 사용자에게 안내

  • 데이터 디스커버리 지원

테이블 및 컬럼의 메타 정보를 제공하고, 비즈니스 용어에 대한 설명 제공

  • 비즈니스 용어 및 도메인 지식 반영

사내에서 사용하는 비즈니스 용어와 도메인 지식을 기반으로 정확한 답변 제공

계획

[1주차] 자료 조사 및 아키텍처 설계‎

  • 해당 기능을 구현한 오픈소스 및 자료 조사

  • 시스템 아키텍처 설계

  • 데이터 수집 및 전처리 (Few-shot 학습 데이터 구축)

[2주차] 개발 환경 구축 및 기본 기능 구현

  • 개발에 필요한 라이브러리 설치

  • 벡터 스토어 구축 및 데이터 저장

  • 쳇봇 인터페이스 개발

​[3주차] 주요 기능 개발 및 성능 평가

  • Text-to-SQL 기능 및 주요 기능 개발

  • 주요 기능 성능 평가

[4주차] 시스템 배포 및 성능 개선

  • 시스템 배포 준비 및 실행

  • 성능 모니터링 및 성능 개선

** 성능 및 기능이 완벽하지 않더라도 아키텍처를 구현해 배포까지 해보는 것에 의의를 둠

참고자료

AI 데이터 분석가 ‘물어보새’ 등장 – 1부. RAG와 Text-To-SQL 활용
Vanna
업무 효율화를 위한 카카오 사내봇 개발기 / if(kakaoAI)2024

6
1개의 답글

👉 이 게시글도 읽어보세요