[AI 임팩트 보고서] 챗GPT를 활용한 데이터 분석 사례

하루가 다른 생성형 AI의 진화는 다양한 분야에서 캄브리아기 같은 급격한 변화를 만들어 내고 있으며, 데이터 분석 또한 큰 변화를 겪고 있습니다. 생성형 AI는 태생이 대화를 위해 만들어졌기 때문에 사용자의 의도를 정확하게 파악합니다. 이러한 인지 능력에 코딩 및 실행 능력이 더해지면서, '점 하나만 잘못 찍어도 결과를 알려주지 않던' 데이터 분석의 문턱을 낮추고, 더 많은 사람들이 이 분야에 접근할 수 있게 하고 있습니다.

과거에는 챗GPT가 코드를 작성하여 사용자에게 제공하고 사용자가 이를 외부 환경에서 실행하였으나, 이제는 챗GPT가 코드를 스스로 실행하고 결과를 사용자에게 제공하는 단계에 이르렀습니다. 이러한 기능은 아직 제약이 있지만, 현재 단계에서도 사용자의 데이터 분석에 많은 도움을 줍니다.

과거 챗GPT에서 고급 데이터 분석(Advanced Data Analysis)이라 불리던 플러그인은 지금은 챗GPT 플러스(유료 버전)로 흡수되었습니다. 따라서 챗GPT 플러스에서 고급 데이터 분석 기능을 기본으로 사용할 수 있습니다. 더불어 챗GPT 플러스에서는 'Explore GPTs'라는 메뉴를 통해 다양한 맞춤형 GPT 모델들을 제공합니다. GPTs는 챗GPT를 기반으로 하되, 특정 주제나 작업에 최적화된 맞춤형 AI 모델들입니다. 그 중 Data Analyst는 Open AI가 제공하며 데이터 분석에 특화된 GPT 모델입니다.

챗GPT의 Data Analyst를 사용하여 데이터를 분석하는 사례 3가지를 소개합니다.

첫째 글은 출근 시간대 서울 지하철 하차 인원이 어느 역에서 가장 많은지 분석합니다. 입문 단계의 글로서, 공공 데이터를 수집하고, 전처리 및 시각화 한 뒤 시계열 분석을 합니다. https://www.gpters.org/data-science/post/analysis-number-people-getting-C5KYpQrRkELcBaV

둘째 글은 파이썬 시각화 라이브러리인 Seaborn을 사용하여 국민건강보험공단의 건강검진 데이터셋을 시각화합니다. 다양한 Seaborn 그래프를 소개함과 동시에 챗GPT를 활용한 데이터 가공 분석 기법을 소개합니다. https://www.gpters.org/data-science/post/visualization-health-checkup-data-ZKpNQorMrZ02YX0

셋째 글은 머신러닝 알고리즘을 사용하여 보스턴 주택가격 데이터셋을 분석합니다. 챗GPT 안에서 머신러닝을 어디까지 학습시킬 수 있고, 그 결과물을 이어서 외부에서 어떻게 추가 분석할 수 있는지 알아봅니다. https://www.gpters.org/data-science/post/boston-housing-prices-machine-HQPV9hnVplKsP1S

1

👉 이 게시글도 읽어보세요