#9기임팩트
안녕하세요 저는 노마드G입니다
이번에 부트캠프9기에서 “AI 임팩트” 주제로 함께 하고 있습니다
4주차 과제는 Gpters의 사례들중 선별하여 정리 및 적용하기 입니다.
저는 초보자도 ChatGPT로 데이터를 다뤄보고 인사이트를 얻을 수 있는 사례를 찾았고,김정욱님의 ‘모르는 도메인 데이터 분석하기’ 글에서 힌트를 얻었습니다.
시장분석
새로운 사업을 발굴하거나 서비스를 만들어야할 때 시장분석을 하게되죠.
여러 방법이 있지만 거시적 관점의 시장/고객을 분석할때 오픈된 데이터들을 활용해 보곤합니다.
과연 전혀 모르는 곳의 데이터로 어떤 인사이트를 얻을 수 있을지 한번 시작해보겠습니다
참고로 공공의 데이터를 제공하는 사이트들이 많은데 몇곳 링크 걸어둡니다.
[국내]
공공데이터 포털 : 다양한 기관에서 오픈한 데이터들이 모여있음 데이터마다 csv, json+xml, xls 등 제공 방식이 다르며 파일 및 Open API로 제공
KOSIS 국가 통계 포털 :국가의 통계 데이터를 각 분야별 지표를 확인할 수 있음 다양한 포멧으로 다운 받을 수있음 (xlsx, slx, csv, txt, sdmx)
서울열린데이터광장 : 서울시와 연계 기간이 오픈한 데이터를 받아볼 수 있음. 데이터들은 파일로 다운로드 받을 수도 있고(csv) Open API를 통해서 데이터를 활용
한국소비자 참가격: 한국소비자원에서 제공하는 상품의 가격에 대한 데이터
e-나라지표
[국외]
Kaggle :사용자들에게 인기가 높은 데이터셋을 찾기에 좋음
Awesome Public Datasets : Github에 주제(농업, 경제, 교육 등)별로 분류된 방대한 데이터셋 목록
Google Dataset Search: 구글 검색하듯이 데이터 셋을 검색할 수 있는 서비스
미국정부 데이터: 미국정부 오픈데이터
세계 은행 오픈 데이터
저는 서울열린데이터광장에서 서울빅데이터 > 서울시민 생활 데이터에서 데이터를 찾아보았습니다.
행정동단위 10개 관심집단의 12월 데이터를 내려받았습니다.
엑셀형식의 데이터로 다운받았고 안에 내용구성은 아래와 같았습니다.
2023.12월_10개_관심집단_수.xlsx도대체 이 데이터로 어떤 인사이트를 얻을 수 있을지 아직은 감이 안잡힙니다. chatGPT 에게 2개의 엑셀 파일을 첨부하고 시작합니다.
1.ChatGPT 의 롤설정하기
2.엑셀파일을 첨부합니다
행정코드에 대한 정리된 엑셀
12월 10개 관심집단의 데이터 엑셀
3.ChatGPT가 데이터의 내용을 분석하고 정리해줍니다.
4.데이터를 통해 세울수 있는 가설 설정을 요청 10가지
5.가설중 선택하여 검증을 요청
분석결과에 대해 젊은 사람이 더 많은 동영상 서비스를 이용한다고 나왔습니다. 75세 이상에서도 비율이 높 은 데이터에 대해 흥미롭다는 반응을 하였고 추가 분석이 필요해보인다는 의견을 주었습니다.
그래서 추가로 75세 이상의 영상 시청 비율에 대한 추가 분석을 요청했습니다.
ChatGPT는 현재 제공받은 자료로는 분석이 제한적임을 지적하였습니다 해당 토픽과 연계된 일반적인 가설과 그 가설을 검증할 방법에 대해 알려주었습니다.
저는 추가로 75세 이상의 연령층에게 인기 있는 콘텐츠를 추천해달라고 했습니다
이번에도 제공된 데이터의 한계를 지적하고 일반적인 방법론을 답변해주었습니다.
이번 실험은 여기까지 하였습니다만 추가로 연령별 유튜브 콘텐츠 선호도 관련 추가 데이터를 구해서 학습시키고 인사이트를 도출해 내거나 추천 콘텐츠 유형 및 주제 타이틀 등 구체적인 내용을 질문하고 얻어내는 방향으로 발전 시킬 수 있을 것 같습니다.
다른 가설도 추가로 검증해보았습니다 5번 가설 :근무시간이 많은 집단과 재정상태에 대한 관심 집단의 관계: 출근 소요시간 및 근무시간이 많은 집단이 재정상태에 대한 관심이 높은 집단과 겹치는 경향이 있을 것이다.
Python 코드도 보여주며 답변을 해두었습니다.
5번 가설에 상관관계를 숫자로 표현해주고 이 지표를 어떤상황에 응용하면 좋을지 답변해주었습니다.
“근무 시간이 많은 사람들은 재정 관리와 관련된 정보나 서비스에 더 많은 관심을 가질 수 있다는 것을 의미” 라는 인사이트로 관련된 서비스와 마케팅 전략에 대해 정리해 달라고 요청했습니다.
정말 모르는 데이터를 통해 어떤 인사이트를 얻을 수 있을까 ? 생각으로 시작했습니다. 공공데이터를 통한 의외의 인사이트를 발견할 수 있었던 점이 흥미로웠습니다.
정리해보면
서울시민의 10개 관심집단의 데이터로 부터 10가지 가설을 도출
그중 2가지 가설에 대한 검증요청과 활용아이디어 도출
1)연령대가 젊은 20대 사람들의 동영상 콘텐츠 소비 비율이 높음
추가로 75세 이상에서도 높게 나온점 발견
>75세 이상이 좋아할 콘텐츠 유형 발굴 아이디어 제안
2)업무시간이 긴 사람들이 재정관련 교육/서비스에 관심이 더 높음
> 업무시간이 긴 생활 패턴을 고려한 서비스/마케팅 제안
== 니치한 마켓 & 타겟에 대한 발견을 함
배운점
저는 새로운 사업이나 서비스를 기획할때 “고객 발견”을 먼저 해야한다고 생각합니다. 내가 모르는 영역이라도 숨겨진 고객/시장을 발굴하는 과정에 챗GPT를 활용해 볼 수 있을 것 같습니다.
아직은 처음 시도한 분석이라 깊이가 떨어지만 좀 더 다양한 시도를 해보고 다음 글을 올려보겠습니다.
-노마드G-