[코인프 스터디][개인] GPT를 통한 데이터 분석을 업무에 적용하기


먼저…저는 대학생을 꿈꾸는 직장인입니다.

기존에 B2C향 마케팅 업무를 주로 하다가 이직하면서 전략팀으로 배치되어 기획, 전략 수립 등의 업무를 수행중입니다.

개인적으로는 예전부터 데이터 분석에 관심이 있어서 파이썬도 배워보고 했는데, 업무에 적용을 하지 않으니 발전도 더디고, 점점 더 까먹게 되어서 현재는 주로 엑셀로 분석하면서 업무를 진행중인데요. (복잡한 분석이나 모델링은 데이터팀을 통해서 요청해서 결과값을 받아서 해석하지만, 이 과정에서 커뮤니케이션에 소요되는 시간 및 제대로 전달이 이뤄지지 못하면 그 것을 수정하고, 또 다시 요청하고, 데이터를 전달받고 하는 과정에서 상당히 타임로쓰가 있었음).

엑셀로 하다보면, 데이터 사이즈가 조금만 커져도 버벅임 + 수작업으로 시간이 많이 들어서 방법을 찾다가 GPT의 ADA를 알게 되었고, 이 수업까지 오게되었습니다. @.@

다른분들도 마찬가지일 것 같은데, 3차 강의까지 들으면서 운이 좋았다. 정말 잘 찾아왔다는 생각이 들었습니다 :)



배경 설명은 위에까지만 하고,

GPT를 통해서 분석을 진행해 보았습니다.

데이터는 변수나 컬럼 등을 간소화해서 내부 정보가 외부에 노출되는 것을 최소화하는 선에서 진행하였습니다.


▼우선은 파일을 업로드 하고, 기술통계 및 시각화에 대한 아이디어를 얻고자 했습니다.

▲ 위와 같이 시각화에 대한 아이디어를 주었는데, 데이터 값(컬럼, 변수명등)에 대한 정보를 최대한 숨기다 보니 GPT자체적으로 해석해서 데이터를 조금 다르게 인식하고 있는 것 같았습니다. (해당 부분은 과제 제출이 아닌 업무로 진행했다면, 좀 더 인사이트를 기대할 수 있을 것 같은데, 기존 경험해봤을 때 WoW할 수 있는 분석이나, 시각화는 잘 못봤던 것 같긴합니다…이부분은 전문가 분들께 조언을 구하고 싶습니다. 예상하는 가설에 대한 검증이 아닌 새로운 가설을 만들고 검증할 수 있게 사용하고 싶은데 아직은 지식이 부족한 것 같아요)


위 GPT가 제안한 것중 일부 진행하였는데, 새로운 인사이트를 도출해주진 않아서, 개인적으로 보고 싶은 뷰를 명확하게 제시했습니다.

“저는 멤버십 유형&할인 유형에 따라 CM(Contribution Margin)과 자사제품을 얼마나 사용하는지를 버블차트로 시각화하여 보고 싶었습니다. “

▼ 그래서 우선 아래와 같이, 버블차트 그리는데 필요한 정보가 무엇인지 물어본 후에 제가 원하는 정보를 입력했습니다.


그랬더니…. 아래와 같은 그림을 그려주었습니다. 눈이 많이 아픕니다….


다른 방법이 없는지를 물어보았습니다.


각 유형별 대표값으로 그려줘서 확실히 눈은 덜아프지만, 제가 원하는 버블형태가 아닌 X로 표현되어서 시각적으로 좋지 않았습니다.

그래서 원으로 바꾸고 레이블을 달아달라고 했습니다.


원이 너무 작아서 잘 안보입니다@.@

원을 키워달라고 합니다…


최종적으로 아래와 같은 그래프를 도출했습니다.

이 데이터값이 무엇을 의미하는지를 알고 있는 입장에서는 상당히 마음에 드는 그래프입니다. 간략하게 설명드리면,

1) LG라는 구독형 서비스를 이용하고 있는 고객들이 확실히 CM이 높은 편임을 이해할 수 있습니다. (내부적으로 할인형 구독서비스에 대한 우려가 있는 부분을 잠식시킬 수 있습니다)
2) 내부적으로 전혀 고려하지 않았던 J그룹가 고객수도 많고, CM이 구독형과 맞먹는 다는 점을 새롭게 도출하였습니다. (자사 제품 이용율이 높지 않음에도 이정도의 CM은 예상하지 못했습니다)

3) 내부적으로 긍정적으로 평가하고 있었던 H, H-end 그룹의 CM이 매우 부정적으로 나왔습니다. 이부분은 향후 정책 변경 등 의사결정이 필요한 포인트라 생각됩니다.



위 과제를 수행하면서 느낀 점은 정식 보고서 형태로 작성을 위해서는 편집이나 databackup등의 추가적인 업무가 필요하겠지만, 내부 공유 및 의사결정을 위한 데이터 분석으로는 시간적 효율이 상당하다는 것을 느꼈습니다.

저번에 어떤 분이 이야기해주셨었는데, GPT에 100%를 기대하는 것이 아닌, 20%를 투입해서 80%까지 GPT를 통해서 얻고, 나머지 20%을 추가하는 형태로 사용한다는 의미가 상당히 와닿는 것 같습니다.


향후 개선 방향은

1) 통계적인 지식을 좀 더 쌓는다 (초반 20%설정을 위한 디테일 강화)

2) 캐글 등 데이터 분석 관련해서 동일한 데이터를 다른 사람들은 어떤 시각으로 보는지를 참고하면서 시야를 넓힌다. 이를 통해서 초반 20%설정 및 보고/설득을 위한 전달 방식(시각화)에 대한 아이디어 얻기(마지막 20%)

3) GPTers그룹에서 다양한 분야의 전문가분들이 GPT를 활용하는 방법을 보고 배운다…(벤치마킹하면서 빠르게 기초 지식을 쌓는다)

로 정리하면서 올해가 가기전에 다양한 분석 업무 효율화를 이뤄보고자 합니다.


장황하고, 다소 부족한 글을 끝까지 봐주셔서 감사합니다.



7
3개의 답글

👉 이 게시글도 읽어보세요

모집 중인 AI 스터디