샘호트만
샘호트만
⚔️ 베테랑 파트너
🔬 임팩트 찐친

AI IMPACT : 데이터 분석 Guide (5/5) - ChatGPT ADA 기능을 더 레버리지하려면?

#9기임팩트 #AI임팩트

안녕하세요. AI 임팩트에서 데이터 분석 파트 글 작성한 정호영(샘호트만) 이라고 합니다.





Intro

데이터 분석 관련 글을 아래와 같이 4개의 글로 작성을 했습니다.


  1. 데이터 분석 입문 가이드

  2. 정형 데이터 분석 - 고객 Segment 나누기 (RFM)

  3. 비정형 데이터 정형화 - 카카오톡 데이터 Tabular

  4. 비정형 데이터 Text Mining


이제 전체적인 흐름을 알았지만 데이터 분석 영역 또한 실력을 건강하게 늘리려면 꾸준히 공부를 해야한다고 생각하는데요.

특히 분석 방향을 어느 정도 AI가 잡아줄 수 있지만, 데이터 분석 방향과 기획, 해석 영역은 Pilot 차이에 따라서 인사이트를 얻을 수 있는 수준이 다르다고 생각합니다.

제가 제작한 데이터 분석을 서포트 해주는 GPTs도 완전 데이터 분석 초보자에게는 조금 도움이 될 수 있지만 제 입장에서는 “조금 더 창의적인 분석을 해줄 수 없을까?”, “조금 더 분석을 내놓은 결과에 공격적이거나 유의미한 피드백을 줄 수 없을까?” 와 같은 아쉬움에 대한 갈증이 있습니다.

그래서 AI가 아직까지는 완전 만능이 아니기 때문에, 데이터 분석 공부를 초보분들에게 어떤 식으로 조언을 해줄 수 있는지 방향성에 대한 제 생각을 담았습니다. 물론 저도 많이 부족하지만 한번 제 생각을 적어보겠습니다. 아래 내용이 선행된다면, ChatGPT ADA 기능을 더더욱 잘 활용할 수 있을 것이라고 생각됩니다!


1. 남들이 데이터를 분석한 글들을 모니터링 하기

ChatGPT도 여러분들이 처음 마주했을 때 처음에 번역, 요약, 분류, 단순한 대화 정도로 사용했었던 시절을 기억하고 계실겁니다. 하지만 여기 GPTers에 있으면서 다양한 사례 글(상세페이지, 기획, 제안서, 포스터, 디자인, 광고, 이메일, 콘텐츠, SEO 최적화, 보고서 등등)을 보시면서 실력이 조금씩 느시는 것을 느꼈을 겁니다.


데이터 분석 또한 똑같다고 생각합니다. 천재가 아닌 이상, 데이터 분석 영역은 확실히 짬에 비례한다고 생각하는데요. 데이터 분석을 보통 요리에 엄청 비유를 많이 합니다. (아래 사진은 3~4년 전에 강의 했던 내용 일부)



요리사들이 기본적으로 재료를 봤을 때 다양한 요리로 승화시킬 수 있는 응용력을 가지고 있습니다. 그래서 우선 다양한 재료(다양한 형태/산업군의 데이터) 들을 많이 부딪히는 것을 우선 추천드립니다. 그리고 그에 맞는 손질법을 ChatGPT ADA 기능에 적용해보시는 것을 추천드립니다.


저의 경우는 형태(자연어)를 고정시켜 놓고 다양한 산업군의 데이터(공공, 통신, 은행, 보험, 과학, R&D 등)에 AI 프로젝트를 수행했었습니다. 실력을 가장 빠르게 습득하는 것은 Top-down 방식으로 당연히 분석 프로젝트를 하는 것이 정답입니다.


하지만 그 부분은 현실적으로 어려우니, 참고를 많이 할 수 있는 영역은 데이터/AI 플랫폼인 Kaggle 또는 데이콘이 제일 접근성이 좋습니다. 특히 분석을 입문하시는 분들은 ‘튜토리얼’, ‘simple’, ‘beginner’, ‘starter’ 등과 같은 키워드로 검색해서 분석한 내용들 많이 참고하시길 바랍니다!! (아래는 최근 30일 beginner 라고 검색했을 때 notebook, 분석 흐름을 보면서 ADA와 비교해보거나 따라하는 것을 추천)



2. 분석 방법론에 너무 매몰되지는 말자. 우선 활용과 다양한 뷰에 대한 해석 얻어내는 것에 집중하기

데이터 과학, 데이터 분석에서 일련의 과정은 다음과 같습니다. 개인의 연구나 실험의 시선이냐? 기업에서 분석을 하느냐? 분석 주체에 따라서 분석 과정은 아래처럼 나눌 수 있습니다.



여기서 ChatGPT의 ADA가 할 수 없는 부분은 모델링 제외하면 분석 목표 설정, EDA, 분석 주제 설정, 데이터 수집/가공 정도의 영역 입니다.



대다수 chatgpt에서 역할 부여를 한명 세팅하고, CoT 이상으로 크게 활용을 하지 않습니다. 프롬프팅하는 작성자의 피로도는 올라가는 단점이 있지만, 데이터를 해석하는데 멀티페르소나 같은 프롬프트 방식을 도입해서 활용해보시는 것도 추천드립니다.


아래는 헬스케어 관련 데이터에 대한 예시입니다. 충분히 분석결과가 나온다면 아래와 같은 전문가를 세팅하고 해석을 요청해본다면 새로운 답변을 얻을 수 있다고 생각합니다.



(샘호트만 데이터 분석 GPTs에 다양한 view로 해석할 수 있게끔 해달라고 조만간 업데이트 해보겠습니다!)


3. 데이터, 통계, 마케팅 관련 서적 읽기

솔직히 책을 많이 읽지는 않는 편이지만 개발 서적 이외에 사고의 지평을 넓히려면 다양한 책을 참고해야합니다. 저는 당장 실력을 올릴 수 있는 프롬프트 엔지니어링이나 ChatGPT 책도 좋지만, 다른 종류의 책들을 추천드립니다. 사람 그릇이 좋아야 창의력 있고 좋은 질문을 먼저 던질 수 있기 때문입니다!


  • 맥킨지 논리력 수업(21.12.01) :

    • 이건 데이터분석 뿐만 아니라, ChatGPT와 대화하는 것에 모두 해당이 되는 영역입니다. 대화하기 전에 ‘내가 AI한테 무엇을 얻고 싶은가?”에 대한 명확한 목표 설정이 제일 중요하다고 생각합니다. 물론 대화를 주고 받으면서 아이디어를 얻어서 인사이트를 얻는 방식 또한 있지만 원하는 답변을 얻는 시간이 오래걸립니다. 이 부분을 커버해줄 수 있는 부분이 프롬프트 엔지니어링도 중요하지만, ‘질문력’과 ‘논리력’ 또한 중요하다고 생각합니다.

    • 이 책은 특히 제가 분석하기 전 얻고 싶은 것을 명확히하고 → 문제 정의를 하고 → 이를 분해해야하는데 구조적인 사고를 도와주는 책이라고 생각합니다.

    • MECE 법칙, 구조화 전략, 문제 정의, 커뮤니케이션, 스토리라인 등 사고에 대한 내용을 다룹니다.


  • 데이터 문해력(21.03.05) :

    • 고난이도 통계 기법과 머신러닝 알고리즘보다 사람들은 얻고 싶은 것은 데이터 안에서 숨겨진 인사이트, 혜안들입니다. 이 것을 해석하게 도와주는 책이라고 생각합니다.

    • 분석에 대한 목적을 강조하고, 활용에 더 초점을 맞춘 책입니다!


  • 빅데이터를 활용한 예측마케팅 전략(17.08.10) :

    • 조금 시기가 지난 책이긴 하지만 이 책 또한 데이터를 어떻게 활용하는지 다루는 책입니다.

    • 책 중간에 데이터에 대해 물어보아야할 100가지 질문들이 있습니다. 마케팅에 포커싱이 되어있는 책이지만 ADA를 활용할 때 물어볼 수 있는 다양한 질문들이 존재하고, 사고의 지평을 넓힐 수 있는 책이라 생각합니다.


  • 감으로만 일하던 김 팀장은 어떻게 데이터 좀 아는 팀장이 되었나(21.08.16) :

    • 통계학을 쉽게 가르쳐주는 책들이 시중에 많습니다. 이 책은 스토리텔링에 강점이 있는 책입니다.

    • 데이터를 처음 접할 때 가이드 역할 또한 해주면서, 오해할 수 있거나 잘못 해석할 수 있는 부분을 잡아주는 책이라 생각합니다.


다들 openAI가 닿지 못하는 다양한 데이터들을 가지고 있을 것입니다. 재미있는 분석하면서 다양한 분석 결과를 ChatGPT ADA를 통해 더 쉽고 빠르게 얻어가셨으면 좋겠습니다.


개인적으로 일이 많아 글을 쓸 여유는 없지만 종종 GPTers 글 재미있게 모니터링하고 있겠습니다.


감사합니다 :)

8
6개의 답글

👉 이 게시글도 읽어보세요