ChatGPT로 고객 서베이 응답자의 직무 카테고라이징 하기


안녕하세요.

저는 광고 회사에서 미디어(사이니지 및 광고 콘텐츠)에 대한 서베이를 진행하여 고객 정보 분석을 하는 업무에 ChatGPT를 활용해보았습니다.

데이터분석에 대해서 사실 잘 알지 못하고 AI 초급자라서.. 많은 것을 공유해드릴 수는 없지만 최근 AI 활용 사례를 다양하게 공유하는 자리임을 유념하며 사례 발표에 한번 도전해봅니다..!!😁


1. MISSION : ChatGPT로 무엇을 할 것인가

저희는 이 서베이를 통해서 우리 회사 미디어의 주요 이용객이 직장인인 점에 주목하여 근무기간(연차)와 직무 정보를 수집하였는데요.

그런데 서베이를 통해 응답을 확인해보니 저희가 사전에 분류했던 항목 이외의 기타 답변이 상당히 많더라구요. 이 기타 답변을 어떻게 재분류 할 지 막막했습니다.

막막했던 이유는, 저희가 상정했던 항목에서 ‘미처 생각지 못했던 직무를 포함시켜 재설정하고, 새롭게 분류를 하는 데까지 많은 시간이 소요될 것 같아서’ 였습니다.

이러한 시간 소요의 문제를 해결하기 위해서 ChatGPT를 사용하게 되었고, ChatGPT를 통해 제가 수행하려 한 과제는 다음의 두 가지였습니다.


[과제]

1. 기존 직무 항목과 같은 항목으로 분류해도 무방한 직무를 포함시켜 재분류하기

2. 기존 항목 외 추가로 분류해야 할 필요성이 생긴 직무를 파악하여 리카테고라이징하기


[참고사항]

  • 서베이의 총 응답자 수는 749명이고, 기타 응답은 105개였습니다.

  • 설정한 직무 항목은 아래와 같습니다.

1️⃣ 마케팅/홍보 (상품 기획&개발/브랜딩 등)
2️⃣ 경영지원 (인사/총무/구매)
3️⃣ 영상/디자인 (영상콘텐츠/UI디자인 등)
4️⃣ 영업/유통 (영업 관리/판매/무역 관리 등)
5️⃣ 전문직 (변호사/의사/회계사/연구원 등)
6️⃣ 생산/기술/제조
7️⃣ 기타

» 응답자들이 기타에 기재한 직무는 대체로.. 이러했는데요.

» 대충 훑어보니 저희가 만든 서베이 항목에는 금융, IT 관련 직무가 없었더라구요. 그리고 제약 마케팅이나 전략기획 등의 직무 분들도 기타에 직무를 표기했다는 것 정도는 훑어보는 것만으로도 알 수 있었습니다. 하지만 우리는 단순 훑어보는 것에서 그치는 게 아니라 직접 raw data를 업데이트를 해야했고요..ㅠ 그래서 과연 이 부분을 ChatGPT가 잡아내서 분류를 다시 해주고 파일로 저장해줄 수 있는지 확인해보고자 하였습니다.


2. ACTION : ChatGPT에 엑셀 파일 읽혀보기

Step1. 우선 응답자들이 기재한 직무를 긁어서 따로 새로운 엑셀 파일에 붙여넣기 하여 A열에는 연차 정보를, B열에는 직무 정보를 기재하였습니다. 그리고 나서는 ChatGPT에게, 항목을 재정리해서 C열에 기재해서 저장해 달라고 요청해 보았습니다.


무언가 파일을 읽는 작업을 하고 있는데, 어떤 작업을 했는지가 궁금한데요!
한번 열어보았습니다.

완전히 모태 문과인 저로서는 무슨 말인지 알 수 없는 파이썬 코드가 적혀있군요.
아무튼 무언가 엑셀 파일을 제대로 읽었다는 점은 확인 할 수 있었습니다.

해당 작업에 바로 이어서 아래와 같은 멘트를 ChatGPT가 날려주는데요-

데이터가 어떤 건지 자신이 파악은 했는데, 네가 나에게 요구하는 작업이 무엇인지, 어떻게 작업을 수행하면 될 지 정확하게 예시를 제공해 달라고 저에게 요청을 하네요!

아까 첫번째 프롬프트를 통해서 요구사항을 전달을 했다고 생각했지만, 다시 한번 프롬프트를 입력합니다.

B열의 데이터를 새롭게 카테고라이징을 해달라고 요청하니, 이 작업을 위해서 선행되어야하는 것이 무엇인지 파악을 한 점이 신기했습니다. 유니크한 값을 확인해달라고 요청하지는 않았는데, 유니크한 값을 확인하는 작업을 먼저 수행하였어요.


그런 다음, 저렇게 다섯 항목으로 분류를 하겠다고 합니다.

그런데 저희가 설정했던 항목 중 전문직 등이 누락이 되었어요.

기타 항목 중 다수로 응답이 나온 IT는 잘 반영을 하였어요.


그래서, 일단 “변호사 의사 회계사 같은 전문직 항목을 추가해줘.” 라고 다시 한번 요청하였습니다.




전문직 항목이 다시 생겼고, 기존에 없던 항목인 예술, IT, 금융 항목이 생겼습니다.

raw data를 대충 훑어봤을 때, 기타에 있던 내용들을 지피티가 추출했음을 알 수 있었습니다.

하지만 IT, 금융, 예술에 해당하는 응답의 수가 유의미한 수로 나타나지는 않아서,

금융과 예술은 기타로 다시 뺐습니다..ㅎㅎ

처음에 저희가 설정했던 항목인 ‘생산/기술/제조’도 실제 응답자 수가 유의미하게 크지는 않아서, IT 및 기술이나 기타로 재분류 했어요.


3. RESULT : 결과 파일을 저장해줘!

여튼.. 이렇게 실습해보며 가장 좋았던 점은 바로 이 부분인데요!

항목을 재분류해서 C열에 기재해준 점이 너무나도 감격스러웠습니다.

처리_결과.xlsx 파일을 열어보니,

입력값이 대부분 정확한 편이더라구요.

키워드의 배리에이션이 그다지 크지가 않아서 가능했던.. 자동 분류 작업이었던 것 같습니다.


ChatGPT가 분류해준

  1. 경영 및 사무 관련 직무

  2. IT 및 기술 관련 직무

  3. 마케팅 및 영업 관련 직무

  4. 연구 및 개발 관련 직무

  5. 전문직 (변호사, 의사, 회계사 등)

  6. 예술, 디자인 관련 직무

  7. 금융 관련 직무

  8. 기타


이 항목들을 다시 저희가 설정했던 항목과 같은 표기로 변경하는 작업만 엑셀로 다시 해서,분류를 마쳤습니다.


그래서 최종 분류는

이렇게 작업이 되었는데, 여기서 팀 논의를 통해 금융을 기타로 빼는 등의 작업을 하였습니다! 금융에 해당할만한 답변이 7개 밖에 없더라구욥…ㅎㅎ


음..! 저의 첫 시도는 우선 여기까지 입니다.

ChatGPT로 카피라이팅을 해보거나 기획안 초안을 작성하는 등의 글쓰기 작업들을 해보기는 했어도, 이렇게 파이썬 코드가 활용된 엑셀 작업은 처음이었는데요~! 흥미로운 경험이었습니다. 이 작업 이후에는 성별에 다른 근무기간 합계, 성별에 따른 직무 합계, 근무기간 별 연령대 및 직무 데이터를 수치화하는 작업을 해보았는데.. 이 사례는 다음 시간에 발표할까 합니다.


그럼, 끝까지 봐주셔서 감사합니다!!


자세히 보기👉 https://chat.openai.com/share/54b138bf-a61b-48b9-b6ac-eabdfb64a1e7

2
4개의 답글

👉 이 게시글도 읽어보세요

모집 중인 AI 스터디