ChatGPT를 통해 데이터 분석 작업을 진행하면 파이썬을 하나도 몰라도 데이터 분석을 진행할 수 있다.
Code Interpreter를 사용하는 경우
Colab에서 진행하는 경우
위의 두 가지 경우로 나누어 볼 수 있는데 1은 조금 더 편리하고 분석 결과에 대한 논의가 GPT 내에서 바로 가능한 대신 엄밀한 분석이나 복잡한 경우에는 부족함이 있고, 2로 진행하는 경우 대부분의 가능성을 모두 가능하게 해주는 반면 결과에 대한 해석 등 추가적인 논의는 GPT와 이어져있지 않아서 복사해서 가져와야 한다.
참고 Prompt: https://chat.openai.com/share/6443141e-4a91-4aed-97d9-f3e38becb4c6
오늘 진행할 것은 2번이다. 내가 가지고 있는 데이터의 특징을 알려준다.
이미 알고있는 변수 리스트를 통해 새로운 변수를 생성한다.
Python에서 바로 실행할 수 있는 코드 형태로 주게 된다.
# "교육훈련" 변수에 대한 평균 계산
data['교육훈련'] = data[['WC1Q14_01', 'WC1Q14_02', 'WC1Q14_03', 'WC1Q14_04', 'WC1Q14_05', 'WC1Q14_06']].mean(axis=1)
# "경영진" 변수에 대한 평균 계산
data['경영진'] = data[['WC1Q23_02', 'WC1Q23_03', 'WC1Q23_04']].mean(axis=1)
기본적인 기술통계도 가능하고,
모르는 경우 조금 더 자세한 설명도 가능하다.
내가 원하는 작업을 자연어로 물어볼 수 있다는 것이 장점.
한글 깨짐 등 문제가 생겼을 때 에도 문제를 그대로 물어보면 해결 방안을 제시해준다.
코랩에서 나온 결과를 그대로 붙여넣고 물어봐도 좋다.
내가 원하는 질문과 결과물도 요청할 수 있다.
그려준 그래프를 수정하는 것 또한 가능.
분석 과정은 모두 Colab으로 진행하였다.
다음 시간에는 두 개의 결과를 함께 보도록 하자.