안녕하세요. 5기 스터디에 참여하고 있는 소셜앤비즈 윤성임입니다.
챗GPT-4의 code interpreter가 아주 다양한 기능이 있고, 그중 일반적으로 데이터 분석에 아주 유용하게 활용할 수 있어 인기가 대단하지요..😄😊
제가 소상공인, 농업인, 일반인 등 각자의 분석 데이터가 없는 분들에게 강의를 할때 사용하는 방법인데요..
국가에서 보유하고 있는 다양한 데이터를 국민 누구나 이용할 수 있도록 개방하고 있는
공공데이터 포탈에서 관심있는 데이터를 다운받아 code interpreter에서 분석해보는 방법입니다.
먼저 공공데이터 포탈 에 가서 관심있는 데이터를 검색 한 후 다운로드 합니다. 가장 인기있는 데이터가 소상공인시장진흥공단 상권정보네요~~
소상공인시장진흥공단 상권정보를 다운로드 한 후 압축을 풀면 아래와 같은 지역별 csv 엑셀화일이 나오고ㅡ 파일열람방법 txt화일에서 설명한대로 엑셀화일에서 열어볼 수도 있습니다.
챗GPT4의 코드인터프리터에서 다운 받은 화일 하나를 업로드 합니다.
이제부터는 일반적으로 코드인터프리터를 활용하여 데이터 분석 하는 방법으로 하면 됩니다.
간단하게 해보았던 예시 화일을 확인해보시면 됩니다.
https://chat.openai.com/share/c6e85189-38ac-4842-a36d-be0a6c9adf3a
먼저 ‘위 화일의 10행을 보여줘’ 하면 칼럼정보와 데이터 일부를 확인 할 수 있습니다.
다음은 상권업종대분류명, 상권업종중분류명,상권업종소분류명 별 업소수를 작성하게 한 후
상권업종대분류명별 업소수에 대해 엑셀화일과 막대 그래프로 그려달라고 했더니 아래와 같이 결과를 알려주어 노트북에 엑셀과 이미지 화일로 다운로드 할 수 있었습니다.
여기에서 엑셀 파일을 다운로드하실 수 있습니다.
여기에서 막대 그래프 이미지를 다운로드하실 수 있습니다.
위의 막대그래프의 X축, Y축, 데이터 등 레이블 값이 한글일 경우 깨짐현상이 있어 영어로 번역하여 다시 그래프를 그려달라고 했더니.
데이터 한글값을 영어 번역 예시를 보여주며 깨지지 않은 영어로 막대그래프를 다시 그려주었습습니다.
참고로…코드 인터프리터에서 업로드 한 화일은 3시간여 지나면 아래와 같은 메시지가 발생하여