ChatGPT에 외부 라이브러리 설치해서 데이터 분석하기

ChatGPT의 Advanced Data Analysis에 내장되지 않은 외부 Python 라이브러리를 설치해서 데이터를 분석해봤습니다.


TL;DR


ChatGPT의 Advanced Data Analysis는 300개가 넘는 Python 라이브러리를 기본 지원합니다.
[참고] ChatGPT 내부 라이브러리 목록: https://code-interpreter-search.netlify.app

그리고 외부 라이브러리를 사용하려면 Wheel file을 설치하면 됩니다.
[참고] GPTers 연구방 구요한님 글: https://www.gpters.org/c/research/code-interpreter-python-library

그래서 ChatGPT에 Wheel file로 외부 라이브러리를 설치해서 데이터를 분석하는 과정을 간단히 실습해봤습니다.


라이브러리 설치

  • https://pypi.org 에서 설치하고 싶은 외부 라이브러리를 검색하고
    Download files 메뉴 >> Built Distribution 에서 .whl 파일을 다운로드 합니다.

  • 저는 매개조절 분석용 통계 라이브러리 PyProcessMacro의 .whl 파일을 다운로드 받았습니다.
    [참고] PyProcessMacro 라이브러리 Wheel file 다운로드: https://pypi.org/project/PyProcessMacro/#files

  • ChatGPT의 Advanced Data Analysis 모드에서 .whl 파일을 업로드하고 설치해서 불러옵니다.

처음에는 아래와 같은 프롬프트를 사용했으나, 그냥 ‘설치’ 라고 명령했을때 의존성 문제가 덜 생겼습니다…
» Import pandas and see where the actual file is.
» Extract this wheel file to a temporary location first, and then move the files to /home/sandbox/.local/lib/python3.8/site-packages/pyprocessmacro/
» Please adding the temporary directory to sys.path, allowing Python to identify and pull modules from the unpacked pyprocessmacro package within that location.


데이터 분석

  • 분석할 데이터를 업로드합니다. (실습용 데이터로 유명한 보스톤 집값 데이터 사용)

  • 변수명 간소화, 통계적 가정 확인, 분석 변수들을 추천받습니다.

  • ChatGPT가 외부 라이브러리 사용법은 잘 알지 못할 가능성이 높으므로,
    라이브러리 문서 내용을 채팅창에 입력해주면 분석에 도움이 됩니다.

  • 뭔가 문제가 생기면 아까 제공한 라이브러리 문서를 참고해서 해결할 수 있다고 격려(?)해주면 몇번 우왕좌왕 하다가도 결국 문제를 해결해줍니다.

  • 분석 결과 해석, 결론 및 시사점, 인사이트 제안에서도 그럴듯하게 도움을 줍니다.



인사이트

  • .whl 파일을 업로드하고 간단한 한글 프롬프트로 외부 라이브러리 설치 가능

  • 가끔 설치나 불러오기 과정에서 문제가 생기면 대화 세션을 다시 시작
    (그래서 분석 중간에 라이브러리를 설치하지 말고, 맨 처음에 설치하고 불러와서 분석 시작하기)

  • 라이브러리 문서 내용을 채팅창에 입력해서 추가정보를 제공하면 분석 과정에서 생기는 문제들을 ChatGPT 스스로 해결할 수 있음

  • 결론: ChatGPT에서 다양한 라이브러리를 활용하여 전문적 데이터 분석을 손쉽게 수행하고 풍부한 인사이트를 얻을 수 있습니다.


글쓴이: 송은정
동국대학교 AI융합교육전공 교수, 《예고된 변화 챗GPT 학교》, https://songej.com

10
4개의 답글

👉 이 게시글도 읽어보세요!

📚 AI 활용 사례 더 보기