김욱영
김욱영
Moderator
🌿 뉴비 파트너

[ 코인프 스터디 | 개인 ] Kaggle 무작정 따라하기


데이터 분석을 쉽게 해볼 수 있는 Kaggle에서는, 타인에 데이터 분석 사례와 csv 파일을 볼 수 있습니다. 보통 업보트 수가 높고, 옆에 메달 색이 좋을 수록 좋더군요.

Students Adaptability Accuracy =91.4%

ChatGPT와 함께라면 이를 굉장히 잘 할 수 있습니다.

위에 있는 캐글의 Input 섹션에서 csv 파일을 다운로드 받았습니다.

이후, 코드 인터프리트를 이용하여 csv 파일을 넣고, Kaggle 결과값으로 나온 것 중 효과가 가장 좋은 것을 제시하였습니다. (csv 파일을 업로드 할 수 없을 경우, csv 파일의 일부분을 복사하여 GPT에게 복사하는 방법이 있을 듯 합니다.)

(1) csv 파일을 살펴보고, (2) 성능이 가장 좋은 모델의 3가지 공통점을 제시해달라고 부탁했습니다.

공통점에 대해서 질문을 했지만, 사실 (1), (2)에 대해서는 아는바가 없습니다…

이제 이를 기반으로 해서 더 좋은 정확도가 나오는 데이터 분석을 진행하고자 합니다.

제시한 csv 파일을 이용하여 데이터 분석을 진행할 예정입니다.
확률이 높았던, 3가지 방식의 공통점을 통해서, 더 좋은 정확도가 나오는 데이터 분석을 진행하고자 합니다.
(1) csv 파일을 우선 살펴보세요.
(2) 3가지 방식의 공통점을 토대로, 어떻게 데이터 분석을 할지에 대한 계획을 상세히 세우세요.
(3) colab에서 csv를 업로드 할 수 있게 구조를 짜주세요.
(4) 이후 계획을 토대로, 데이터 분석을 colab에서 진행할 수 있도록, 코드를 알려주세요

용량이 큰, 데이터 분석에 경우는 코드 인터프리터로 진행을 할 수 가 없습니다.

따라서 구글 코랩에서 제시할 수 있게 파이썬 코드를 제시하도록 했어요. 코드를 붙여 넣어서 진행하면 용량이 커도 괜찮으니까요.

https://chat.openai.com/share/49cf6762-1196-4c6e-b201-332bbcf4284a (참고하세요)

진행 과정 중에서 오류가 발생하면, GPT에게 질문하면서 진행하면 됩니다.

그런데 방법이 달라서 그런가 위에 kaggle에서 진행하신 분이 했던 것 보다 낮게 나오더라고요 ㅠㅠ 진행하는 방법이 달라서 그런 것 같습니다.

계속해서 다른 방법을 진행하고 → ChatGPT에게 물어보면서 효율을 높여보는 것도 재미있을 것 같아요.

진행했던 저의 코랩도 참고로 전달드립니다.

Google Colaboratory


5
3개의 답글

👉 이 게시글도 읽어보세요