[9기 알바생] Kaggle 데이터 분석 도전해보기

#9기AI알바생

1. Kaggle에서 데이터 찾기

1) Kaggle에 올라와 있는 Netflix 데이터를 분석하고 싶어졌습니다. 우선 Kaggle에서 데이터를 찾습니다.

https://www.kaggle.com/datasets/ 에서 'netflix'로 검색 → Netflix Movies and TV Show → netflix_titles.csv 다운로드 합니다.

2) GPTs에서 'Data Analytics' 활용하기로 했습니다.

2. GPTs에게 데이터 구조 파악해달라고 하기

1) netflix_titles.csv 를 업로드하고 구조를 파악해달라고 합니다.

3. 탐색적 분석(EDA) 해보기

어느 국가에서 콘텐츠를 많이 생산하고 있는지 궁금해서 ‘지역별 콘텐츠’를 분석해달라고 합니다.

“넌 이제 Netfix의 데이터 분석가야. 탐색적 데이터 분석을 시행하기 위한 파이썬 라이브러리를 생각하고, 데이터 유형을 분석에 맞게 전처리(날짜, 문자열 변환)한 후에, 다음 주제에 대해 탐색적 데이터 분석을시행해줘.

분석 주제: 지역별 콘텐츠 분석”


결과: 넷플릭스에서 제작된 콘텐츠가 가장 많은 상위 10개 국가는 다음과 같습니다:

1. 미국(United States): 3,211개

2. 인도(India): 1,008개

3. 영국(United Kingdom): 628개

4. 캐나다(Canada): 271개

5. 일본(Japan): 259개

6. 프랑스(France): 212개

7. 대한민국(South Korea): 211개

8. 스페인(Spain): 181개

9. 멕시코(Mexico): 134개

- 이 분석을 통해 미국이 넷플릭스 콘텐츠 제작의 중심지임을 알 수 있으며, 인도와 영국 또한 상당한 수의 콘텐츠를 제공하고 있습니다. 이러한 정보는 넷플릭스가 다양한 지역의 문화와 취향을 반영하여 글로벌 시청자를 대상으로 콘텐츠를 제작하고 있음을 시사합니다. 시각화를 통해 각 국가별 콘텐츠 분포를 명확하게 확인할 수 있으며, 넷플릭스의 글로벌 전략과 시장 진입 전략에 대한 인사이트를 제공할 수 있습니다.


이렇게 분석 결과를 보여줍니다. 인도가 이렇게나 많은 콘텐츠를 제작하고 있었다니 놀랍습니다.

#몽주 님이 강의해주신 GPTs에게 한글 폰트 설치시키기는 저는 잘 안됩니다.
할 수 없이 이렇게 분석을 마칩니다.
처음으로 해 본 GPTs를 이용한 데이터 분석이었는데 기대했던 대로 결과가 잘 나와준 것 같습니다.
더 다양한 시도를 해보고 싶어졌습니다.

3
3개의 답글

👉 이 게시글도 읽어보세요