[7기 데이터 분석하기] 2013년 출산, 2023년 출산의 의미


안녕하세요! 송은정 교수님의 수업을 듣고 있는 강주연이라고 합니다.

이번 수업에서는 어떠한 분석을 해보면 좋을까 싶어서 고민해보다가

지금 제 신상과 관련이 있는 주제로 한번 해볼까 싶어 ‘출산’이라는 단어를 GPT ADA와 함께 분석해보려고 해요.

데이터는 10년 전 2013년 1~9월 ‘출산’이 언급된 보도자료와, 2023년 1~9월 ‘출산’이 언급된 보도자료를 기반으로 하려고 합니다!

이번 분석에서 제가 GPT와 함께 풀어 나가고 싶은 숙제들은 다음과 같습니다.

  1. 2013년, 2023년 ‘출산’이 언급된 보도자료가 공통점과 차이점이 있는지?

  2. 2013년, 2023년에 ‘출산’에 관련된 잠재된 주제들이 어떻게 분포하는지 고차원적으로 시각화한다면 어떤 모습인지?


GPT야 잘 부탁해!


분석을 위해 빅카인즈 데이터를 내려 받았습니다. 편의를 위해 보수신문은 중앙일보만, 진보신문은 한겨레의 데이터만 받도록 했습니다!


2013년, 2023년 각각 다운로드 받았기 때문에 GPT에게 머징을 부탁했고 저는 GPT의 말을 잘 듣는 사람이기 때문에 추천 방식대로 머징을 했습니다.


이후 year, 언론사, 제목, 본문이 저에게 중요한 컬럼임을 GPT에게 알려주고, 함께 분석을 수행하게 됩니다.


  1. 2013년, 2023년 ‘출산’이 언급된 보도자료가 공통점과 차이점이 있는지?

먼저 2013년, 2023년 ‘출산’이 언급된 보도자료의 주제가 어떻게 구성되어 있는지 알려달라고 했습니다.

크게 다섯가지를 제안하는 GPT씨



오늘도 시각화를 위해 코랩을 켰습니다. 제시해준 코드로 해보니 글쎄 이 녀석 꾀나 잘 설명해주는 것 같습니다.

보니 2013년에는

# Topic #3: 'Family, Marriage, and Parenthood'

# 아이를 둔 부모나 부부, 특히 엄마의 관점에서의 출산과 육아에 대한 내용.

가 가장 화두인 주제이고,


2023년에는

# Topic #2: 'Social Policies and Demographics'

# 저출산 문제와 그에 따른 사회적, 정치적 영향.

가 가장 화두인 주제로 보여지는 군요..


공통점과 차이점을 뽑아보라고 이야기해보았더니,

합리적인 대답을 뱉어냅니다. 물론 공통점은 상투적이긴 하나,

정책과 지원, 범죄와 사회문제, 특정 인물과 기관과 같은 차이점은 2023년에 두드러지는 이슈들이 참 많았습니다. 2013년 지역과 국가를 이야기하는 것도 재미있었는데, 이때 당시에 원정출산과 같은 이슈들도 확실히 있어서, GPT가 놓치지 않고 차이점으로 뱉어내는게 흥미로웠습니다.


  1. 2013년, 2023년에 ‘출산’에 관련된 잠재된 주제들이 어떻게 분포하는지 고차원적으로 시각화한다면 어떤 모습인지?

자자, 거의 다 와 갑니다 !!

GPT와 함께라면 새로운 시각화도 가능할 것이라는 생각을 해보았습니다.

논문에서만 봤던 시각화 방법인데!!!! GPT씨를 믿고 한번 시도를 해보았습니다.

거침없이 코드를 뱉어주는 GPT..

그리고.. 시각화 결과…!

이렇게 2차원으로 그림화 해놓고 보니…

2013년 대비 2023년 주제 퍼져있는 클라스가 다릅니다요..

이제 끝 !!!


BONUS…..

이러한 결과들을.. 이론과 연결한다면 어떠한 모습일까?

상투적이긴 해도.. 그래도 시간이 지남에 따라 ‘출산’과 관련된 이슈들이 고차원, 다차원적인 논의가 이루어지고 있음을 알 수 있었습니다.


다 하고 보니 아쉬운 점도 있습니다.

언론사별로 주제가 차이가 있는지 분석을 안해서.. 다음에 기회되면 우리 GPT와 함께해보아야겠어요.

오늘도 GPT 덕분에 많은 용기를 얻어갑니다! 다음엔 무엇을 해야할지 고민을 해보아야겠어요.

늘 지피터스 스터디 덕에 많이 배워갑니다!

7기 데이터반 화이팅 !!!

7
11개의 답글

👉 이 게시글도 읽어보세요