[문과생도 AI] 한국경제 사이트 경제섹션 크롤링해보기

1주차 과제를 따라해 본 후 , 한국경제 사이트 경제섹션 크롤링을 호기롭게 시작해봅니다.


1. URL 링크만 주고 크롤링 코드를 작성해달라고 했더니 결과가 나오지 않음.

2.과제에서 디버깅한 것처럼 href를 알려주고 작성해달라고 했더니, 결과는 나오는데 앞 URL 크롤링이 안됨 (26번 URL부터 텍스트 크롤링됨)

3. 수정해줘 시전

4.수정해줬지만 23번 url부터 크롤링됨.
또 수정해달라고 했더니, 이번엔 디버깅할수 있도록 URL수집은 제대로 되었는지 URL 리스트를 중간에 확인하고, 크롤링 실패한 뉴스 URL은 다시 크롤링 할 수 있도록 수정해줌.

URL은 잘 가져오는데…

왜 텍스트 수집은 23번부터 하니 ㅠㅠ


혹시나 해서 결과를 CSV로 저장해달라고 해서 확인해보니 URL 1번부터 잘 저장되네요?

VSC 내 결과 출력 한계일까요?


아무튼 코드 완성!

크롤링 뉴스 갯수를 100번까지 늘려 CSV로 저장하는 코드까지 완성했습니다!

CSV 저장 결과물 입니다.

정기님의 꼼꼼한 강의 덕에 새로운 시도를 해보았습니다.

감사합니다 😃


#문과생도 AI 1주차 인증 #문과생도AI

2
1개의 답글

👉 이 게시글도 읽어보세요