1주차 과제를 따라해 본 후 , 한국경제 사이트 경제섹션 크롤링을 호기롭게 시작해봅니다.
1. URL 링크만 주고 크롤링 코드를 작성해달라고 했더니 결과가 나오지 않음.
2.과제에서 디버깅한 것처럼 href를 알려주고 작성해달라고 했더니, 결과는 나오는데 앞 URL 크롤링이 안됨 (26번 URL부터 텍스트 크롤링됨)
3. 수정해줘 시전
4.수정해줬지만 23번 url부터 크롤링됨.
또 수정해달라고 했더니, 이번엔 디버깅할수 있도록 URL수집은 제대로 되었는지 URL 리스트를 중간에 확인하고, 크롤링 실패한 뉴스 URL은 다시 크롤링 할 수 있도록 수정해줌.
URL은 잘 가져오는데…
왜 텍스트 수집은 23번부터 하니 ㅠㅠ
혹시나 해서 결과를 CSV로 저장해달라고 해서 확인해보니 URL 1번부터 잘 저장되네요?
VSC 내 결과 출력 한계일까요?
아무튼 코드 완성!
크롤링 뉴스 갯수를 100번까지 늘려 CSV로 저장하는 코드까지 완성했습니다!
CSV 저장 결과물 입니다.
정기님의 꼼꼼한 강의 덕에 새로운 시도를 해보았습니다.
감사합니다 😃
#문과생도 AI 1주차 인증 #문과생도AI