강의 사이트 셀레니움 활용한 크롤링

강연 일정에서 일부 data를 추출하는 목적

한 페이지에 6개 강연이 있고

다음 페이지로 계속 타고 들어가서 크롤링 하는 어려움



처음엔 data를 전혀 가져오지 못 했다.

코드 수정을 거치니 unknown 으로 입력되었다,

그 이유는

text 가 아닌 이미지이기도 하고

한 페이지에 6개 강연을 각각 클릭해서 들어가야 한다.

이렇게 각각의 공연을 클릭해서 해당 공연 상세 설명 페이지로 옮겨야

구체적인 data를 수집할 수 있다.

6개 강연의 data를 다 수집한 후엔

다음 페이지로 옮겨가야 한다.

이렇게 페이지를 옮겨 가며 각각 6개의 강연 data를 수집.

7월달 강연 data를 수집해서 엑셀파일로 배포하는 것이 목적이다.

처음 60줄에서 수정을 거듭하니
150줄까지 늘어났다.

현재 최종 엑셀 파일은


아직 완성본은 아니다.

조회수 가 0으로 배포되는 것과

페이지를 넘어가지 못 한다.
(아니면, 2-3페이지를 무한반복한다 ㅜㅜ)

일단, 현재 까지 상황을 업로드 하고
내일까지 계속해서 완성하리라

드뎌 완성..
조회수는 안 되서 현시점에선 포기
(나중에 시간될떄, 해보려구요)

페이지를 넘기는 오류를 봤더니,
다음 버튼을 찾아 클릭한다 하기에

그러지 말고
1페이지에 6개 강연이 있으니
6개 작업 후
다음 번호 페이지로 넘어가라.
그리고,
강연이 6개 미만이면 멈춰라

아이디어 주니
바로 수정해서 완성 됬어요.



#gpters11문과생도ai #문과생도AI 과제 제출 #문과생도AI 과제 제출 #문과생ai

2

👉 이 게시글도 읽어보세요