소개
지난 17기, 18기에는 Zapier와 n8n 등을 활용해서 제 관심사인 노동법에 대한 뉴스를 요약해서 받아볼 수 있는 워크플로우를 만들어 보았었는데요. 이번에는 Cursor를 사용해서 네이버 뉴스를 크롤링하는 방법을 배우게 되어 아래와 같이 진행해보았습니다. 사실 지난 오프라인 교육에 참석을 못했고 경황이 없어 이제서야 첫 사례글을 씁니다만, 스터디장님께서 잘 구성해놓으신 자료를 보면서 더듬더듬 따라갈 수 있었습니다.
진행 방법
2주차 수업 자료를 참고하여, URL / 기사 한 개의 정보 (Element) / 셀렉터 / 지침의 순서대로 프롬프트를 작성했고, 기사의 제목, 내용, 링크가 엑셀에 저장될 수 있도록 입력했습니다.
첫 예시가 "SK하이닉스"를 네이버 뉴스에 검색한 결과여서 그대로 실습을 먼저 해보았고, 그 후에 Agent를 통해 주제를 "노동법"으로 바꿔달라고 요청하니, python 파일의 제목까지 바뀌지는 않았지만 코드는 모두 잘 바뀌는 것을 확인할 수 있었습니다.
엑셀 파일을 확인해 보니 지시한 순서대로 저장이 잘 되어 있었고, GUI와 exe 파일로 크롤러를 구현해내는 것 또한 간단히 프롬프트를 쓰는 것만으로 완료할 수 있었습니다.
결과와 배운 점
이전 클래스에서 접했던 n8n, Google Apps Script 등의 툴보다 더욱 코딩에 가까워보이는 듯한 인터페이스를 가지고 있는 Cursor라서 처음에는 두려움이 있었지만, 실습을 진행해보니 그런 마음이 조금은 걷히는 느낌이었습니다. 다음에는 네이버 이외의 다른 사이트도 크롤링을 해보려고 하고, 지난 n8n 클래스 때 일부 구현했었던 주제별 뉴스 분류나 관련성에 따른 뉴스 선정도 Cursor를 통해서 가능한지 시도해볼 생각입니다.
사실 이전 클래스에서부터 구현하고자 하는 내용 (노동법 관련 최신 뉴스 크롤링/요약) 은 크게 달라지지 않았지만, 다양한 접근법을 사용해보면서 각각의 차이를 알아나가는 것은 큰 의미가 있다고 느낍니다. 이번 클래스 남은 기간 동안 더 시도해보면서 Cursor의 장점과 활용 가능성을 알아가보겠습니다.