#9기AIatoz #9기AIATOZ
브런치 글에서 정보를 추출하는 것을 3가지 방법으로 비교 테스트 해 보았습니다. 사용된 tool은 Web Pilot 플러그인, Site Harvester GPTs, Web Pilot GPTs입니다. 테스트에 사용된 사이트는 제 글이 46편 실려 있는 https://brunch.co.kr/@joonyoungpaafok 입니다. 각각의 tool에 대해 아래의 항목 4가지를 동일하게 질문하였습니다.
46개의 글의 제목을 모두 알려줘
46개 글들을 하나의 pdf로 만들어 줘
46개의 글을 바탕으로 내가 어떤 사람(직업, 취미 등)인지를 알려줘
"철들지 않는 공대교수의 브런치스토리" 페이지에 있는 글들을 요약해 줘
1. Web pilot Plug-in
2. Site Harvester GPTs
3. Web pilot GPTs
위의 결과들을 copy하여 하나의 pdf파일로 만들어서 표로 비교해 달라고 했습니다.
요약
3가지 tool을 이용하여 브런치 site에 있는 제가 쓴 글의 정보를 추출하는 테스트를 해 보았으며 Web Pilot GPTs, Site Harvester GPTs, Web Pilot Plug-in 순으로 우수성을 보였음
특정 주제를 주고 글을 작성해 달라고 했을 때 3가지 tool이 비슷한 결과를 보여줌
Site의 종류에(글, e-커머스 등)따라 성능의 차이가 있을 것으로 예상됨
현재 python code를 통한 web crawling을 시도해 보고 있음
* 추가 검증 :
- 1000편 이상의 컬럼을 포함하는 사이트를 입력하고 테스트 해 보기로 함
- 조선일보 오피니언란에 실린 김윤덕 기자의 url을 입력 (1497편의 컬럼, https://www.chosun.com/people/kim-younduck/)
- ‘미술관’이란 단어를 포함하고 있는 제목의 글을 찾아 달라고 함
- Web Pilot GPTs 만 글을 찾아 주었음