박정기
박정기
🗡️ AI 레전드
🎖️ 마스터 파트너
🚀 SNS 챌린지 달성자

엥? AI에게 명령을 내리면, AI가 직접 웹사이트에 열어서 원하는 목표를 달성한다고?

Skyvern Experiment: Automating Browser Tasks with AI

제목에 이끌린 당신! 🤟 이제 진짜 단순 사무직은 없어질 가능성이 매우 높아지고 있습니다..!

아이언맨 코리아

소개

최근 Hacker News에서 Skyvern이라는 흥미로운 오픈소스 프로젝트에 대해 알게 되었습니다. GitHub 링크를 통해 이 프로젝트를 확인할 수 있습니다. Skyvern은 브라우저 자동화를 위해 AI 에이전트를 사용하는 도구로, 다양한 웹사이트에서 작업을 자동화하는 것을 목표로 하고 있습니다.

AI를 사용한 자동 브라우저 기반 워크플로우

일단 영상을 보시죠 🔽

저는 이 도구를 직접 활용해 보고, 어떤 가능성을 제공하는지 확인하고자 했습니다. 특히 Skyvern이 제공하는 워크플로우 기능과 웹사이트 상호작용을 통해 여러 웹사이트에서 동일한 작업을 자동으로 수행하는 점에 큰 흥미를 느꼈습니다.

이 도구를 보면서 느낀건, 곧 있으면 키오스크 말로 입력 받아서 알아서 터치해주는 서비스가 금방 나오지 않을까 싶습니다..

실험 진행 방법

Skyvern 사이트에 접속하여 직접 여러 작업을 실험해 보았습니다. 아래는 각 실험의 내용과 결과입니다:

- 실험 1: 쿠팡에서 M4 맥 미니 가격 알아보기 → 실패

Access Denied가 떴습니다..! -> 역시 쿠팡의 보안

버튼이 있는 웹페이지의 스크린샷

- 실험 2: EPL 공식 사이트에서 EPL 순위 알아보기 → 성공

토트넘이 10등이라니.. 힘내라...!

플레이어 목록을 보여주는 웹페이지의 스크린샷
한국 축구선수가 손으로 사인을 하고 있다
[
  {
    "position": 1,
    "team": "Liverpool",
    "points": 28
  },
  {
    "position": 2,
    "team": "Man City",
    "points": 23
  },
  {
    "position": 3,
    "team": "Chelsea",
    "points": 19
  },
  {
    "position": 4,
    "team": "Arsenal",
    "points": 19
  },
  {
    "position": 5,
    "team": "Nott'm Forest",
    "points": 19
  },
  {
    "position": 6,
    "team": "Brighton",
    "points": 19
  },
  {
    "position": 7,
    "team": "Fulham",
    "points": 18
  },
  {
    "position": 8,
    "team": "Newcastle",
    "points": 18
  },
  {
    "position": 9,
    "team": "Aston Villa",
    "points": 18
  },
  {
    "position": 10,
    "team": "Spurs",
    "points": 16
  },

- 실험 3: Hacker News에서 AI 에이전트 관련 뉴스만 가져오기 → 실패

검색도 못하고, 데이터도 추출 못함.. 왜일까? 아직 바보같아요..

문서 목록을 보여주는 웹페이지 스크린샷

- 실험 4: EPL 공식 사이트에서 득점왕과 도움왕 알아보기 → 부분 성공

득점왕은 못가져오고, 도움왕은 제대로 잘 가져왔습니다..!

축구선수가 골을 넣은 후 축하하고 있다
축구 리그 웹사이트의 스크린샷

결과와 배운 점

Skyvern을 통해 반복적인 웹 작업을 자동화할 수 있는 가능성을 확인할 수 있었습니다. 특히 다양한 웹사이트에서 동일한 작업을 수행할 때, 매번 코드를 수정할 필요 없이 자연어로 작업을 정의하고 실행할 수 있는 점이 매우 인상적이었습니다. HTML 분석 기능을 통해 자동으로 드롭다운이나 동적 양식을 처리할 수 있었는데, 이는 기존의 Selenium이나 UIPath와 비교했을 때 큰 이점으로 느껴졌습니다.

Workflow 기능도 있는데 한 번 살펴보면 좋을 것 같습니다. (N8N과 살짝 비슷..?)

어두운 배경의 웹페이지 스크린샷

그러나 몇 가지 한계도 발견했습니다. 예를 들어, 웹사이트 구조가 예상치 못하게 변경되거나 CAPTCHA와 같은 방어 메커니즘이 있을 경우 자동화가 실패하는 경우가 많았습니다. 이 부분은 앞으로 보완이 필요해 보입니다.

앞으로는 더 복잡한 브라우저 상호작용, 예를 들어 온라인 구매 프로세스 자동화나 정부 포털 사이트에서의 서류 제출 자동화를 시도해 볼 계획입니다.

도움 받은 글

Hacker News의 Skyvern 관련 토론을 참고했습니다. 특히 브라우저 자동화의 한계와 가능성에 대한 커뮤니티의 의견이 큰 도움이 되었습니다. [링크](https://news.ycombinator.com/item?id=41936745)

7
4개의 답글

👉 이 게시글도 읽어보세요