AI 기반 모의 면접 시스템 만들기: Puppeteer+Brave/Naver 검색, Sequential Thinking & ElevenLabs MCP 활용기
소개
"취업 준비생이 혼자 면접 연습할 때도 실제처럼 생생하게 할 수 없을까?" 하는 고민에서 시 작했습니다. AI 기술을 활용해서, 웹에서 실제 면접 질문을 수집하고, 이를 체계적으로 정리한 다음, 사람 목소리로 자연스럽게 들려주는 AI 기반 모의 면접 시스템을 만들기로 결심했어요.
특히, 면접 질문을 단순히 나열하는 것이 아니라, 카테고리별(예: 인성, 직무 전문성)로 나누고, 난이도별로 분류해 점진적으로 연습할 수 있도록 하는 것에 중점을 두었습니다. 🎯
Brave Search에서는 글로벌한 트렌드 중심 질문을 깔끔하게 수집할 수 있었어요. 광고나 잡음이 적어 크롤링이 비교적 쉽답니다.
한국어는 화면에 표시됩니다
LinkKorer
Naver Search에서는 한국 기업 맞춤형 질문(예: 대기업, IT기업 실무 질문 등)이 많아 직무 특화 연습에 아주 효과적이었어요. 하지만 광고나 뉴스 섹션이 많아 원하는 데이터만 걸러내기 위해 필터링 로직을 추가해야 한다는군요.
그것에 한국어 단어 목록이있는 검은 색 스크린
한국 노래와 함께 한국 웹 사이트의 스크린 샷
🔹 검색 엔진 특성과 크롤링 방식 차이 체감: Brave는 HTML 구조가 단순해 스크랩이 편했지만, Naver는 광고/뉴스 섹션 분리 작업이 추가로 필요합니다. 결국, 검색엔진별로 크롤링 전략을 다르게 짜야 한다는 점을 크게 배웠어요!"
그리고 또 한가지 Brave Search, Naver Search는 "검색 엔진"이고, 검색하는 작업(= 브라우저 열고, 키워드 치고, 결과 긁어오는 일)은 Puppeteer라는 자동화 도구를 이용해서 사람이 아니라 "코드"로 시킨거라는 사실을 알게 되었습니다.
Sequential Thinking 적용
수집한 질문을 그냥 나열하는 게 아니라, "기본 인성 질문 → 직무 전문성 질문" 이런 식으로 논리적 흐름에 따라 정리했어요.
난이도도 쉬움-보통-어려움으로 구분해서, 실제 면접처럼 점진적으로 난이도가 올라가도록 구성했습니다.
한국어 화면의 스크린 샷
한국어 앱의 스크린 샷
음성 변환 & 모의 면접 제작
정리된 질문을 ElevenLabs MCP를 통해 실제 사람처럼 들리는 한국어 음성으로 변환했습니다.
변환된 질문 음성을 일정 시간 간격으로 자동 재생하는 스크립트를 만들어, 진짜 면접관이 질문하는 듯한 몰입감을 줬어요.
한국어 페이지의 스크린 샷
답변을 녹음하면 자기 피드백도 가능한 구조로 만들었습니다. 🎙️
면접 준비 가이드라인을 보며 혼자서 면접 준비를 하면서 답변을 녹음하여 개선점을 찾고 다시 연습하는 과정을 거치도록 유도했습니다.
클로드의 프로젝트와 아티팩트 기능을 이용해 가이드 문서를 html로 작성해서 제공하기로 했습니다.
한국 웹 사이트의 스크린 샷
추가로 각 질문세트에 7개의 mp3 파일이 만들어지는데 이것을 클릭하면서 연습하는 것보다는 하나의 파일로 합쳐서 주는 것이 좋을거 같아서 GPT에게 파이썬을 이용하여 답할 시간을 2분30초 정도의 시간간격을 주고 합해달라고 요청해서 하나의 파일로 만들었습니다. 사용자는 이 파일을 열어 질문에 시간내에 답하는 상황을 녹음해보는 과정을 거치면 좋을거 같습니다.
앞으로의 과제는 이 피드백을 좀더 타인이 해줄 수 있는 자동화 방안을 모색 해보는 것입니다.
결과와 배운 점
검색엔진별 크롤링 전략의 차이를 몸소 체감했습니다.
Sequential Thinking을 적용하니 정보가 훨씬 체계적이고 활용하기 쉬워졌습니다.