챗GPT 딥 리서치 미니 버전 분석과 추가 개발/딥 리서치 오리지널(?)과 비교

🧠 챗GPT 딥 리서치 미니 버전 분석과 Agent 추가 개발/딥 리서리 오리지널(?)과 비교

“Agent는 전문가만 쓰는 게 아니에요. 저도 했어요. 저 사실 개발자 출신이기는 하지만, 개발 안 하기 시작한 세월이 십 년이 넘었다가 다시 합니다. 여러분도 할 수 있어요!”


✨ OpenAI가 공개한 딥 리서치 미니 버전 소스 코드 분석 및 개선/사용

  • Agents SDK를 활용한 챗GPT 딥 리서치 미니 버전을 분석하고 개선시켰으며, 오리지널 버전(?)과 비교/분석하며 사업 분석에 사용해 보았습니다.

  • OpenAI에서 공개한 소스 코드를 가져와서 한국어 번역과 PDF 파일 생성/웹 UI를 덧붙였습니다.

  • 간단한 프롬프트 설계와 Python 기초로도 Agent를 구현할 수 있음을 체감했습니다.

  • 직접 만든 간단 원서 자동 번역 프로그램을 통해 API 비용, 사업성 등을 검토하고 LangSmith 도입도 고민 중입니다.


1. 계기는 가볍게, 결과는 묵직하게

처음엔 그냥 딥 리서치로 사업 검증을 해보려고도 했고(아직 아이디어도 별로 무르익지 않고 하고 싶은 일만 많지만서도…), 한편으로는 Agents SDK가 나왔다는 소문을 듣고, Agent SDK 구조하고 API 한번 뜯어볼까? 하는 마음이었어요.

근데… 딱 뜯어보자마자 든 생각:

“어라? 이거 엄청 쉽네…?”

Agent 개발이라고 하면 왠지 복잡한 설계도 짜고, 수십 개 프롬프트를 조합해야 할 것 같잖아요.

근데 실상은 이렇습니다:

프롬프트만 잘 쓰면 됨

파이썬 기초 (특히 asyncio, pydantic)만 알아도 OK

생각보다 더 재밌음


2. 오리지널 vs 미니 딥 리서치 비교 🛠️

항목

오리지널 딥 리서치

미니 버전 (Agents SDK 기반)

학습/탐색 방식

한 번의 추가 질문이 있기도 함(나머지는 알 수 없음… 하하)

검색 계획-> 5~20번의 병렬 웹 검색->리포트 쓰기->번역->결과 PDF 생성

사용성(개인적 관점)

더욱 광범위하고 내용이 깊은 리포트(1달에 10번 제한)… 무셔워요…

상대적으로 짧으나(5-10페이지) 사용 제한이 없음(내 API 비용 제외…ㅠ.ㅠ)

📌 요약하자면, 오리지널은 고품질의 리포트 생성, 미니는 가볍고 빠르게 실험 가능한 구조예요.

평소에 궁금했으나 찾아보기 귀찮았던 내용을 마구 마구 찾아볼 때는 미니 버전이 좋았어요! 그래서 “수면제 많이 먹으면 진짜 늙어서 치매 걸린대?” 같은 것까지 마구 마구 질문하고 놀다가 내 API 비용이 삼만원이 깨졌… 아흑…

궁금했던 기술들에 대해서도 마구 물어봤습니다. n8n, 크롬 익스텐션 개발, JTBD 같은 이론들까지… 내용은 읽어본 것도 있고 하도 많이 돌려서 아직도 읽고 있네요. 그 중에 문서 하나 스크린샷 올려요. 7페이지짜리 JTBD에 대한 문서입니다.

한국어 텍스트가있는 페이지

근데 나 사업 검증은 언제 하지?


3. 누구나 할 수 있는 Agent 개발 🧪

Agent 개발이라고 해서 꼭 어렵지만은 않더라고요.

💡 Agent 개발에 필요한 3요소:

  1. 잘 짜여진 프롬프트(Agent가 실패하는 경우도 있습니다. Agent가 한참 돌다가 나 못해! 이러는 것을 방지하려면 프롬프트를 잘 쓰거나, 또는 구조를 잘 잡아야 합니다.)

  2. asyncio, pydantic에 대한 기본 이해(asyncio는 비동기 실행입니다. pydantic은 맞춤 데이터 타입을 만들어줍니다.)

  3. SDK 구조 파악 능력 (이건 진짜 쉽습니다!)

개발 자체는 심플한데, 문제는 “무엇을 하고 싶은가?” 라는 아이디어였습니다.


4. 갑자기 생긴 프로젝트, 그리고 API 요금 폭탄 💸

사업 아이디어도 별로 없고, 그냥 온라인 교육이랑 번역이랑 챗봇 개발 하고 싶어요… (먼산…)

딱 그때 태현님이 아이디어를 툭 던지셨어요:

“아마존 원서 자동 번역하는 크롬 익스텐션 어때요?”

오! 👀 바로 꽂혔습니다.

다음 날 바로 실험에 들어갔고, 이 사업으로 사업 검증을 해봤더니 아무나 막 허락없이 번역하면 저작권에 걸린대서(또 무셥…) 아마존은 건드리지 않고 구텐베르그(Gutenberg)의 공개 원서로 방향을 전환했어요. 구텐베르그(Gutenberg)는 영미(프랑스도 있는 것 같아요)의 저작권이 만료된 원서를 txt/epub/pdf 등으로 서비스하는 곳입니다. 거기라면 텍스트를 그냥 번역 테스트 한다 그래도 머라 그러지 않겠죠?

📚 프로젝트 흐름

  1. 원서 내용 수집 - 랭체인 사용(구텐베르그 로더가 있습니다! 스레드 로더도 만들어 줘~ x 로더도 만들어 줘~ )

  2. Agent가 작은 단위로 번역

  3. 결과 취합 및 UI로 반환/PDF 생성

소년과 소녀에 대한 이야기의 예

<구텐베르그 원문-txt 포맷으로도 제공됩니다. 링크로 제공되요>

한국어 단어가있는 한국어 텍스트 페이지

<번역 결과 일부-보면 아시겠지만 프란츠 카프카의 변신 맨 앞입니다>

근데 여기서 현실 직격탄 맞았습니다… 한 권을 모조리 다 번역해버렸거든요…

GPT Agent API 비용이 너무 비싸요!!! 😭

복잡한 작업일수록 한 번 돌릴 때마다 내 크레딧이 몇 달러씩 줄어들어서 지금은 LangSmith Observability인가요? 알아보고 있습니다~!


5. 사업 검증: 한 번 크롬 익스텐션 사업 검증 미니 버전과 오리지널로 해 보자! 🧑‍💻

📚 미니버전 프로그램 흐름

  1. Planner Agent가 사용자 프롬프트를 보고 5~20개의 검색할 만한 검색어를 생각해 낸 후, 왜 그 검색어를 선정헀는지도 저장

  2. Search Agent가 그 5~20개의 검색어에 대해서 5~20번의 병렬 검색 수행(여기서 asyncio필요 )

  3. Writer Agent가 이 검색 결과를 받아서 구조화된 리포트 생성(영어로만 리포트 작성)

  4. Translating Agent 가 리포트를 받아서 한국어로 번역

  5. 영문 버전/국문 버전 PDF 생성

  6. 그라디오(UI)에 결과 반환

    (프롬프트는 아래에 정리)

  7. 결과

한국어 텍스트가있는 페이지

(중략)

한국어 한국어 한국인 한국인 한국인

📚 오리지널 버전 사업 검증 프로세스

  1. 딥 리서치에 사업 검증 요구

  2. Grok에서 고객 요구사항/예상 반응 확인(x의 데이터를 참조합니다.)

  3. 다시 챗GPT에서 검색을 키고 1, ,2 번의 결과를 모두 넣은 후 분석 요구
    (모든 프롬프트는 아래 링크된 페이지 참조)

  4. 최종 결과(결론만 발췌)

d 결론과 최고 전략적 방향
회사의 사업 계획의 예


5. 결론: Agent는 이제 누구나의 도구입니다 🧑‍💻

이번 실험을 하면서 정말 크게 느꼈어요:

Agent는 더 이상 전문가만의 전유물이 아니다.

프롬프트와 구조 설계만 잘 하면 누구나 만들 수 있어요.

그리고 무엇보다, “하고 싶은 것”이 명확하면 기술은 따라옵니다.


📌 사용자 예제

  • 사용한 프롬프트 (미니 버전)

한국 문자 메시지의 스크린 샷
  • 실패담 & 삽질 기록

번역을 Agent에 시킬 떄, 5~10 페이지의 문서를 한 번에 줘버리면 이러는 경우가 있습니다~ㅠ.ㅠ

미안하지만 도와 줄 수는 없습니다

내가 프롬프트를 잘 못 썼나 싶어서 그 PDF를 한 번 DeepL에 줘봐도 비슷합니다.

그럴 때는 문서를 잘게 쪼개서 조금씩 시키면 이러는 경우가 거의 없습니다~!!!

📌 참고한 포스트(태현님 딥 리서치 사업 검증 방법)

https://www.gpters.org/wealth/post/openai-deep-research-case-7nAljUxSH2p9KU0

2

👉 이 게시글도 읽어보세요