프롬프팅 없이 o1-preview에게 추리를 시켜봤습니다. (@재미와의미연구소 홍영일 님)

배경 및 목적

지난번 o1-preview와 GPT-4o로 추리 문제를 풀게 한 뒤 비교해 보았던 베스트 사례 발표 당시, 줌 채팅으로 재미와의미연구소 홍영일 님께서 다음과 같이 말씀해주셨는데요!

"새로운 시도를 하나 더 해보시면 좋을 것 같은게.... o1 모델을 발표하면서 오픈AI가 이제는 생각사슬(Chain of Thought) 프롬프팅 기법을 쓰지 말라고 하거든요. 이번에는 o1-preview 모델에서 (1) 단서들만 한번에 다 주고, (2) 사건의 정황을 알려줘 라고만 해보시면 어떨지요? 지금 보여주신 사례는 일반적인 Chain of Thought 프롬프팅 기법을 성실하게 반영하셨는데, 오픈AI는 그렇게 하면 오히려 o1이 더 잘 추론할 수 있는데 방해가 된다고 했거든요"

그래서 이번에는 정말 간단하지만, 프롬프트 없이 문제를 풀게 해보았습니다. 😊

실행 과정

홍영일 님께서 말씀하신 대로, "사건의 정황을 알려줘." 라고 한 뒤, 냅다 (1)제로의 미스터리 추리 퀴즈 본문과 (2)사진을 텍스트로 변환한 설명, 그리고 (3)탐정의 힌트 텍스트를 집어넣었습니다.

(*전체 프롬프트를 확인하려면 여기를 클릭해주세요!)

결과 및 인사이트

그러자 GPT는...

한국어 텍스트가 포함된 페이지의 스크린샷

18초 동안 이런 생각의 과정을 거쳐,

한국어 한국어 한국어 한국어 한국어 한국어 한국어 한국어

이런 결과 요약을 뽑아내어 주었답니다!

추리 퀴즈의 정답을 확인해 보았을 때도, 흠 잡을 데 없는 추론능력을 보여주었습니다.

즉,

(1) 재미와의미연구소 홍영일 님의 말씀대로, o1은 생각 사슬 프롬프팅 기법 없이도 한 번에 정답을 뽑아낸다.

(2) 그리고, o1이 가진 추론능력이라는 것은 결국, 문제를 제시했을 때, 'n초동안 생각' 이라는 생각 과정 안에서 스스로 어떤 단계를 거쳐 문제를 풀어나갈지 말 그대로 스스로 생각의 사슬을 만들어 내고 있다는 것을 실감하게 되었습니다 😄

(오프 더 레코드)

이번 게시글의 결과는 프롬프트 딱 한 번으로 만들어낸 거라, 시간이 많이 들지 않았는데요.

사실은 o1으로 다른 추리 문제들을 풀게 해 보다가 리미트에 걸리게 되었답니다 😅

그런데 실험을 해보면서 느낀 것은,

제로를 로제로 바꿔서 멋지게 추리해낸 o1이 거짓말같이 느껴질 정도로 특정 추리문제에는 매우 약하더라고요.

그래서 스터디 오픈 카톡방에서 "왜 어떤 추론은 잘 해내고 어떤 추론은 너무 못 할까요?" 라고 한탄했더니,

https://yozm.wishket.com/magazine/detail/2784/

이런 게시글을 추천받았습니다.

한국어 한국어 한국어 한국어 한국어 한국어 한국어 한국어
텍스트가 있는 한국어 웹사이트

(*기사 출처: https://yozm.wishket.com/magazine/detail/2784/)

통찰력이 필요한 추리에는 여전히 실패하고 있는 o1...

하지만 o1이 강한 부분과 약한 부분을 조금 더 구체적으로 실감하고자 앞으로 몇 번 더 실험을 해보게 될 것 같습니다 😍

3

뉴스레터 무료 구독

👉 이 게시글도 읽어보세요