ChatGPT를 만든 사람들이 들려주는 ChatGPT의 비하인드 스토리

ChatGPT를 만든 사람들이 알려주는 ChatGPT의 비하인드 스토리
팀이 당혹스러워하는 부분 중 하나는 ChatGPT 내부의 대부분의 기술이 새롭지 않다는 사실
OpenAI는 출시 이후 사람들이 ChatGPT를 어떻게 사용하는지 관찰해 왔으며, 처음으로 대규모 언어 모델이 한계를 테스트하고 결함을 찾으려는 수천만 명의 사용자의 손에 들어갔을 때 어떻게 작동하는지 확인했습니다. 이 팀은 성폭행 사제에 대한 신의 사랑에 대한 노래 부터 신용 카드 번호를 훔치는 맬웨어 코드에 이르기까지 ChatGPT가 생성할 수 있는 가장 문제가 많은 사례에 뛰어들어 모델의 향후 버전을 통제하는 데 사용하려고 했습니다 .
우리가 발견한 많은 것들이 탈옥이었고, 이는 확실히 우리가 고쳐야 할 문제입니다. 그러나 사용자는 모델이 나쁜 말을 하도록 하기 위해 이러한 복잡한 방법을 시도해야 하기 때문에 이것이 우리가 완전히 놓친 것이거나 우리에게 매우 놀라운 것이 아닙니다. 그래도 현재 적극적으로 작업하고 있는 것입니다. 탈옥을 발견하면 교육 및 테스트 데이터에 추가합니다. 우리가 보고 있는 모든 데이터는 미래 모델에 반영됨