ChatGPT가 그려준 미래

최근 인공지능 분야에서 눈에 띄게 주목받는 기술 중 하나가 바로 ChatGPT입니다. 이 기술은 2022년 말 대중에게 공개되었으며, 세상에 소개된 이후 그 어떤 서비스들보다 많은 사용자를 단시간에 모은 서비스가 되었습니다. 하지만, 이러한 엄청난 기록에도 불구하고 제 주변을 둘러보면 아직 10명 중 1~2명 정도만이 이 서비스를 직접 경험한 상황입니다. 이 기술발전이 세상을 변화시킬 것이라는 이야기와 동시에 디스토피아의 서막이 되리라 오해되곤 하는 ChatGPT에 대해 자세히 알아보고, 이를 통해 그려진 미래의 모습을 함께 상상해 봅시다.

ChatGPT는 OpenAI에서 개발한 언어 모델로, 텍스트 데이터를 효과적으로 이해하고 생성할 수 있는 인공지능 기술입니다. 이 기술은 Generative Pre-trained Transformer(GPT)를 기반으로 하여, 사전 학습된 데이터를 활용하여 다양한 언어 구조를 파악하고 새로운 텍스트를 생성할 수 있습니다. 그 과정에서 어떤 말이 있으면 그 다음 말로 무엇이 올지 확률적으로 계산하고 결과를 출력하는 방식으로 작동합니다. 이를 어린아이가 말을 배우는 과정과 비슷하게생각할 수 있지만, 새로운 말은 하지 못하고 들어본 적이 있는 말만 사용할 수 있다는 점에서 인간의 어린아이와는 큰 차이가 있습니다. 현재까지 네 번째 세대 버전인 GPT-4가 개발되어 있으며, 이 최신 버전은 미국 변호사 시험에서상위 10% 성적을 거두는 등 큰 화제를 모으고 있습니다. 이제 이 기술은 한 아이가 풍선 뭉치를 들고 있는 사진을 입력하고 '풍선 끈을 끊으면 어떻게 될까?'라는 질문에 '풍선이 날아갑니다'라고 대답할 수 있는 수준에 이르렀습니다. 인공지능을 지능적이라고 판단하는 '튜링테스트'는 인간이 어떻게 느끼는가가 기준이기에, 그 관점에서 ChatGPT는 성능은 지능적이다 판단되고 있습니다. 앞으로도 정보를 이해하고 그에 따른 대답을 생성하는 성능이 빠른 속도로 향상될 것으로 기대됩니다.

그러나, ChatGPT는 태생적으로 몇 가지 단점을 갖습니다. 가장 큰 단점은 완전히 새로운 아이디어를 생성하지 못한다는 것입니다. 학습에 사용된 데이터는 2021년 말까지의 정보를 기준으로 했으며, 이후의 세상 변화에 대해서는 전혀 알지 못합니다. 또한, 문맥을 완벽하게 이해하지 못해 정확한 정보를 제공하지 못할 수도 있습니다. 여기서 문맥은 글의 구조와 논리를 이야기합니다. ChatGPT와 같은 언어 모델들은 주어진 텍스트 이후에 등장할 단어만 제시할 뿐이기에 전체적인 논리를 이해하지 못합니다. 이로 인해 거짓말처럼 보이는 결과물이 자연스럽게 생성되기도 합니다. 이 때문에, ChatGPT의 답변으로 주어진 웹사이트 주소는 대부분 존재하지 않는 주소이고, 알려주는 논문 제목 역시 그럴싸 하지만 실제로는 존재하지 않는 경우가 대다수 입니다.

다른 간단한 예로, ChatGPT가 수학 계산을 수행하지 못하는 점을 들 수 있습니다. 예를 들어, ChatGPT에게 1035의 3.1승 값을 계산해 달라고 요청하면 틀린 결과값을 제공합니다. ChatGPT는 4자리 숫자와 2자리의 10이하의 숫자의 제곱승 값이 대략 8자리 숫자가 될 것이라고 예측할 뿐이지, 논리적인 계산을 수행하지는 않습니다. 지속적인 기술개발을 통해 이러한 단점들이 앞으로 보완될 수 있으나, 완전히 극복될 수 있을지는 미지수입니다. OpenAI의 CEO 샘 알트만은 ChatGPT가 절대로 AGI(일반 인공지능)가 될 수 없다며, 이 기술이 언젠가 그런 능력을 갖추게 될 것이라고 생각하며 두려워하는 것은 시간낭비라고 표현했습니다.

그러면 ChatGPT의 개발사인 OpenAI가 어떤 회사인지 알아봅시다. OpenAI는 비영리(OpenAI Inc.)와 영리(OpenAI Limited Partnership; OpenAI LP)로 구성된 연구소입니다. 2015년 현재 OpenAI의 CEO인 샘 알트만과 전세계적 유명인사인 일론 머스크 등에 설립되었으며 일반인공지능 개발을 목표로 하고 있습니다. 비영리 단체로 출범한 OpenAI는 2019년 비영리에서 제한적 이익 회사(capped-profit company; 이익창출이 제한되어투자자에게 이익회수를 제한)로 전환하고 이후 2022년 12월 ChatGPT를 무료 프리뷰 서비스로 출시했습니다.

OpenAI가 비영리로 출범했고 제한적 이익 회사라는 사실과, 2022년 출시 베타 프리뷰 출시 이후 현재까지 독보적인 시장선점으로 수많은 추가적인학습데이터를 수집했다는 것에서 후발주자인 구글의 Bard, 한국의 KoGPT등이 ChatGPT에 버금가는 성능의 언어모델을 만들 수 있을지 회의적인 생각이 드는 것도 사실입니다. 새로운 모델, 새로운 방법이 나와선 ChatGPT에 훨씬 능가한다고 설명되어 있더라도 이제는 대부분이 어떻게 학습시켰더니 더 나은 결과를 나타냈다는 뉘앙스의 설명을 하곤 합니다. '우리 모델은 이렇게 학습시켰더니 더 똑똑하게말을 하더라구요'라는 것이라면 제가 의심하게 되는 숨겨진 말은 '우리 모델은 (덜 똑똑하지만) 이렇게 학습시켰더니 더 똑똑하게 말을 하더라구요'. 과연 덜 똑똑한 모델을 비싼 특정분야 학습을 통해 똑똑하게 하는 것과, 애초에 아주 똑똑한 모델을 약간의 코칭으로 특정 분야에 대해 말하는것 무엇이 더 나은 결과를 줄까요? 이것은 기다려 봐야겠습니다.

OpenAI의 독특한 회사 구조와 시장 선점 효과는 기술의 벽뿐만 아니라 중요한 데이터의 벽을 만들게 되었습니다. 이전 버전인 일반 모델(현재 3.5 버전)은 건당 0.002달러(한화로 약 3원 미만)로 아주 저렴하게 책정하고, 고급 모델 (현재 4 버전)은 건당 0.06달러(한화 약 80원)의 가격 정책을 제시한 것도 타 회사들이 쉽게 따라오기 어려워, 향후 언어 모델 시장의 독점과 최저 기준을 시장에 알린 셈입니다.

일반 모델의 경우, 그 활용성은 무궁무진합니다. ChatGPT와 같은 모델이 도입된다는 것은 꼭 대화를 주고받는 것에 국한되지 않기 때문입니다. 어떠한 행동의 주고받음도, 그 행동을 표현하는 언어 모델을 매개로 행동을 주고받을 수 있습니다. 단순히 말을 완성시키는 것뿐만 아니라 에이전트 기능을 이용해 다른 기술들, 예를 들어 비행기 예약, 숙박 예약, 배달 주문 등과 연계해 특정 역할을 수행하는 기능을 구성할 수 있게 되며, 이런 복잡한 대화도 건당 20원 정도면 가능하게 된 것입니다. 이 가격은 기존에 사람이 받던 중국집 주문을 이제 배달 앱이 받게 되면서 발생한 비용적 효율성의 증가보다 훨씬 큰 효율 증대를 불러오며, 훨씬 똑똑하고 다양한 기능을 수행할 수 있도록 확장 가능합니다. 이를 활용한 새로운 서비스나 아이디어가 하루가 다르게 등장하는 요즘입니다. 말그대로 아이폰과 앱 스토어가 촉발시킨 스마트폰 기술 생태계의 태동기와 동일한 상황이라고 해도 과언이 아닙니다. 새로운 대기업이 탄생하고 기존의 산업이 대체되는 그 시기를 지나고 있는지도 모르겠습니다.

물리적인 행위가 반복 가능한 무언가일 때 기계나 로봇으로 대체되어가던 시기가 있었다면, 이제는 비물리적인 지식과 서비스의 행위도 기계에 대체될 예정입니다. 예를 들어 호텔 리셉션 고객 응대와 기업들의 상담 업무의 상당부분이 곧 ChatGPT가 대체할 수 있을 겁니다. 그러나 사람이 필요 없게 되는 것은 아닙니다. 사람은 이제 단순한 업무보다 더 창의적이고 지적인 일을 수행하는 역할을 담당하며, ChatGPT와 같은 생성 모델을 학습시킬 데이터를 생성하는 지식 선별 업무가 새로이 발생하리라 예상됩니다. 일그러진 문자를 읽어 내는 캡챠(Chaptcha) 같은 초급수준에서부터 무엇이 중요한 뉴스인지 그게 얼마나 중요한지 별점을 매기는 중급 수준의 도메인지식 라벨링, 새로운 연구 결과에 대해 신뢰성 정도를 평가하거나 해석 결과를 분석하는 고급 수준의 라벨링까지, 인간의 관점에서 사실을 파악하거나 중요도를 매기거나 신뢰성을 평가하는 일을 하게 될 것입니다.

분명한 것은 우리 모두의 삶의 패턴에 큰 변화가 있을 것입니다. 저희와 같은 공학자들에겐 더 이상 논문 검색이 의미 없을 시대가 올지도 모릅니다. 지금도 이미 ChatGPT에 '해안가의 설치된 구조물에 파도가 부딪히고 있는 경우 파도에 의한 외력을 계산하는 파이썬 코드 알려줘'라고 하면 3초 만에 바로 실행 가능한 해양파 이론을 기반으로 하는 외력 항 계산 프로그래밍 코드를 자세한 설명과 함께 출력해줍니다. 세상에 공개되어 있는 것은 직접 찾아볼 필요가 없어지는 세상인 것이지요. 왠만한 간단한 프로그래밍 코드는 대화로만 가능하게 됩니다. 신입생을 대상으로 하는 ChatGPT 수업 자료에서 마지막 과제로 ChatGPT와 대화만으로 파이썬 코드를 작성하게 해보았습니다. 직접 작성한다면 파이썬 기초 학습부터 한 달이 걸릴 것이 3시간이면 완성되는것이죠.

세상이 처음 디지털화가 되어 갈 때 텍스트를 디지털로 표현하는 폰트의 국제적 기준 설정에서 과정에서, 한글 폰트에 대한 연구가 뒤쳐진 나머지 한글을 제대로 표현 가능한 용량을 할당받지 못했었습니다. 영문을 기반으로한 다른 모든 언어들의 룰북보다 CJK(Chinese-Japanese-Korean)의 세 언어를 설명하는 룰북이 훨씬 두꺼웠으니, 그 중 연구가 부족했던 한글이 그런 취급을 당하는 것도 아픈지만이해가 됩니다. 이번 ChatGPT에서도 영어에 비해 CJK의 응답 속도는 느렸습니다. 과거 인터넷의 속도가 느린 것이 정보와 기술의 장벽을 만들듯, 새로운 세상에서 CJK가 뒤쳐질 것임을 예고한 것은 아닐까 다소 우려되지만, 동시에 기술력 향상을 통해 이러한 차이가 미미한 수준이 되리라 기대합니다. 직접적으로 ChatGPT를 활용하는 것 뿐 아니라, 우리의 삶의 곳곳에 생성모델 기반의 기술이 작동하는시대가 곧 올 것입니다. 정해진 미래를 예측하고, 이 기술을 잘 이해하고활용할 수 있도록 꾸준한 관심을 가져야 할 것입니다.

저는 ChatGPT를 신입생에게 소개하기 위해 공부하고, 더 잘 이해하기위해 카카오톡 챗봇 '챗지'를 개발하였으며, 이를 오픈소스로 공개했습니다. ChatGPT 수업자료와 공개한 카카오톡 챗봇 오픈소스 빌더 주소는 다음과 같습니다.

- 신입생 대상 ChatGPT 수업자료
- ChatGee AI 챗봇 빌더
3
1개의 답글

👉 이 게시글도 읽어보세요

모집 중인 AI 스터디