https://blog.naver.com/thesedays_ai/223190151587
생성AI 및 파운데이션 모델의 경제적 사례
인공지능은 1950년대부터 컴퓨터 과학의 필수 요소였습니다. 수년 동안 인공지능을 효과적으로 배포할 수 있는 기업들은 많은 돈을 벌기도 했습니다. 하지만 최근 월스트리트 저널에 실린 기고문에서 설명했듯이, 이러한 이익의 대부분은 스타트업이 아닌 기존 대형 기업(예: Google 또는 Meta)에게 돌아갔습니다. 최근까지, 즉 생성AI가 등장하기 전까지는 AI-first 기업이 직접 경쟁을 통해 기존 기업의 이익을 심각하게 위협하거나 완전히 새로운 행동을 통해 기존 기업을 쓸모없게 만드는 것을 본 적이 없습니다.
그러나 생성AI 애플리케이션과 파운데이션 모델(또는 프론티어 모델)을 사용하면 상황이 매우 달라집니다. 놀라운 성능과 채택률, 그리고 놀라운 혁신의 속도는 우리가 마이크로칩과 인터넷 이후 볼 수 없었던 수준으로 우리의 삶과 경제를 변화시킬 주기의 초기 단계에 있을 수 있음을 시사합니다.
이 글에서는 기존 AI의 경제성을 살펴보고, AI를 핵심 차별화 요소로 사용하는 스타트업이 일반적으로 탈출 속도에 도달하기 어려웠던 이유에 대해 살펴봅니다. 그런 다음 생성AI 애플리케이션과 대규모 파운데이션 모델 기업이 매우 다르게 보이는 이유와 이것이 우리 업계에 어떤 의미가 있는지를 다룹니다.
역량(Capability) ≠ 경제성(Economics)
지금까지 AI의 문제는 AI가 작동하지 않는다는 것이 아니라, 오랫동안 놀라운 결과를 만들어 왔지만 민간 시장에서 매력적인 순수 비즈니스 모델을 구축하는 데 저항이 있었다는 것입니다. 근본적인 문제를 살펴보면 스타트업이 AI를 통해 뛰어난 경제성을 확보하는 것이 왜 어려웠는지 어렵지 않게 알 수 있습니다.
롱테일 문제
많은 AI 제품은 흔히 "롱테일(long tail)"이라고 불리는 드문 상황에서도 높은 정확도를 제공해야 합니다. 그리고 주어진 상황은 그 자체로는 드물 수 있지만, 전체적으로 보면 드문 상황이 많이 발생하는 경향이 있습니다. 이는 이러한 경우가 드물어질수록 이를 처리하는 데 필요한 투자 수준이 급증할 수 있기 때문에 중요합니다. 이는 스타트업이 합리화할 수 있는 왜곡된 규모의 경제가 될 수 있습니다.
예를 들어 체리를 80%의 정확도로 따는 로봇을 만드는 데 2천만 달러의 투자가 필요할 수 있지만, 90%의 정확도가 필요하다면 필요한 투자액은 2억 달러로 늘어날 수 있습니다. 95%의 정확도를 달성하려면 10억 달러가 필요할 수도 있습니다. 인간에게 지나치게 의존하지 않고 적절한 수준의 정확도를 얻기 위해서는 막대한 초기 투자가 필요할 뿐만 아니라, 투자한 자본의 한계 수익률도 감소하게 됩니다. 원하는 수준의 정확도를 달성하고 유지하는 데 필요한 막대한 비용 외에도, 개발 비용의 증가는 리더에게 해자 역할을 할 수도 있는데, 패스트 팔로워가 학습을 기반으로 적은 비용으로 격차를 좁히려고 할 때, 리더는 R&D에 투자하기 때문입니다.
정확성이 중요합니다
전통적인 AI 문제 영역은 잘못된 답변이 허용되지 않습니다. 예를 들어, 고객 서비스 봇은 잘못된 안내를 제공해서는 안 되고, 수표 입금을 위한 광학 문자 인식(OCR)은 은행 계좌를 오독해서는 안 되며, 자율 주행 차량은 불법적이거나 위험한 일을 해서는 안 됩니다. 명확하게 정의된 일부 작업에 대해서 AI는 인간보다 더 정확한 것으로 입증되었지만, 맥락이 중요한 롱테일 문제에서는 인간이 더 나은 성과를 내는 경우가 많습니다. 따라서 AI 기반 솔루션은 정확성을 보장하기 위해 여전히 사람을 투입하는 경우가 많은데, 이는 확장하기 어렵고 총 마진에 부담스러운 비용이 될 수 있습니다.
인간의 두뇌와 신체는 특정 분야에서 저렴하고 뛰어납니다
인간의 신체와 뇌는 물리적 세계를 탐색하기 위해 수억 년에 걸쳐 진화한 아날로그 기계로 구성되어 있습니다. 약 150와트의 에너지를 소비하고, 죽 한 그릇으로 작동하며, 롱테일 문제를 해결하는 데 꽤 능숙하고, 전세계 평균 임금은 시간당 약 5달러입니다. 세계 일부 지역에서는 몇몇 작업의 평균 임금이 하루 1달러 미만인 경우도 있습니다.
많은 애플리케이션에서 AI는 기존의 전통적인 컴퓨터 프로그램이 아니라 인간과 경쟁하고 있습니다. 그리고 지각(perception)과 같이 인간의 가장 기본적인 능력 중 하나를 필요로 하는 업무의 경우 인간이 더 저렴한 경우가 많습니다. 적어도 비교적 적은 투자로 합리적인 정확도를 얻는 데는 사람을 활용하는 것이 훨씬 저렴합니다. 이는 일반적으로 대규모의 정교한 AI 인프라를 구축할 수 없는 스타트업의 경우 특히 그렇습니다.
또한 AI는 단순히 인간이 달성할 수 있는 수준보다 더 높은 목표를 설정하는 경우가 많다는 점도 주목할 필요가 있습니다(새로운 시스템이 크게 더 나아지지 않는다면 왜 시스템을 바꿀까요?). 따라서 AI가 분명히 더 나은 경우라도 여전히 불리한 위치에 있습니다.
새로운 사용자 행동의 부족
이 점은 매우 중요하지만 과소평가되고 있는 부분입니다. AI가 주로 기존 기업의 기존 제품을 보완하는 데 그쳤기 때문에, 더 광범위한 소비자 집단에서 새로운 사용자 행동으로 이어지는 새로운 사용 사례를 많이 도입하지 않았습니다. 새로운 사용자 행동은 종종 기존 기업이 이해하지 못하거나 관심을 갖지 않는 주변의 세속적인 움직임으로 시작되기 때문에 대규모 시장 변화의 근간이 되는 경향이 있습니다. (개인용 마이크로 컴퓨터, 인터넷, 개인용 스마트폰 또는 클라우드를 생각해 보세요.) 이는 스타트업이 핵심 분야에서 확고한 기존 기업과 경쟁하지 않고도 새로운 소비자 니즈를 충족시킬 수 있는 기회 의 토대가 됩니다.
물론 가내 음성 비서에 의해 도입된 새로운 행동과 같은 예외도 있습니다. 그러나 이러한 예외조차도 기존 기업이 AI 제품에서 얼마나 지배적인지 알 수 있으며, 이 분야에서 널리 받아들여진 독립 기업이 눈에 띄게 부족하다는 점을 보여줍니다.
AI 도전의 축소판인 자율주행차
자율주행차(AV)는 스타트업에게 AI가 어려운 이유를 극단적이지만 잘 보여주는 예입니다. 자율주행차는 예외적인 상황에서 정확도가 필요하고(잘못한다면 매우 위험하다), 운영 중인 자율주행 시스템은 종종 사람의 감독에 크게 의존하며, 인간의 두뇌(약 12와트에 비해 일부 하이엔드 CPU/GPU 자율주행차는 1,300와트 이상을 소비함)와 지각 경쟁을 벌입니다. 따라서 안전, 효율성, 교통 관리 등 자율주행차로 전환해야 하는 이유는 많지만, 직접 운전하는 것은 말할 것도 없고 차량 공유 서비스와 비교했을 때 경제성은 아직 미흡합니다. 이는 자율주행 기술에 약 750억 달러가 투자되었음에도 불구하고 마찬가지입니다.
물론 트럭 운송이나 잘 정의된 캠퍼스 경로와 같이 더 구체적인 사용 사례도 있습니다. 또한 경제성은 계속 개선되고 있으며 조만간 인간을 능가할 가능성이 높습니다. 하지만 여기까지 오는 데 걸린 투자와 시간, 그리고 지속적인 운영상의 복잡성과 위험을 고려하면 일반화된 자율주행차가 육성을 통해서든 인수를 통해서든 대부분 대형 기업의 사업이 된 것은 당연한 결과라고 할 수 있습니다.
민간 시장에서의 무서운 AI 평범화 소용돌이(mediocrity spiral)
위에서 설명한 이유로 인해 AI가 핵심 차별화 요소인 고수익, 고성장 비즈니스를 창출하는 것이 어렵다는 것은 이를 시도하는 스타트업에게는 잘 알려진 슬로건이 되었습니다. 월스트리트 저널에 실린 이 가설은 이를 잘 요약하고 있습니다:
스타트업은 초기에 충분한 정확도를 확보하기 위해 시간이 지남에 따라 AI가 자동화할 것으로 기대하는 기능을 수행하기 위해 인간을 고용합니다. 이는 흔히 상승 경로의 일부로, 일반적인 사용 사례의 80%를 AI가 먼저 처리하고 인간이 나머지 롱테일 부분을 관리합니다.
초기 투자자들은 수익보다는 성장에 더 집중하는 경향이 있기 때문에, 자본을 조달하고 이사회를 만족시키기 위해 회사는 계속 사람을 고용합니다. 이는 앞서 언급한 롱테일의 복잡한 문제 때문에 자동화에 투자하는 것이 까다롭다는 것이 증명되었기 때문입니다. 회사가 성장을 위한 투자를 할 준비가 되었을 때는, 이미 사람을 고용하고 운영하기 위한 조직을 구축한 상태이기 때문에 이를 해체하는 것은 너무 어렵습니다. 그 결과 초기 성장률은 상대적으로 높지만 마진이 낮고 시간이 지남에 따라 확장하기가 어려워지는 비즈니스가 탄생하게 됩니다.
하지만 AI의 평범함의 소용돌이는 치명적이지 않으며, 실제로 이를 통해 상당한 규모의 기업을 구축할 수 있습니다. 하지만 경제성과 확장성은 소프트웨어 중심 제품에 비해 뒤처지는 경향이 있습니다. 따라서 역사적으로 빠르게 성장하는 AI 스타트업이 기존 기업을 뒤흔들 만한 추진력을 가진 사례는 없었습니다. 오히려 더 어렵고, 더 까다롭고, 더 복잡한 문제를 해결하거나 맞춤형 솔루션을 구축하는 서비스 회사로 성장하는 경향이 있었는데, 이는 이러한 유형의 문제를 처리할 수 있는 인력을 보유하고 있기 때문입니 다.
하지만 생성AI를 통해 이 모든 것이 바뀌고 있습니다.
생성AI와 파운데이션 모델의 차이점
지난 몇 년 동안 대규모 파운데이션 모델을 기반으로 구축되거나 이를 통합하는 새로운 AI 애플리케이션이 등장했습니다. 이러한 트렌드는 일반적으로 콘텐츠(이미지, 텍스트, 오디오 등)를 생성하는 데 모델이 사용되기 때문에 생성AI라고 부르거나, 기반 기술이 콘텐츠 생성 이외의 작업에 적용될 수 있기 때문에 단순히 대규모 파운데이션 모델이라고 부릅니다. 이 글에서는 이 모든 것을 생성AI라고 지칭하겠습니다.
AI의 오랜 역사를 고려할 때, 이를 언젠가는 식어버릴 또 하나의 과대광고로 치부하기 쉽습니다. 하지만 이번에는 AI 기업들이 전례 없는 소비자 관심과 도입 속도를 보여주었습니다. 2022년 중후반에 등장한 생성AI는 이미 기술 산업 역사상 가장 빠르게 성장하는 기업, 제품, 프로젝트를 탄생시켰습니다. 대표적인 사례가 있습니다: ChatGPT는 세계에서 가장 상징적인 소비자 기업들을 제치고 단 5일 만에 사용자 수 100만 명을 달성했습니다(Meta의 Threads는 최근 몇 시간 만에 100만 명을 달성했지만, 기존 소셜 그래프(인스타그램)에서 부트스트랩한 것이기 때문에 비교 대상으로 삼기에는 무리가 있습니다).
초기의 빠른 성장보다 더 놀라운 점은 제품 출시 초기의 참신함을 넘어선 지속적인 성장과 규모입니다. 출시 후 6개월 만에 ChatGPT의 전 세계 월간 활성 사용자 수(MAU)는 약 2억 3천만 명에 달했습니다(Yipit 기준). Facebook은 아이비리그에 처음 출시된 지 5년이 넘고 일반 대중에게 소셜 네트워크를 제공한 지 3년이 지난 2009년이 되어서야 비슷한 1억 9,700만 명의 MAU를 달성했습니다.
ChatGPT가 AI의 거물인 것은 분명하지만, 이것이 유일한 생성AI 성공 사례는 결코 아닙니다:
텍스트-이미지 변환 AI 회사인 Midjourney는 2022년 7월 오픈 베타를 시작한 지 1년도 채 되지 않은 2023년 6월에 Discord 서버의 회원 수가 약 1,500만 명으로 급증하여 Discord에서 가장 큰 서버를 보유하게 되었습니다.
수직적으로 통합된 AI 동반자 제공 기업인 Character.AI는 5월의 성공적인 모바일 출시를 제외하고서도 출시 9개월 만에 월간 순 방문자 수 1,800만 명, 일일 활성 웹 사용자 수 300만 명 이상을 기록했습니다(SimilarWeb 기준). 활성 사용자(플랫폼에서 최소 1건의 메시지를 보내는 사용자로 정의)가 매일 평균 2시간 이상 플랫폼에 머무르는 것을 감안하면 이러한 사용자 기반 성장은 특히 인상적입니다.
챗봇 회사인 Janitor AI와 같은 신생 스타트업은 출시 후 몇 주 만에 100만 명 이상의 사용자를 확보했다고 자체적으로 보고했습니다.
AI 개발자 시장도 엄청난 성장세를 보이고 있습니다. 예를 들 어, 대규모 이미지 모델인 Stable Diffusion의 출시는 채택 속도와 보급률 측면에서 최근 역사상 가장 성공적인 오픈소스 개발자 프로젝트 중 일부를 뛰어넘었습니다. Meta의 대규모 언어 모델(LLM)인 Llama 2는 7월에 출시된 후 며칠 만에 Replicate와 같은 플랫폼을 통해 수십만 명의 사용자를 끌어모았습니다.
이러한 전례 없는 수준의 채택은 생성AI가 경제적으로 실행 가능할 뿐만 아니라 마이크로칩 및 인터넷과 동등한 수준의 시장 혁신을 촉진할 수 있다는 매우 강력한 논거가 있다고 믿는 큰 이유입니다.
그 이유를 이해하려면 생성AI가 이전의 AI 상용화 시도와 어떻게 다른지 살펴볼 필요가 있습니다.
정확성이 과대평가됨
생성AI의 많은 사용 사례는 정확성이라는 공식적인 개념이 있는 영역에 속하지 않습니다. 실제로 현재 가장 일반적인 두 가지 사용 사례는 창의적인 콘텐츠 생성(이미지, 스토리 등)과 동반자(가상 친구, 동료, 브레인스토밍 파트너 등)입니다. 이러한 맥락에서 정확하다는 것은 단순히 "사용자의 관심을 끌거나 참여를 유도하는 것"을 의미합니다. 또한 코드 생성을 통해 개발자의 소프트웨어 작성을 돕는 것과 같이 널리 사용되는 다른 사용 사례는 반복적인 경향 이 있으며, 사용자가 생성된 답변을 개선하기 위해 피드백을 제공하는 사실상 루프에 있는 사람이 됩니다. 회사가 즉각적인 정확성을 보장하기 위해 많은 인력을 투입할 필요 없이 사용자가 모델을 그들이 원하는 답을 향해 안내할 수 있습니다.
광범위한 시장에 적용 가능
생성AI 모델은 매우 일반적이며 이미 다양한 대규모 시장에 적용되고 있습니다. 여기에는 이미지, 비디오, 음악, 게임, 채팅 등이 포함됩니다. 게임과 영화 산업만 해도 그 가치가 3,000억 달러가 넘습니다. 또한 LLM은 자연어를 잘 이해하므로 프로그램의 새로운 소비 계층으로 서비스되고 있습니다. 또한 치료, 법률, 교육, 프로그래밍, 코칭과 같은 전문적인 쌍방향 상호작용 분야에서도 폭넓게 채택되고 있습니다.
하지만 기존 시장은 가치를 증명하는 지점에 불과하며, 발전적인 AI를 위한 시작점에 불과할 수도 있습니다. 역사적으로 인터넷의 경우처럼 경제와 역량이 극적으로 변화하면 예측이 불가능할 뿐만 아니라 이전보다 훨씬 더 큰 완전히 새로운 행동과 시장이 등장합니다.
고부가가치 업무에서 인간보다 훨씬 뛰어난 능력 발휘
지금까지 AI는 물체 식별이나 물리적 세계 탐색과 같이 인간이 쉽게 할 수 있는 작업, 즉 지각과 관련된 작업을 복제하는 데 많은 노력을 기울여 왔습니다. 그러나 이러한 작업은 뇌가 수억 년에 걸쳐 진화하면서 특별히 최적화되었기 때문에 인간에게는 쉬운 작업(열매 따기, 사자 피하기 등)입니다. 따라서 위에서 설명한 것처럼 인간과 비교하여 경제성을 확보하는 것은 어렵습니다.
반면, 생성AI는 인간의 두뇌가 진화하는 데 걸린 시간보다 훨씬 짧은 시간(아 마도 10만 년 미만)에 자연어 처리와 콘텐츠 제작을 자동화합니다. 생성AI는 이미 이러한 작업 중 상당수를 인간보다 훨씬 저렴하고 빠르게, 그리고 경우에 따라서는 더 잘 수행할 수 있습니다. 이러한 언어 기반 또는 "창의적" 작업은 인간에게 더 어렵고 종종 더 정교함을 요구하기 때문에 프로그래머, 변호사, 치료사와 같은 화이트컬러 직군은 더 높은 임금을 요구하는 경향이 있습니다.
따라서 미국의 농업 노동자는 시간당 평균 15달러를 받는 반면, 위에서 언급한 직종의 화이트컬러 노동자는 시간당 수백 달러를 받습니다. 하지만 아직 딸기를 경제적으로 따는 데 필요한 미세한 운동 능력을 갖춘 로봇이 존재하지 않지만, 생성AI가 훨씬 적은 비용과 시간으로 이러한 고부가가치 노동자와 유사한 작업을 수행할 수 있는 비용을 분석해 보면 알 수 있습니다.
다양한 종류의 새로운 사용자 행동
생성AI의 등장으로 나타난 새로운 사용자 행동은 경제적인 효과만큼이나 놀랍습니다. LLM은 소프트웨어 개발 파트너, 브레인스토밍의 동반자, 교육자, 인생 코치, 친구, 심지어 연인으로까지 활용되고 있습니다. 대규모 이미지 모델은 기발한 새 콘텐츠를 제작, 혹은 정신 건강 문제와 같은 사용 사례를 치료하는 데 도움이 되는 AI 미술 치료의 개발을 중심으로 완전히 새로운 커뮤니티가 되었습니다. 이러한 기능은 지금까지 컴퓨터가 수행할 수 없었던 기능이기 때문에 우리는 이러한 행동이 어떤 결과를 가져올지, 그리고 이러한 기능을 수행하는 데 가장 적합한 제품이 무엇인지에 대해 잘 알지 못합니다. 이 모든 것이 새롭게 부상하고 있는 민간 생성AI 기업들에게 기회를 의미합니다.