최효남
최효남
🐶 AI 찐친
🔬 임팩트 찐친

인터랙티브 임팩트: NPC, 멀티모달 고객 서비스 혁신과 이슈

#AI임팩트, #NPC, #멀티모달, #상호작용, #개발팀


생성형AI에 기반한 AI 대중화 시대 중요한 혁신의 동인으로 ‘창작의 민주화’, ‘혁신 비용의 절감’과 함께 인간과 기계의 ‘상호작용의 혁신’을 꼽을 수 있습니다.

인간과 AI 사이의 대화 또는 인터랙티브를 위한 TEXT, 음성, 영상 모든 영역에서 기존의 어떤 기술보다 진보된 시대를 목도하고 있기 때문이지요. 여전히 많은 오류와 이슈, 걱정거리들이 남아있지만, 하루가 멀다하고 신기방기한 기능과 사례들이 쏟아지고 있어 많은 사람들을 열광시키고 있습니다.

그 중 이번 포스트에서는 상호작용의 혁신에 따라 재도약의 기회를 맞이하고 있는 ‘가상인간’ 분야와 ‘고객 서비스’ 분야에 대한 사례를 살펴보고자 합니다.


1. 유저와 상호작용하는 NPC 혁명

2022년에 엄청나게 주목을 받았던 메타버스는 생성형 AI 기술의 열풍과 함께 관심이 급격히 줄어 들었습니다. 코로나 엔데믹에 접어들면서 현실 공간에서의 사람간 교류가 회복되자 메타버스 서비스가 목적성과 실용성을 증명하지 못한 채 수익모델 역시 찾아내지 못했던 것이죠.

하지만 ChatGTP와 같은 실시간 대응이 가능한 AI 기술이 가상의 공간에서 사람과 NPC(Non Player Character. 사람 이 직접 조작하지 않는 캐릭터), 혹은 가상 사물과의 상호작용에 새로운 전환점으로 작용할 것이 기대되고 있습니다. (참고: LLM to NPC using Unity 3D, 게임 내에서 NPC 반응하기, )

이러한 상호 작용성은 다양한 게임 NPC 또는 메타버스 내 버추얼 휴먼의 실시간 역할 확장에 대한 가능성과 그만큼 소비자의 효용도 충족되는 잠재력을 내포하고 있습니다.

실제로 게임 “마운트 앤 블레이드-베너로드”는 ChatGPT를 활용하여 플레이어 와 NPC가 정해진 선택지가 아닌 직접 입력하는 채팅 내용에도 자연스럽게 대화가 이어지는 데모 영상을 공개했습니다(아래).

영상에서는 플레이어가 NPC의 요청을 바로 들어주는 대신 흥정을 하거 나 다른 조언을 구해도 NPC가 맥락에 맞는 일상적인 대화를 나누는 모습을 볼 수 있습니다. 모두 기존 게임에서 보기 힘든 장면으로, NPC가 개발자가 정해준 대로만 움직이는 기존 틀에서 벗어나, 플레이어와 실감나게 상호작용할 수 있음을 보여준 것이죠(관련기사).

채팅이 가능한 NPC는 음성으로도 소통이 가능합니다. 엔비디아는 생성형 AI를 NPC에 적용한 게 임 ‘카이로스(Kairos)”의 데모 영상 속에서 NPC와 플레이어가 음성으로 대화하는 모습을 담았죠(엔비디아:AI로 게임 캐릭터와 대화)

여기서 플레이어가 ‘Can I help?’ 라고 묻자 그제서야 NPC가 미션을 부여하는 식입니다. 플레이어의 행동에 따라 NPC의 반응도 달라진 것이죠. 그래픽 기술과 AI가 발전하면서 너무나 현실적인 NPC가 플레이어를 속이는 등의 윤리적 문제마저 제기되고 있습니다(관련기사).


2. 멀티 모달 기반 고객 서비스 혁신

생성형 AI가 사물을 바라보고, 듣고, 해석하는 멀티모달(Multi modal) 기능은 서비스의 혁신적인 변화를 불러올 수 있습니다. 그 가능성은 무궁무진 하죠.

  • 특히 대 고객지원 및 상담 서비스가 가능한데, 고객이 고장 난 제품의 사진이나 동영상을 보내면서 문제를 설명하면 AI가 이를 인식하고 대화를 이어나가며 지원을 받는 식입니다

  • 교육이나 학습을 지도하는 서비스에서도 학생들이 문제를 해결하는 과정에서 그림이나 다이어그램을 AI에게 제시하면 그림의 어떤 부분이 잘못되었는지 설명을 들을 수 있고요,

  • 의료 서비스에서도 환자가 증상에 대한 설명과 함께 피부 문제, 엑스레이 등의 이미지를 제공하면 AI는 특정 질병의 증상을 식별하고, 의학적 조언이나 진료 예약을 안내할 수 있습니다.

  • 개인화된 쇼핑 경험 제공도 가능합니다. 고객이 원하는 제품의 이미지를 업로드 하거나 말로 설명하면, AI가 이를 분석하여 유사 제품을 추천할 수 있게 되는 식이죠.


개인화된 쇼핑의 경우 아래 영상과 같은 예를 들 수 있습니다. GPT-4의 Vision API와 Dall-E3를 조합하여 고객이 입은 옷의 스타일을 조언해주고 예시 이미지까지 출력하는 데모입니다.

GPT에게 자신의 현재 입은 의상의 영상을 전달하면, GPT는 개선이 필요한 부분을 조목조목 작성하고, 개선된 의상에 대한 개념을 잡을 수 있도록 Dall-E를 통해 추천하는 의상의 실제 스타일 이미지를 제시하고 있습니다.

AI가 추천하는 내용은 지금 착용한 바지보다 슬림 핏을 선택하면 실루엣이 좋아질 것 이라거나, 신발이 전체적인 느낌을 좌우하므로 가죽 신발 또는 운동화를 선택할 수 있다며 안내하고 있습니다. 이러한 내용은 마지막 모델핏의 이미지화를 통해 전체 분위기를 파악할 수 있게 하였습니다.

실제 상용화에는 아직 많은 개발이 필요하지만, 근 시일 내 전설로 화자되는 패션XX 소개팅남은 이제 커뮤니티가 아닌 AI에게 소개팅에 나갈 옷을 물어보게 될 수 있겠네요. 😂

이것을 실제 구현해 보는 것도 개인적인 과제인데요, GPTs나 API.무엇으로 구현하면 좋을지 고수님들께서 조언을 주시면 좋을 것 같습니다^^. 아래는 ChatGPT로 관련해서 물어본 결과입니다.


3. 마무리: AI 서비스 혁신에 따른 정보관리 이슈

앞으로 고객과의 접점에서 콘텐츠를 유통하고, 새로운 고객서비스를 제공하는 영역에서는 생성형 AI의 음성, 멀티모달 기능과 자동화된 챗봇 등 다양하고 혁신적인 서비스가 경쟁적으로 출현할 것으로 보입니다.

다만 이러한 AI 기반 서비스는 보고 들을 수 있는 멀티모달 서비스는 개인이 처한 상황과 외모적 특성, 음성, 글 쓰는 패턴 등을 인식할 수 있어, 과거에 비해 개인적인 정보를 더욱 포괄적으로 수집, 오남용에 대한 취약점은 더욱 커질 수 있습니다. 나에 대해 AI(혹은 개발자)가 이전보다 더 많은 컨택스트를 알게되는 것이죠

또한, 개인에 대한 심화된 이해를 바탕으로 만들어진 개인 맞춤형 서비스가 ‘맞춤형 차별’의 가능성을 내포한다는 점도 주의가 필요합니다.

마지막으로, 특정 인물의 목소리와 얼굴 등 외모를 AI로 학습하고 대체하는 기능은 딥페이크를 이용한 사기, 무단 도용 등의 이슈로 이어질 수 있습니다.

자본의 논리와 기술 혁신 사이의 건전성 확보를 위한 제도 정립이 필요한 시점이라고 할 수 있지요

4
2개의 답글

👉 이 게시글도 읽어보세요