[번역] 마이크로소프트가 새롭게 공개한 두 가지 AI 모델

마이크로소프트가 새롭게 공개한 두 가지 AI 모델, MAI-Voice-1과 MAI-1-preview

혹시 들어보셨나요? 이번에 마이크로소프트는 좀 더 똑똑하고 사람스러운 AI를 위한 중요한 걸음을 내디뎠답니다.

먼저, MAI-Voice-1은 감정 표현이 풍부한 음성을 정말 빠르게 만들어주는 음성 생성 모델이에요. 특히 단일 GPU로 1초 안에 1분짜리 고음질 오디오를 만들 수 있을 정도의 성능을 자랑하죠. 실제로 이 기술은 코파일럿 데일리와 팟캐스트에 이미 적용돼서 더 자연스럽고 사람다운 목소리로 콘텐츠를 제공합니다. 그리고 코파일럿 랩에서도 간단한 음성 데모를 체험할 수 있으니까, 관심 있으신 분들은 꼭 한번 시도해보세요.

두 번째 모델은 텍스트 기반 기본 AI 모델인 MAI-1-preview예요. 이건 마이크로소프트가 자체적으로 만든 최초의 범용 모델인데, 무려 15,000개의 NVIDIA H100 GPU를 활용해 학습했다고 해요. 이 모델은 다양한 지시에 유용하게 대응하고, 코파일럿에서 텍스트 처리 능력을 향상시키기 위한 베이스로 활용될 예정입니다. 현재는 모델 특성을 테스트할 수 있도록 LMArena라는 공개 플랫폼에서 평가를 받고 있고, 일부 신뢰할 수 있는 테스터들에게는 API 접속도 허용하고 있어요.

이번 발표는 마이크로소프트가 직접 만든 핵심 AI 기술을 통해 다양한 고객의 요구에 맞는 서비스와 기능을 제공하려는 전략의 시작점이라고 볼 수 있어요. 특히 음성을 주요 소통 방식으로 삼은 MAI-Voice-1은 감성적인 상호작용을 가능하게 하고, MAI-1-preview는 실용적이고 신뢰도 높은 텍스트 퍼포먼스를 통해 사용자 경험을 더욱 끌어올려 줄 거예요.

마이크로소프트는 이 두 모델을 시작으로 더 다양한 사용 목적에 맞게 조정된 전문 모델들을 점차 선보일 계획인데요, 결국엔 AI가 모든 사람의 일과 삶에 도움이 되는 실용 동반자가 되는 것을 목표로 하고 있답니다.

이번 MAI 모델들의 출시는 오픈소스 활용과 파트너십 협업은 유지하면서도, 자체 기술력 강화에 적극 나선다는 점에서 특히 주목을 받고 있어요. 즉, OpenAI 의존도는 점점 줄이면서 마이크로소프트만의 AI 생태계를 만들어가고 있는 흐름이죠.

MAI-Voice-1과 MAI-1-preview는 앞으로 다양한 마이크로소프트 제품군에 점차 녹아들겠지만, 이미 꽤 실용적인 단계에 와 있어요. 음성 AI와 텍스트 AI의 조합이 앞으로 사용자와 AI의 관계에 얼마나 큰 변화를 가져올지 기대가 됩니다 😊

더 자세한 내용이 궁금하다면, 원문 번역 블로그에서 확인해보세요! 🔍

https://blog.impakers.club/2025/09/03/microsoft-ai-model-mai/