마이크로소프트가 새롭게 공개한 두 가지 AI 모델, MAI-Voice-1과 MAI-1-preview
혹시 들어보셨나요? 이번에 마이크로소프트는 좀 더 똑똑하 고 사람스러운 AI를 위한 중요한 걸음을 내디뎠답니다.
먼저, MAI-Voice-1은 감정 표현이 풍부한 음성을 정말 빠르게 만들어주는 음성 생성 모델이에요. 특히 단일 GPU로 1초 안에 1분짜리 고음질 오디오를 만들 수 있을 정도의 성능을 자랑하죠. 실제로 이 기술은 코파일럿 데일리와 팟캐스트에 이미 적용돼서 더 자연스럽고 사람다운 목소리로 콘텐츠를 제공합니다. 그리고 코파일럿 랩에서도 간단한 음성 데모를 체험할 수 있으니까, 관심 있으신 분들은 꼭 한번 시도해보세요.
두 번째 모델은 텍스트 기반 기본 AI 모델인 MAI-1-preview예요. 이건 마이크로소프트가 자체적으로 만든 최초의 범용 모델인데, 무려 15,000개의 NVIDIA H100 GPU를 활용해 학습했다고 해요. 이 모델은 다양한 지시에 유용하게 대응하고, 코파일럿에서 텍스트 처리 능력을 향상시키기 위한 베이스로 활용될 예정입니다. 현재는 모델 특성을 테스트할 수 있도록 LMArena라는 공개 플랫폼에서 평가를 받고 있고, 일부 신뢰할 수 있는 테스터들에게는 API 접속도 허용하고 있어요.
이번 발표는 마이크로소프트가 직접 만든 핵심 AI 기술을 통해 다양한 고객의 요구에 맞는 서비스와 기능을 제공하려는 전략의 시작점이라고 볼 수 있어요. 특히 음성을 주요 소통 방식으로 삼은 MAI-Voice-1은 감성적인 상호작용을 가능하게 하고, MAI-1-preview는 실용적이고 신뢰도 높은 텍스트 퍼포먼스를 통해 사용자 경험을 더욱 끌어올려 줄 거예요.
마이크로소프트는 이 두 모델을 시작으로 더 다양한 사용 목적에 맞게 조정된 전문 모델들을 점차 선보일 계획인데요, 결국엔 AI가 모든 사람의 일과 삶에 도움이 되는 실용 동반자가 되는 것을 목표로 하고 있답니다.
이번 MAI 모델들의 출시 는 오픈소스 활용과 파트너십 협업은 유지하면서도, 자체 기술력 강화에 적극 나선다는 점에서 특히 주목을 받고 있어요. 즉, OpenAI 의존도는 점점 줄이면서 마이크로소프트만의 AI 생태계를 만들어가고 있는 흐름이죠.
MAI-Voice-1과 MAI-1-preview는 앞으로 다양한 마이크로소프트 제품군에 점차 녹아들겠지만, 이미 꽤 실용적인 단계에 와 있어요. 음성 AI와 텍스트 AI의 조합이 앞으로 사용자와 AI의 관계에 얼마나 큰 변화를 가져올지 기대가 됩니다 😊
더 자세한 내용이 궁금하다면, 원문 번역 블로그에서 확인해보세요! 🔍
https://blog.impakers.club/2025/09/03/microsoft-ai-model-mai/