메타, 음성용 생성 AI 모델 ‘보이스박스’ 공개

메타는 특정 학습 데이터 없이도 고품질 오디오 샘플을 생성하고 다양한 작업을 수행할 수 있는 Voicebox라는 새로운 AI 모델을 개발했습니다.

Voicebox는 플로우 매칭이라는 새로운 접근 방식을 기반으로 하며, 레이블이 지정되지 않은 훈련 데이터를 통해 학습하고 다양한 오디오 편집 작업을 수행할 수 있습니다.

메타는 오용될 수 있는 가능성을 우려해 Voicebox 모델이나 코드를 공개하지 않기로 결정했지만, 모델의 접근 방식과 생성된 오디오와 실제 오디오를 구별하는 방법을 설명하는 연구 논문을 공유했습니다.