김욱영
김욱영
Moderator
🌿 뉴비 파트너

Text-to-Music 서비스 riffusion

  • Riffusion이라는 Text - to - Music 서비스 출시
  • 듣고 싶은 음악 혹은 소리를 묘사하는 프롬프트 입력 시, 음악 생성
  • 원리는 스테이블 디퓨전' 1.5 이미지 합성 모델의 미세조정 버전을 사용해 오디오를 2차원 이미지로 표현하는 표현하는 소노그램을 생성해 작동
  • https://www.aitimes.com/news/articleView.html?idxno=148547 자세한 내용은 뉴스를 확인