메타, 멀티모달 이미지 생성 AI ‘카멜레온’ 공개


메타, 멀티모달 이미지 생성 AI '카멜레온' 공개
  • 메타가 이미지 생성 및 분석 기능을 모두 수행하는 멀티모달 이미지 생성 AI '카멜레온'을 공개했으며, 기존 확산 모델 대신 마스킹된 토큰 모델링을 사용하여 이미지 데이터를 토큰으로 변환합니다.

  • 카멜레온은 사전 훈련 후 복잡한 프롬프트 이해, 이미지 캡션 생성, 시각적 질문 응답, 텍스트 기반 편집 및 조건부 이미지 생성 등의 다양한 멀티모달 작업을 수행하도록 미세조정되었습니다.

  • 이 모델은 셔터스톡에서 제공하는 수백만 개의 이미지 데이터세트를 이용해 훈련되었고, 기존 AI 모델보다 5배 더 적은 계산과 더 작은 훈련 데이터세트로 높은 수준의 성능을 보여줍니다.

4
1개의 답글