엔비디아 초소형 이미지 생성 '퍼퓨전'공개

엔비디아, 초소형 이미지 생성 AI '퍼퓨전' 공개

보도에 따르면 퍼퓨전은 작은 크기의 모델과 짧은 훈련 시간에도 불구하고 효율성 측면에서 스테이블 디퓨전이나 미드저니와 같은 선도적인 AI 이미지 생성기의 성능을 능가한다.

핵심 아이디어는 ‘키 잠금(Key-Locking)’이다. 이 접근 방식은 이미지 생성 중에 '고양이'나 '의자'와 같이 사용자가 추가하려는  개념을 일반적인 범주로 확대한다. 즉, 고양이는 ‘고양이과’라는 더 넓은 개념과 연결한다. 

이렇게 하면 AI 모델이 정확한 훈련 샘플과 딱 맞아떨어지는 '과적합'에 치중하는 것을 방지할 수 있다. 과적합은 AI가 개념의 창의적인 버전을 생성하기 어렵게 만든다.

6
1개의 답글