Stability AI는 최근 가장 진보된 텍스트-이미지 생성 모델인 ‘Stable Diffusion 3’을 출시했습니다. 이 모델은 20억 개의 파라미터로 구성되어 있으며, 일반 소비자 시스템에서도 포토리얼리스틱한 이미지를 생성할 수 있습니다 .
Stable Diffusion 3은 복잡한 프롬프트를 이해하고, 공간적 관계, 구성 요소, 행동 및 스타일을 포함한 다양한 요소들을 처리할 수 있도록 설계되었습니다. 또한, 텍스트 생성 정확도가 크게 향상되었으며, VRAM 요구량이 낮아 표준 소비자 GPU에서도 원활하게 실행됩니다 .
주요 포인트
• Stable Diffusion 3은 고해상도, 포토리얼리스틱한 이미지를 생성할 수 있습니다.
• 복잡한 프롬프트와 세부적인 데이터셋을 이해하고 처리할 수 있습니다.
• 일반 소비자 GPU에서도 실행 가능하여 접근성을 높였습니다.