Meet two open source challengers to OpenAI's 'multimodal' GPT-4V | TechCrunch
GPT-4V는 텍스트와 이미지를 모두 이해할 수 있는 다중 모달 모델로 주목받고 있지만, 이러한 기능은 새로운 위험을 수반한다. 개인 정보 유출이나 편견 문제 등이 그것이다.
오픈 소스 프로젝트 LLaVA-1.5와 Fuyu-8B는 GPT-4V와 유사한 기능을 제공하지만, 하드웨어 요구 사항이 덜 엄격하고 사용범위가 다양하다.
그러나 이러한 오픈 소스 모델들도 여전히 문제점이 있으며, 안전성 필터나 텍스트 인식 능력 등에서 GPT-4V와 차이가 있다.