The Dawn of LMMs: Preliminary Explorations with GPT-4V(ision)



GPT-4 비전 모드로 어디까지 가능한지 다방면으로 시도한 것을 정리한 페이퍼입니다.
개인적으로 X-ray를 분석한 것이 인상깊었습니다.
손 글씨도 생각보다 높은 퀄리티를 보입니다.
비디오 영상 분석도 생각 이상으로 잘 이해합니다.
사람의 감정 분석도 어느정도 해낼 수 있어보입니다.