ViperGPT: 추론을 위한 Python 실행을 통한 시각적 추론

  • 시각적 쿼리에 응답하는 것은 시각 처리와 추론이 필요한 복잡한 작업
  • ViperGPT는 코드생성 모델을 활용하여 시각 및 언어모델 쿼리에 대한 결과값을 생성함
  • API를 활용하여 엑세스하고 파이썬 코드를 생성하여 구성됨
  • 언어모델을 추가적으로 교육할 필요가 없으며, 복잡한 시각적 작업에 대한 최고의 결과를 내놓을 수 있음
  • 논문 : https://viper.cs.columbia.edu/
1
2개의 답글