- 웹에서 수집한 대화 데이터를 Meta의 LLaMA를 미세 조정하여 학습시킨 챗봇인 Koala 입니다. (UC Berkeley AI 팀인 BAIR에서 만듦)
- 사용자가 ChatGPT를 통해 대화한 데이터를 이용하였는데, 이때 ShareGPT의 60,000개의 공개된 데이터를 이용했다는 점이 인상 깊습니다.
- 그 외에도 다양한 오픈 소스 데이터를 통해 학습시켰으며 ChatGPT와 유사한 성능을 내는 듯 보입니다.
Koala: 학술 연구를 위한 대화 모델
1