나는 벨루가를 사용하면서 들었던 1가지 의문이 있었다. 똑 같은 내용을 지식화일로 업로드시 어떤 확장자를 가진 파일이 파일속의 내용을 더 정확하게 답변으로 출력하는지 알고 싶었다.
테스트는 다음과 진행하였다.
2쪽 분량의 pdf파일을 임의로 생성
2쪽 분량의 pdf파일을 자세히 나누어 csv화일을 생성
상기 2개의 파일(pdf, csv)을 챗봇 2개에 각각 벨루가 - 설정 - 문서관리 - 파일에 업로드하여 학습을 시켰다.
그리고 2개의 챗봇에 똑같은 질문을 하였다.
질문 : 사회서비스가 뭐야
pdf 학습한 챗봇 답변
csv를 학습한 챗봇 답변
결론 : csv파일을 학습한 챗봇은 파일에 있는 내용을 100% 그대로 답변에 사용하는것으로 나타났다
시사점 : 결국 챗봇 답변의 정확도는 학습시키는 데이터의 구조화가 품질에 달려있다고 판단된다.
#10기 챗봇 2.0