https://tinyurl.com/2uu98ecp
또는
https://blog.naver.com/ulsancoding/223114445215
Pinecone 파인콘 벡터DB시리즈로 이번에는 따로 소스코드는 없습니다.
flowiseAI 노코드툴로 PDF 파일기반 문서 내용을 문맥을 이해하고, 응답을 받는 내용을 먼저 구현합니다. 파인콘의 디멘젼등의 세팅 트러블 슈팅 및 크로마DB라고 하는 벡터DB 무료버전 대체제도 소개하고 있습니다.
연재 시리즈로 다음 2편은 텔레그램 챗봇으로 구현합니다. 로컬노트북PC에서 PDF 문서를 훈련 시킨뒤, 크로마DB에 유사도 측정 임베딩 값을 저장합니다. 그리고 파이썬으로 텔레그램 챗봇 대화를 가로챕니다. 텔레그램에서 넘어온 질문 프롬프트를 가로챈 뒤, openAI가 자연어 처리를 통해 PDF 문서 기반한 답변을 생성해서 다시 텔레그램 챗봇으로 보내는 식이라면 openAI 임베딩에 사용하는 비용외엔 토큰 소비도 거의 생기지 않을것같네요