n8n 으로 RAG 실습 찍먹하려다 삽질한 스토리

소개

시도하고자 했던 것과 그 이유를 알려주세요.

제가 이번 스터디에는 RAG 프로젝트를 계획하고 있는데요

랭체인으로 본격적으로 구현해보기 전에

지난기수때 배웠던 n8n 으로 '찍먹'을 먼저 해보려 했습니다.

진행 방법

어떤 도구를 사용했고, 어떻게 활용하셨나요?

사용도구 : n8n

17기에 n8n 스터디 할때 RAG 가 가능했던 기억이 나서 일단 검색부터 했습니다.

컴퓨터 화면에서 VPN 설정의 스크린 샷

그럼 이렇게 템플릿이 뚝딱 하고 생깁니다.

흐름도의 스크린 샷

메모에서 시키는 대로

워크플로우를 실행하고 (아 그전에 Active 먼저)

가지고 있던 텍스트 위주의 pdf 문서를 하나 넣었습니다.

텍스트 '데이터 테스트 래그를 뒷받침하는 페이지 스크린 샷'

오 간단한데? 라며 사례글 쌉가능! 하며

질문을 했습니다만...

엉뚱한 소리만 합니다. ㅎㅎ

그래서 가지고 있는 다른 pdf 로 몇번 더 시도해보았으나..

여전히 대답을 못하거나 딴소리를 하네요.

GPT 와 대화를 나누며 디버깅을 시도했으나..

계속 삽질만 계속 되었습니다.

랭스미스(https://www.langchain.com/langsmith) 도 가능하다고 해서 오~ 했는데

로컬 호스팅만 가능하다고 하네요..

그러다 전체 플로우 json 을 긁어다가 다시 문의했더니

벡터스토어가 문제라고 합니다.

(분명히 저번 기수에 다른분들은 바로 됐던거 같은데.....)

미심쩍지만 벡터스토어 변경을 시도해봅니다.

우선 n8n 에서 검색되는 VectorStore 목록을 주고 추천해달라고 했습니다.

한국어 메뉴의 스크린 샷

Qdrant 를 RAG 용으로는 가장 추천한다고 하네요

가입을 하고 세팅을 해봅니다.

옥탄 클라우드 웹 사이트의 스크린 샷

api key 도 발급받고 Collection 도 만들어봅니다.

애드워즈 검색 페이지의 스크린 샷
웹 브라우저에서 동기화 설정의 스크린 샷

Qdrant Vector Store 로 변경해보려는 순간.

내가 넣어봤던 pdf 문서들이 n8n 에 있는 간단한 스플리터 로는 파싱 하기 어려운 상태는 아니었을까?

(여러개 테스트 해봐서 첨엔 의심을 못했..)

최근에 랭체인 실습하면서 (지금 테디노트님 RAG 책 사서 스터디 중입니다.)

예제로 사용되었던 pdf 는 어떨까?

하는 생각이 급 스쳐서..

해당 파일을 넣어봅니다.

임베딩은 잘 되었고..

질문을 해봅니다.

잘됩니다.

아아 전 뭘 한걸까요....

한국 컴퓨터 화면의 스크린 샷

여기까지 스터디 사례 날먹하려다

삽질한 후기입니다.

결과와 배운 점

조금 더 테스트 해보니 앞에 안됐다고 생각한 상황도

임베딩이 안되었던게 아니라

제가 한 질문이 임베딩 되어있는 데이터를 활용할 필요가 없다고 판단된거 같았습니다.

오늘 찍먹 해보면서 실제 RAG 프로젝트를 할때는
어떤 질문에 어떻게 답이 나오기를 기대하는지 를 좀더 명확하게 기획하고 시작해야 겠다는 생각을 했습니다.

ps. 다음부턴 좀더 미리 준비하겠음다.

4
6개의 답글

뉴스레터 무료 구독

👉 이 게시글도 읽어보세요