Sovereign Quant — 자율 투자 인텔리전스 시스템

소개

  • 개인 투자자가 넘쳐나는 시황·매크로·뉴스 속에서 "내 포트폴리오에 의미 있는 신호"를 스스로 찾기 어려운 문제를 해결하고자 함.

  • 야간 미장·매크로·KRX 시세를 여러 앱과 텔레그램으로 직접 취합하는 번거로움을, 내 계좌 기준 한 화면으로 압축하고자 함.

  • 단발성 리포트가 아니라 AI가 지식을 쌓고(위키) → 인과로 잇고(그래프) → 에이전트가 자율로 진단·점검하는(LangGraph) 3층 자동화로 만들고자 함.

  • 클라우드 의존과 구독 비용을 최소화하고, 내 컴퓨터(맥)에서 로컬로 돌아가는 자기 소유 시스템을 지향함.

진행 방법

어떤 도구를 사용했고, 어떻게 활용하셨나요?

Tip: 사용한 프롬프트 전문을 꼭 포함하고, 내용을 짧게 소개해 주세요.

Tip: 활용 이미지나 캡처 화면을 꼭 남겨주세요.

Tip: 코드 전문은 코드블록에 감싸서 작성해주세요. ( / 을 눌러 '코드 블록'을 선택)

  • LLM 위키 (Obsidian + 위키 사서 AI): 종목·매크로·뉴스·투자 결정을 위키 문서로 축적하고 자동 분류·링크·정합에 사용함.

  • GraphRAG (PostgreSQL + pgvector): ETF·종목·매크로·뉴스·공시를 11종 관계로 묶은 인과 지식그래프 구축에 사용함.

  • 로컬 LLM (gemma 31B, ollama) + embeddinggemma 768d: 뉴스에서 관계 추출과 의미 임베딩을 전부 로컬에서 처리하는 데 사용함.

  • 통계 인과 (statsmodels): Granger + 다변량 VAR/IRF로 충격 전파를 수치화하는 데 사용함.

  • 에이전트 오케스트레이션 (LangGraph · LangChain): 역할별 전문 AI(팀장·분석가·집행관·사서)를 작업 흐름으로 묶어 자율 운영하는 데 사용함.

  • 데이터 소스: KRX·KIS·yfinance·FRED/ECOS·네이버 데이터랩·DART·YouTube·Tavily를 한 그래프로 통합하는 데 사용함.

결과

1️⃣ 3층 아키텍처 = 하나의 자동화 흐름

  • LLM 위키(지식 축적) → 그래프래그(인과 연결) → 에이전틱 AI(자율 실행)로, 위로 갈수록 "스스로 판단·실행"에 가까워지도록 동선을 설계함.

2️⃣ 1층 — LLM 위키

  • Obsidian 기반 위키에 종목·매크로·개념·뉴스를 문서로 축적하고, 위키 사서 AI가 새 자료를 자동으로 분류·링크·정합하도록 함.

  • 실제 위키 그래프뷰에서 수백 개 문서가 이미 거대한 연결망을 이루고 있음(이번 발표의 출발점).

3️⃣ 2층 — 그래프래그 (이번 작업의 핵심)

  • 종목→ETF 편입(비중), 매크로→가격 전파, 뉴스→영향 등 11종 관계·8만+ 엣지로 그래프를 구성함.

  • 규칙 기반·LLM 추출·통계 인과 3가지 방식으로 엣지를 생성하고, 엔티티 해상도로 "엔비디아=NVIDIA"를 한 노드로 통합함.

  • 다차원 인과 망과 SVAR/IRF로 "충격이 어느 종목까지 며칠 시차로 전파되는지"를 추적함.

4️⃣ 3층 — 에이전틱 AI (LangGraph)

  • 팀장·분석가·집행관·사서 역할의 AI가 그래프를 활용해 자율로 분석·점검·핸드오프하도록 함. LangChain=도구 배관, LangGraph=작업 흐름 지휘.

  • 중요한 결정은 사람 승인 게이트(텔레그램 확인)를 거치도록 함.

5️⃣ 데이터 파이프라인 & 정합

  • 9종 소스를 PostgreSQL로 수집하며, KRX 당일 시세의 T+1 지연은 KIS 당일가로 채워 괴리 0%로 정합함.

6️⃣ 산출물 채널

  • 프리마켓 퀵샷·클로징벨·주간·헤지펀드 PM 톤 리포트를 텔레그램으로 내 계좌 기준 자동 발송하고, 동적배분·RS/CANSLIM·세제 계산 등을 제공함.

다양한 숫자를 보여주는 웹페이지의 스크린샷
다양한 유형의 정보가 포함된 대시보드의 스크린샷

배운 점

  • 지식을 점이 아니라 인과의 선으로 이으면(그래프래그) "왜?"라는 질문에 경로로 답할 수 있음을 확인함.

  • 로컬 LLM에서 thinking 모드를 끄는 작은 튜닝만으로 추출 속도가 6.5배 빨라짐을 확인함.

  • 출처·기준일을 분리하고 LIVE로 재검증하는 절제가 시스템 신뢰의 핵심임을 배움.

  • 3층(위키→그래프→에이전트)으로 나누면 각 층을 독립적으로 키우고 검증할 수 있음을 깨달음.

과정 중에 어떤 시행착오를 겪었나요?

  • 종목 단위 리포트의 한계를 깨닫고 "관점" 단위로 전환하는 과정에서, 계좌·ETF·뉴스·매크로를 그래프로 묶어야 진짜 진단이 됨을 GraphRAG로 돌파함.

  • 인과 그래프가 종목 그래프와 다리 3개뿐인 외딴 섬이었던 문제를, 브리지 엣지로 222개까지 이어 전파 경로를 복원함.

  • 시뮬레이션(픽션) 데이터와 실세계 데이터의 시계열 괴리로 매크로 인과 분석이 깨지는 한계를, 이력이 긴 ETF 패널로 대체하고 그 한계를 정직하게 명시함.

  • 통계 모델이 노이즈에서 엉뚱한 시차를 골라 결과가 깨지는 문제를 고정 시차로 교정했으며, 도구의 "성공" 메시지를 믿지 않고 LIVE로 재검증하는 습관을 들임.

  • 데이터의 출처와 기준일을 항상 분리 표기(예: 비중=운용사 공식, 기준가=시스템 종가)하여 추정·픽션을 사실로 단정하지 않도록 함.

도움이 필요한 부분이 있나요?

앞으로의 계획이 있다면 들려주세요.

  • 맨 위층 에이전트 자동화(LangGraph)를 본격 가동하여, 여러 에이전트가 그래프 위에서 자율로 일하는 단계로 확장할 계획임.

  • 그래프래그 3계층(GNN 링크 예측으로 빠진 관계 추론·그래프 신호 재랭킹·전용 그래프DB·실전 백테스트 검증)을 추진할 계획임.

  • 내 계좌 기준 정량 분석 풀스택(RS/MDD/Granger/CANSLIM/백테스트)을 자동 매핑할 계획임.

도움 받은 글 (옵션)

참고한 지피터스 글이나 외부 사례를 알려주세요.

(내용 입력)

5
3개의 답글

뉴스레터 무료 구독