Spark
Spark
🏆 AI 챔피언
🏡 내집마련 찐친

초보 린디러's Lindy AI 도전기

EPISODE #1

🤔 Lindy.ai + Claude Skills 조합, 실제로 가능할까?

배경

요즘 Lindy.ai라는 AI 에이전트 워크플로우 툴을 사용하려고 준비 중입니다.

문득 이런 생각이 들었어요:

"Claude Skills를 만들어서 Lindy에 연동하면, Lindy가 더 똑똑하게 작동하지 않을까?"

MCP(Model Context Protocol)처럼 Claude Skills도 범용적으로 사용 가능한 표준이라면, 다른 AI 서비스에서도 활용할 수 있지 않을까 하는 기대였습니다.

🔍 현재까지 파악한 내용

MCP (확실함)

  • ✅ Anthropic이 공개한 오픈 표준 프로토콜

  • ✅ 다양한 LLM/AI 서비스에서 범용 사용 가능

  • ✅ 명확한 상호운용성 표준

Claude Skills (불확실함)

  • Claude.ai 내부 기능으로 보임

  • ❓ 외부 서비스(Lindy.ai 등)에서 직접 연동 가능한지 미확인

  • ❓ API를 통한 전달 가능 여부 불명확

🤷 혼란스러운 지점

제가 어디선가 "Claude Skills도 MCP처럼 타 LLM 서비스와 연동 가능하다"는 정보를 본 것 같은데, 정확한 출처를 찾지 못했습니다.

혹시:

  1. Claude Skills가 실제로 범용 표준인가요?

  2. Lindy.ai가 Claude Skills 포맷을 지원하나요?

  3. 아니면 Skills 내용을 수동으로 복사해서 Lindy instruction으로 변환해야 하나요?

💡 현실적인 대안 (Skills 연동이 안 된다면)

Lindy.ai에서 최상의 성능을 끌어내려면:

  1. Lindy 자체의 프롬프트/지침 최적화

    • Custom instructions 기능 활용

    • 도메인 특화 컨텍스트 작성

  2. 구조화된 프롬프트 템플릿 준비

    • 특정 업무(예: BIM 데이터 처리)에 특화된 템플릿

    • 워크플로우별 세부 지침

  3. Knowledge Base 활용

    • Lindy의 문서 업로드 기능

    • 반복 사용되는 컨텍스트를 KB로 관리

🙋 커뮤니티에 질문드립니다

혹시 GPTers 분들 중에:

  • Lindy.ai에서 Claude Skills를 사용해보신 분?

  • Skills의 범용성에 대해 정확히 아시는 분?

  • 비슷한 고민을 해결하신 분?

경험 공유해주시면 정말 감사하겠습니다! 🙏


Tags: #Lindy #ClaudeSkills #MCP #AIWorkflow #에이전트 #자동화

EPISODE #2

Lindy AI로 Android 앱 개발 자동화 시도 - 그리고 깨달은 한계점

🎯 프로젝트 개요

요즘 "안드로이드 앱 개발" 스터디를 진행하면서, 제가 평소 업무에서 많이 사용하는 Lindy AI를 앱 개발 워크플로우에 연계할 수 있을지 고민하게 되었습니다.

📱 만들고 싶었던 앱: AwesomeBizCard

제가 기획한 앱은 명함 관리 앱입니다. 기존 리멤버 앱의 아쉬운 점을 보완하려고 했어요.

기존 앱(리멤버)의 문제점

  • 명함을 스캔해서 전화번호부에 저장은 해주지만...

  • 나중에 그 사람을 검색하면 "어디서 만났더라?" 기억이 안 남 😅

  • 회의 사진은 있는데 얼굴-연락처 매칭이 안 됨

  • 관계 네트워크 시각화 기능 없음

AwesomeBizCard 핵심 기능 (Phase 1)

  1. 명함 OCR - ML Kit으로 텍스트 자동 추출

  2. Google Calendar 연동 - 저장 시점의 회의 정보 자동 매칭

  3. 위치 태깅 - GPS로 만난 장소 자동 기록

  4. 얼굴 인식 - 회의 사진에서 인물 크롭 & 연락처 연결

Phase 2 (고급 기능)

  • Obsidian 스타일 관계 네트워크 그래프

  • LinkedIn 연동 (학력, 경력, 상호 연결)

  • 학교/회사 기반 자동 클러스터링

  • "이 사람을 통해 만난 분들" 추적

💡 Lindy AI 활용 시도

저는 린디를 이용해 앱 개발에도 활용할 수 있을 거라 생각했습니다.

처음 계획했던 Lindy 활용 방안

📌 구상했던 워크플로우:

1. Lindy가 Google Calendar API 모니터링
   → 회의 종료 시 자동 트리거

2. 명함 스캔 시 Lindy가:
   - OCR 데이터 받기
   - 회의 정보와 자동 매칭
   - GPS 위치 정보 추가
   - 전화번호부 저장 API 호출

3. 회의 사진 업로드 시:
   - 얼굴 인식 API 호출
   - 연락처 DB와 매칭
   - 프로필 사진 업데이트

4. LinkedIn 프로필 자동 크롤링
   - 학력/경력 정보 추출
   - 로컬 DB 동기화

이렇게 구현된 Agent를 복사해서 JSON 형식으로 PRD에 넣어서 개발을 진행하면 효과적이지 않을까 라는 막연한 시도였지요~ (결국 실패)

Lindy가 도움될 수 있는 부분 (매우 제한적)

✓ PRD 작성 자동화
  - 기획 문서 템플릿 생성
  - 경쟁 앱 리서치 요약

✓ API 연동 테스트
  - LinkedIn API 응답 테스트
  - Google Calendar API 쿼리 시뮬레이션

✓ 데이터 백업 워크플로우
  - 주기적으로 CSV 내보내기
  - Google Drive 자동 업로드

✓ 회의록-명함 매칭 규칙 설계
  - 로직 프로토타이핑
  - 엣지 케이스 테스트

📚 배운 점

1. 도구의 설계 목적 이해하기

Lindy는 이런 작업에 최적화:
- 웹 기반 SaaS 간 연동
- 이메일, 슬랙, 구글 워크스페이스 자동화
- 정해진 일정으로 반복 작업 수행

Lindy가 부적합한 작업:
- 네이티브 앱 개발
- 하드웨어 권한이 필요한 작업
- 실시간 응답이 중요한 작업
- 오프라인 환경

EPISODE #3

🤖 Lindy AI로 만드는 멀티모달 문서 분석 & 보고서 자동 생성 에이전트 (한글 특화)

📌 프로젝트 개요

만든 것: 다양한 형식의 파일(PDF, Word, Excel, 이미지, 동영상, CAD 도면, 3D 모델 등)을 업로드하면 자동으로 분석하고, 한글 보고서를 생성해주는 AI 에이전트

사용 도구: Lindy AI

특징:

  • 단순 RAG를 넘어선 에이전트 워크플로우

  • 멀티모달 데이터 처리

  • 100% 한글 출력 보장

  • 문서 자동 생성 (보고서, 양식, 분석 리포트)

활용 분야: 건설/건축, 연구/개발, 프로젝트 관리, 기업 문서 관리


💭 개발 접근 방식: PRD 기반 개발의 함정

원래 계획: "제대로 된 PRD를 만들자"

개발자들이 늘 하는 말이 있죠.

"기획을 잘 하면 개발은 쉽다"

저도 그 말을 믿었습니다. AI 에이전트를 만들기 전에 완벽한 PRD(Product Requirements Document)를 작성하기로 했습니다.

PRD 작성 과정:

  1. Claude에게 요구사항 설명

"다양한 데이터 소스(문서, 이미지, 동영상, PPT, PDF, 도면, 3차원 모델 등)를 
서버에 업로드하고, 이 데이터 기반의 답변을 해주고, 원하면 양식을 만들어 
준다거나, 보고서를 생성해주는 AI Agent를 만들려고 해. 다양한 도구들을 
활용해서 최적의 결과(답변 또는 문서 생성 등)를 도출해야 해."
  1. Claude가 생성한 상세 PRD

Claude는 정말 훌륭한 문서를 만들어줬습니다:

# Lindy AI Agent Configuration Prompt

## Agent Name
Multi-Source Intelligence Document Agent (MIDA)

## Core Purpose
Upload and analyze diverse data sources (documents, images, videos, 
PPT, PDF, drawings, 3D models) to provide intelligent answers and 
automatically generate tailored outputs (reports, forms, documents) 
based on user needs.

**CRITICAL: All responses and generated documents MUST be in Korean (한글).**

## Key Capabilities

### 1. Data Ingestion & Understanding
- Accept multiple file formats: PDF, DOCX, PPTX, XLSX, images (PNG, JPG), 
  videos (MP4), CAD drawings (DWG, DXF), 3D models (IFC, OBJ, FBX)
- Extract and index content from all uploaded files
- Maintain context across different data types
- Store and retrieve information efficiently

### 2. Intelligent Analysis & Response
- Analyze user questions in context of uploaded materials
- Cross-reference information across multiple documents
- Provide accurate, source-cited answers
- Identify relevant sections and data points automatically

### 3. Document Generation & Automation
- Generate custom reports based on analyzed data
- Create forms and templates from user requirements
- Produce formatted documents (Word, PDF, Excel)
- Synthesize information from multiple sources into cohesive outputs

## Workflow Instructions

**Step 1: Data Collection**
When user uploads files:
- Confirm receipt and list all uploaded files
- Identify file types and extract key metadata
- Index content for retrieval

**Step 2: Query Processing**
When user asks questions:
- Search across all uploaded documents
- Find relevant information from appropriate sources
- Cite specific documents and page/section numbers
- Provide comprehensive answers with context

**Step 3: Output Generation**
When user requests document creation:
- Clarify output format requirements (report type, template, structure)
- Extract relevant data from source materials
- Generate well-structured document with proper formatting
- Include citations and references to source files

## Tool Integration Requirements

Connect and utilize these tools:
- **File Storage**: Google Drive, Dropbox, or OneDrive for file management
- **Document Creation**: Google Docs, Microsoft Word API for report generation
- **Data Processing**: Python/code execution for complex data analysis
- **OCR/Vision**: For extracting text from images and drawings
- **Spreadsheet**: Google Sheets or Excel for data tables and forms

## Response Guidelines

1. **Always cite sources**: Reference specific documents when answering
2. **Ask clarifying questions**: If user request is ambiguous, ask before proceeding
3. **Confirm before generating**: Before creating documents, confirm format, structure, and content scope
4. **Provide options**: Offer multiple output formats when applicable
5. **Maintain context**: Remember previous interactions within the conversation

## Language Requirements

**MANDATORY OUTPUT LANGUAGE: KOREAN (한글)**

- All answers must be provided in Korean
- All generated documents must be in Korean
- All explanations and clarifications must be in Korean
- Document titles, headings, and content must be in Korean
- Even if source documents are in English or other languages, outputs must be translated to Korean
- Technical terms should use appropriate Korean terminology with English terms in parentheses when necessary

[... 이하 생략, 총 3,000+ 단어의 상세한 문서]

무슨 일이 일어났나?

  • 프롬프트가 너무 길어서 Lindy가 처리 실패

  • 복잡한 구조와 마크다운 포맷이 파싱 오류 유발

  • ObjectId 생성 자체가 안 됨 → 에이전트 생성 실패

💡 깨달음: "완벽한 PRD ≠ 작동하는 제품"

PRD 기반 개발의 역설:

완벽한 기획서를 만들면 개발이 쉬울 것이라고 예상했지만, 실제로는 복잡도가 높아져서 구현 자체가 불가능해졌습니다.

이건 마치:

  • 📚 3,000페이지 요구사항 명세서를 쓰고

  • 🤷‍♂️ "왜 아무도 이걸 구현 못 해?" 라고 하는 것과 같습니다

문제의 본질:

  • ❌ Lindy는 한 번에 긴 프롬프트를 받아서 파싱하는 구조

  • ❌ 너무 상세한 지시사항은 오히려 AI를 혼란스럽게 만듦

  • ❌ 플랫폼 제약사항(토큰 제한, 파싱 규칙)을 고려하지 않음


🔄 해결 과정: 점진적 개발 전략

시도 1: 프롬프트 압축 → 실패

접근: "긴 프롬프트를 줄이면 되겠지?"

최소한의 지시사항만 포함:

  • "You are MIDA. Analyze files and create Korean reports."

결과:

  • ✅ 에이전트는 생성됨

  • ❌ 너무 단순해서 제대로 작동 안 함

  • ❌ 한글 출력도 불안정

시도 2: 섹션별 분할 → 부분 성공

접근: "핵심 기능만 먼저 넣고, 나중에 추가하자"

Phase 1 프롬프트의 핵심:

  • 에이전트 이름과 역할 명시

  • 한글 출력 필수 조건 강조

  • 3가지 핵심 기능만 나열 (분석, 답변, 보고서 생성)

결과:

  • ✅ 에이전트 생성 성공!

  • ✅ 기본 동작 확인

  • ⚠️ 하지만 기능은 제한적

시도 3: 점진적 확장 → 성공! ✨

핵심 전략: "Build → Test → Expand"

개발 프로세스를 4단계로 나눔:

  1. Step 1: 최소 기능 프롬프트 (50-100 단어)

  2. [테스트: 작동하는가?]

  3. Step 2: 기능 추가 (200-300 단어)

  4. [테스트: 여전히 작동하는가?]

  5. Step 3: 워크플로우 분리 (여러 AI 블록)

  6. [테스트: 통합 작동하는가?]

  7. Step 4: 세부 기능 최적화

왜 이게 먹혔나?

1. 플랫폼 제약 이해

  • Lindy는 에이전트 생성 시 프롬프트 길이 제한 있음

  • 한 번에 모든 걸 넣으면 파싱 실패

  • 점진적으로 추가하면 안정적

2. 워크플로우 분리의 힘

기존 계획은 하나의 거대한 AI가 모든 것을 처리하는 구조였습니다.

새로운 방식은:

  • 문서 분석 AI (전문화)

  • 보고서 생성 AI (전문화)

  • 각각 최적화된 짧은 프롬프트

  1. 테스트 주도 개발

    • 각 단계마다 실제로 작동하는지 확인

    • 문제 발생 시 즉시 롤백하고 수정

    • "완벽한 계획" 보다 "작동하는 제품"


🎯 최종 해결책: 3단계 프롬프트 전략

Level 1: 에이전트 생성 (최소 프롬프트)

목적: 일단 에이전트를 만들자

markdown

You are MIDA (Multi-source Intelligence Document Agent).

CRITICAL: All responses MUST be in Korean (한글).

Capabilities:
- Accept files: PDF, DOCX, PPTX, images, videos
- Answer questions about uploaded content
- Generate reports and documents in Korean
- Cite sources with specific references

Workflow:
1. When files uploaded: Confirm receipt in Korean
2. When questions asked: Search and answer in Korean
3. When documents requested: Ask format, then generate in Korean

Quality checks:
- All text in Korean
- Professional language
- Cite sources clearly

길이: ~150 단어 결과: ✅ 에이전트 생성 성공

Level 2: 워크플로우 분리 (역할별 AI)

문서 분석 AI 프롬프트 (300 단어):

You are a Document Analysis Specialist AI.

**CRITICAL: All responses MUST be in Korean (한글).**

Your responsibilities:
1. Analyze all uploaded files comprehensively
2. Extract key information and data points
3. Identify document structure and content
4. Provide detailed summaries in Korean

**File types you can process:**
- Documents: PDF, DOCX, PPTX, XLSX
- Images: JPG, PNG (with OCR)
- Videos: MP4, MOV (metadata extraction)
- CAD/3D: DWG, DXF, IFC, OBJ (metadata)

**When you receive files:**

Step 1 - Confirm receipt in Korean:
"📄 파일 수신 완료: [filename]"

Step 2 - Analyze and report:
📊 **분석 결과**

**파일 정보:**
- 파일명: [name]
- 형식: [type]
- 크기: [size]
- 페이지/항목 수: [count]

**주요 내용:**
[한글로 요약된 핵심 내용]

**추출된 데이터:**
- [key point 1]
- [key point 2]

**다음 단계:**
이 내용으로 무엇을 도와드릴까요?

**Response guidelines:**
- Always use natural, professional Korean
- Be concise but comprehensive
- Use bullet points for clarity

**Quality checks before responding:**
✓ All text is in Korean
✓ Technical terms are properly translated
✓ Information is accurate and sourced

보고서 생성 AI 프롬프트 (250 단어):

markdown

You are a Professional Report Writer.

**CRITICAL: All outputs MUST be in Korean (한글).**

Your role:
1. Create professional reports based on analyzed documents
2. Generate documents in requested format (PDF, Word, Excel, PPT)
3. Ensure all content is in Korean with proper formatting

Before generating reports:
1. Ask: "어떤 형식의 보고서를 원하시나요?"
   - PDF 보고서
   - Word 문서
   - Excel 스프레드시트
   - PowerPoint 프레젠테이션

2. Ask: "보고서에 포함할 내용을 선택해주세요"
   - 전체 요약
   - 상세 분석
   - 데이터 시각화
   - 참조 자료

3. Confirm: "다음 내용으로 [형식] 보고서를 생성하시겠습니까?"

Report structure (in Korean):
1. 제목 및 개요
2. 주요 내용
3. 상세 분석
4. 결론 및 제언
5. 참조 자료

Quality checks:
✓ All text in Korean
✓ Professional formatting
✓ Clear structure
✓ Source citations
```

### Level 3: Skills 및 최적화

**연결한 도구:**
- Code Interpreter (데이터 분석)
- Web Search (추가 정보)
- Google Drive (파일 저장)
- Google Docs (문서 생성)

**설정 최적화:**
- Model: GPT-4o November 2024
- Ask for Confirmation: Sometimes
- Exit Conditions: 분석 완료 시

---

## 📊 PRD 기반 vs 점진적 개발 비교

| 항목 | PRD 기반 접근 | 점진적 개발 접근 |
|------|---------------|------------------|
| **프롬프트 길이** | 3,000+ 단어 | 150 → 300 → 500 단어 |
| **개발 시간** | 2시간 (실패) | 30분 (성공) |
| **에이전트 생성** | ❌ 실패 | ✅ 성공 |
| **테스트 주기** | 한 번에 전체 | 각 단계마다 |
| **문제 발견** | 어려움 | 즉시 |
| **수정 용이성** | 어려움 | 쉬움 |
| **최종 품질** | - | ✅ 안정적 |

---

## 💡 핵심 교훈

### 1. "완벽한 계획"의 함정

> "완벽한 PRD를 만들면 개발이 쉬울 것이다" ❌

실제로는:
- 복잡한 계획 → 구현 불가능
- 긴 프롬프트 → 파싱 오류
- 상세한 요구사항 → 플랫폼 제약 위반

### 2. "작동하는 최소 제품" 우선

> "일단 만들고, 점진적으로 개선하자" ✅

실제 효과:
- 최소 기능 → 빠른 피드백
- 단계별 확장 → 안정적 개발
- 지속적 테스트 → 높은 품질

### 3. 플랫폼 특성 이해의 중요성

**Lindy AI의 제약:**
- 에이전트 생성 시 프롬프트 길이 제한
- 복잡한 마크다운 파싱 불안정
- 워크플로우 분리가 더 효율적

**해결책:**
- 짧고 명확한 프롬프트
- 역할별 AI 분리
- 점진적 기능 추가

### 4. AI 에이전트 개발의 새로운 패러다임
```
전통적 소프트웨어:
기획 (PRD) → 설계 → 개발 → 테스트 → 배포

AI 에이전트:
최소 프롬프트 → 생성 → 테스트 → 확장 → 테스트 → 최적화
     ↑                                        ↓
     └────────────── 반복 ──────────────────┘

🎯 왜 만들었나?

기존 문제점:

  • ❌ ChatGPT에 파일 올리면 대화만 가능 → 보고서 자동 생성 불가

  • ❌ RAG 시스템은 질문-답변만 → 문서 생성 기능 없음

  • ❌ 영어 중심 응답 → 한글 보고서 필요

  • ❌ 여러 파일 형식 → 통합 분석 어려움

  • 완벽한 PRD → 구현 실패 (새로 발견!)

해결 목표:

  • ✅ 다양한 파일 한 번에 업로드

  • ✅ AI가 자동 분석 + 보고서 생성

  • ✅ 모든 출력물 한글로

  • ✅ 워크플로우 자동화

  • 점진적 개발로 안정적 구현 (새로운 접근!)

프로젝트 프로세스를 보여주는 흐름도

1단계 초안 만들기 완성~!

저의 부족하지만 경험을 공유하고 싶어 사례글을 작성해 봤습니다.

앞의 세가지 실패담을 참고하여 꼭 좋은 에이전트 만드시길 응원하겠습니다 ^-^

3
1개의 답글

뉴스레터 무료 구독

👉 이 게시글도 읽어보세요