Obsidian에 입문한 건축가, '건축사사무소 소개' 를 위한 슬라이드 제작과정을 Elevenlabs 음성으로 발표

소개

시도하고자 했던 것과 그 이유를 알려주세요.

지난 사례에서 만든 슬라이드의 제작과정을 ElevenLabs 음성으로 발표하는 사례를 준비했습니다.

두서없이 설명하는 사례보다

정리된 음성으로 설명하는 사례가 더 공감할 수 있고, 흥미로울 것이라고 생각했기 때문입니다.

.

.

진행 방법

1.사용도구

Claude Sonnet4, Opus4

Genspark : AI 슬라이드

ElevenLabs : YohanKoo 'Professional Voice Clone'

.

.

.

2.ElevenLabs 가입 및 Claude 연동

2.1 [GitHub - elevenlabs/elevenlabs-mcp: The official ElevenLabs MCP server](https://github.com/elevenlabs/elevenlabs-mcp?tab=readme-ov-file) 사이트 접속

.

2.2 "Quickstart with Claude Desktop "에 따라 순서대로 진행

2.2.1 Get your API key from [ElevenLabs](https://elevenlabs.io/app/settings/api-keys). There is a free tier with 10k credits per month.

-> 회원가입후 API Key 발급

iPad 설정 페이지의 스크린 샷

.

2.2.2 Install uv (Python package manager), install with curl -LsSf https://astral.sh/uv/install.sh | sh or see the uv [repo](https://github.com/astral-sh/uv) for additional install methods.

-> 기존 Obsidian 연결할 때 UV 설치되었던 것 같아서 넘어감.

2.2.3 Go to Claude > Settings > Developer > Edit Config > claude_desktop_config.json to include the following:

{
  "mcpServers": {
    "ElevenLabs": {
      "command": "uvx",
      "args": ["elevenlabs-mcp"],
      "env": {
        "ELEVENLABS_API_KEY": "<insert-your-api-key-here>"
      }
    }
  }
}

-> Claude Desktop 개발자/설정에서 Claude_desktop_config.json 파일 편집

- "Ctrl+,"(파일-설정) 단축키 누른 후 개발자 / 설정에 접속하여 Claude_desktop_config.json 파일 편집하여 위 코드를 추가하고, API KEY만 변경함.

저는 위 2.2.1~2.2.3까지 진행하고, 클로드 햄버거아이콘/파일/종료 후 재시작했더니 ElevenLabs가 연동되었습니다.

.

.

.

3.ElevenLabs 회원가입 후 Text to Speech를 통해 텍스트를 입력하고, ai 음성 생성.

3.1 Voices 선택 : 한국어로 ai음성을 생성하고자 했기 때문에 Language : Korean으로 설정하고, 여러 음성샘플을 들어본 후 슬라이드를 설명하기에 가장 적합한 음성을 선택

YohanKoo 'Professional Voice Clone'를 선택함.

Google Analytics 대시 보드의 스크린 샷

.

3.2 Text to Speech 탭으로 이동. speaker을 'YohanKoo'로 선택하고, 텍스트를 입력한 후 우측하단의 'Generate speech'를 클릭하면 다운받을 수 있는 2가지 음성을 제안받을수 있습니다.

항목 목록을 보여주는 화면의 스크린 샷

마이크가있는 페이지의 스크린 샷

.

3.3 Enhance (alpha) 버튼을 클릭하면 '기침', '한숨', '숨고르기' 등 전달력을 높일 수 있는 표현이 자동으로 추가됩니다.

마이크가있는 페이지의 스크린 샷

.

.

.

4.Intro page설명 html 파일과 음성 mp3파일을 함께 연동할 수 있는 TOOL 찾기

- Claude : 아티팩트와 mp3파일을 함께 재생되지 않음

- Genspark : html이 제대로 구동되지 않고, mp3파일도 함께 재생되지 않음.

- MS Office : 제대로 재생되지 않음.

- Keynote : 음성이 먼저 재생되고, 링크를 통해 html구현하는 것 가능함.

.

.

.

5.각 페이지별 최근 발표했던 2개의 html파일과 1개의 젠스파크링크를 삽입하고, 생성된 음성과 어울리는 지 검토.

단, ElevenLabs 음성생성 credits 소모로 인해 간단한 테스트 후 발표자료 생성.

첫 결과물

https://claude.ai/public/artifacts/b3f80e90-8bb3-4b9b-b032-8391db452575

두번째 결과물

https://claude.ai/public/artifacts/c0b89340-b8eb-4aca-8a2e-b88d111c0f2b

젠스파크 링크

https://www.genspark.ai/agents?id=f5fce5ac-f62a-4cc5-9270-41b4b2943a7a

(위) 3개의 파일에 대한 설명을 ElevenLabs에서 생성한 음성으로 설명하는 사례를 발표할 예정입니다.

검은 배경에 파란색 원의 이미지
중간에 원이있는 검은 색 화면
작은 물체가있는 검은 색 화면의 스크린 샷

.

.

.

결과와 배운 점

매주 새로운 프로그램에 회원가입을 하고, 사용하게 됩니다.

첫째 주에 Obsidian 가입하고 사용.

둘째주에 Genspark 회원가입 후 사용.

이번 주는 ElevenLabs 회원가입 후 사용.

잠깐 사용하고 돌아보지 않는 프로그램도 있고, 계속 사용하게 되는 프로그램도 있습니다.

다양한 프로그램을 경험해보면서 많은 배움과 깨달음을 얻게 되는 것 같습니다.

도움 받은 글 (옵션)

사례발표 및 베스트사례 발표시 스터디장님들의 피드백

1
3개의 답글

뉴스레터 무료 구독