소개
영어 어학 교재에서 mp3 음성에서 삭제되는 16k 이상 원음을 살리기 위해 azuretts 유료 서비스를 사용하고, 영어를 잘 들리게 하기 위해 자음 부분을 강화하고, 뇌를 활성화하는 고주파 음을 추가하는 후처리를 하였으며, 이런 부분을 홍보하기 위해 피시 버젼 그래프로 주파수를 보여주는 시각화 프로그램을 만듬
진행 방법
어떤 도구를 사용했고, 어떻게 활용하셨나요?
클로드 코드
토마티스 이론 적용 : Gemini+Claude Code
Tip: 사용한 프롬프트 전문을 꼭 포함하고, 내용을 짧게 소개해 주세요.
1.1 자음 레이어 추가 (8-12kHz) ✅
- ✅ 7단계 파이프라인 완성: Bass → Consonant → Brain → Clarity
1.2 코어 파라미터 추가 (Trade Secret) ✅
- ✅ threshold: (초민감 반응 센서 & Dynamic Gating 임계값)
- ✅ attack: (광속 셔터)
- ✅ qFactor: (실크 서스펜션)
1.3 백색잡음 믹싱 ✅
- ✅ Brain-HZ 레이어 생성 시 백색잡음 혼합 로직 구현
- ✅ 백색잡음 주파수 범위 14-19kHz로 조정
- 현재: 14-19kHz (Nyquist 22.05kHz 이하)
1.4 Butterworth 필터 ✅
Tip: 활용 이미지나 캡처 화면을 꼭 남겨주세요.
결과와 배운 점
배운 점과 나만의 꿀팁을 알려주세요.
배운점 : MS의 TTS가 유료 무료 서비스의 차이점을 알게 됨
무료 edgeTTS : 12k까지 mp3 포맷 지원
유료 azureTTS : 24k까지 wav 포맷 지원 :
도움 받은 글 (옵션)
참고한 지피터스 글이나 외부 사례를 알려주세요.
(내용 입력)