텍스트 음성 변환(TTS) API 가이드

개요

오디오 API는 TTS 모델을 기반으로 다음 기능을 구현하기 위해 '음성' 엔드포인트를 제공합니다.

📝 블로그 기사 소리내어 읽기

🌍 다국어 오디오 생성

🎵 실시간 오디오 스트리밍 출력

중요: 사용자에게 듣고 있는 내용은 사람의 목소리가 아니라 AI에서 생성된 음성임을 명시해야 합니다.

기본 사용법

기본 예

``파이썬
pathlib import 경로에서
openai 가져오기 OpenAI에서

클라이언트 = OpenAI(
base_url="https://yossapi.com/v1",
api_key=키
)

speech_file_path = 경로(file).parent / "speech.mp3"
응답 = client.audio.speech.create(
모델="tts-1",
음성="합금",
input="오늘은 사람들이 좋아하는 것을 만들 수 있는 멋진 날입니다!"
)

response.stream_to_file(speech_file_path)




## 기능

### 오디오 품질 옵션
- **tts-1**: 낮은 대기 시간, 실시간 애플리케이션에 적합
- **tts-1-hd**: 품질이 높으며 정적 콘텐츠가 적을 수 있습니다.

### 사용 가능한 사운드
-합금
-에코
-우화
-노바
-쉬머
- 오닉스

### 지원되는 출력 형식
| 형식 | 특징 | 적용 가능한 시나리오 |
|------|------|----------|
| MP3 | 기본 형식 | 일반적인 장면 |
| 오퍼스 | 낮은 대기 시간 | 웹 스트리밍 및 커뮤니케이션 |
| AAC | 효율적인 압축 | 모바일 장치 재생 |
| FLAC | 무손실 압축 | 오디오 보관 |
| 웨이브 | 압축 없음 | 대기 시간이 짧은 애플리케이션 |
| PCM | 원시 샘플 | 24kHz, 16비트 부호 있음 |

### 라이브 오디오 스트리밍
``파이썬
openai 가져오기 OpenAI에서

클라이언트 = OpenAI(
    base_url="https://yossapi.com/v1",
    api_key=키
)

응답 = client.audio.speech.create(
    모델="tts-1",
    음성="합금",
    input="안녕하세요! 스트리밍 테스트입니다.",
)

response.stream_to_file("output.mp3")

지원되는 언어

다음을 포함한 여러 언어를 지원합니다.

아시아 언어: 중국어, 일본어, 한국어 등

유럽 언어: 영어, 프랑스어, 독일어 등

기타 언어: 아랍어, 힌디어 등

참고: 현재 사운드는 주로 영어에 최적화되어 있습니다.

FAQ

Q: 생성된 오디오의 감정을 어떻게 제어하나요?

A: 현재 직접 제어 메커니즘은 없습니다. 대문자 사용이나 구문이 출력에 영향을 미칠 수 있지만 그 효과는 불확실합니다.

Q: 맞춤형 사운드를 만들 수 있나요?

A: 사용자 정의 사운드 생성은 지원되지 않습니다.

Q: 생성된 오디오의 소유권은 무엇인가요?

A: 창작자의 소유이지만 AI가 생성한 오디오라는 점을 사용자에게 알려야 합니다.

Python은 텍스트를 음성으로 변환합니다.

텍스트 음성 변환(TTS) API 가이드#

개요#

기본 사용법#

기본 예#

지원되는 언어#

FAQ#

Q: 생성된 오디오의 감정을 어떻게 제어하나요?#

Q: 맞춤형 사운드를 만들 수 있나요?#

Q: 생성된 오디오의 소유권은 무엇인가요?#