1. Python 구성 방법
YossAPI.com Docs
YossAPI - 한국어
  • YossAPI - 中文版
  • YossAPI - English
  • YossAPI - Русский
  • YossAPI - 한국어
  • YossAPI - 日本語
  • YossAPI - Español
  • YossAPI - Deutsch
  • 소개
  • 온라인 디버깅 지침
  • 요청하기
  • 환승역 기본 소개
    • API 빠른 시작 가이드
    • 고객 서비스에 문의하세요
    • 그룹 세부 테이블
    • 그룹화 및 가격 차이의 특수성
    • 지정된 그룹에 대한 새 토큰을 만드는 방법
    • 에이전트 인터페이스 호출 주소
    • API 키 할당량 조회 서비스
    • 무료 AI 채팅 프로젝트 탐색
  • 채팅
    • ChatGpt 인터페이스
      • ChatGPT 오디오(오디오)
        • GPT-4o-audio
        • 오디오에서 텍스트 속삭임-1
        • 오디오를 텍스트로 변환 gpt-4o-transcribe
        • 음성 gpt-4o-mini-tts 만들기
        • 번역 만들기(지원되지 않음)
      • ChatGPT 채팅(채팅)
        • 채팅 완료 객체
        • 채팅 완료 차단 객체
        • 채팅 완료 생성(스트리밍)
        • 채팅 완료 만들기(스트리밍 아님)
        • 채팅 이미지 인식 생성(스트리밍)
        • 채팅사진인식(스트리밍) 만들기 best64
        • 채팅 이미지 인식 생성(비스트리밍)
        • 채팅 생성 그래프 생성(비스트리밍)
        • 공식 함수 호출 호출
        • 공식 N 테스트
        • 모델 나열
        • 채팅 기능 호출 생성
        • 구조화된 출력 생성
        • 추론 모델 노력 제어
        • 채팅 완료 qwen-mt-turbo 생성
        • 채팅 완료 deepseek v3.1 사고 수준 생성(스트리밍)
        • deepseek-ocr 인식
      • ChatGPT 자동 완성(완료)
        • 완성 객체
        • 생성 완료
      • ChatGPT 임베딩
        • 내장된 객체
        • 삽입 만들기
      • 웹 검색
        • 웹 검색
    • Anthropic Claude 인터페이스
      • 채팅 완료 객체
      • 채팅 완료 차단 객체
      • 기본 형식
        • 채팅 완료 생성(스트리밍)
        • 함수 호출 생성(스트리밍)
        • 형식화된 출력 생성
        • 생각 채팅 만들기
        • PDF 지원
        • PDF는 base64 형식을 지원합니다.
      • 채팅 호환 형식
        • 생각 채팅 만들기
        • 채팅 완료 생성(스트리밍)
        • 채팅 완료 만들기(스트리밍 아님)
        • 채팅 이미지 인식 생성(스트리밍)
        • 채팅 이미지 인식 생성(비스트리밍)
    • Google Gemini 인터페이스
      • 기본 형식
        • 텍스트 생성
        • 텍스트 생성 스트림
        • 텍스트 생성 + 사고 흐름
        • 이미지 생성
        • 이미지 생성 gemini-2.5-flash-image
        • 이미지 생성 gemini-2.5-flash-image는 종횡비를 제어합니다.
        • 이미지 생성 gemini-3-pro-image-preview는 종횡비 + 선명도를 제어합니다.
        • 사진 편집
        • 그림 이해
        • 포맷된 출력
        • 함수 호출
        • 문서 이해
        • URL 컨텍스트 [기본 형식]
        • 코드 실행
        • google search
        • 비디오 이해
        • URL context
        • 영상이해-URL [기본형식] 개발중
        • Imagen 4 개발 중
        • 오디오 이해
        • Embeddings
        • gemini-tts 텍스트 음성 변환
        • 텍스트 생성 gemini-3-pro-preview:generateContent
      • 채팅 호환 형식
        • Gemini 사진 생성 인터페이스 [채팅 호환 형식]
        • 채팅 인터페이스 [채팅 호환 형식]
        • 채팅 인터페이스 - 사고 1 [채팅 호환 형식]
        • 채팅 인터페이스 - Thinking 2 [채팅 호환 형식]
        • 이미지 인식 인터페이스 [채팅 호환 형식]
        • 채팅 + 파일 읽기 인터페이스 [채팅 호환 형식]
  • 채팅(응답)
    • Responses API와 Chat API의 비교
    • 모델 응답 생성
    • 함수 호출 만들기
    • 모델 응답 생성(스트리밍 반환)
    • 모델 응답 생성(생각 길이 제어)
    • 웹 검색 만들기
    • gpt-5 지원 사고에 반응하는 모델 생성
    • 함수 호출 만들기 복사
  • 그림 모델
    • README
    • 이미지 객체
    • Midjourney
      • 사진 업로드
      • Imagine 작업 제출
      • 작업 ID를 기준으로 작업 상태 쿼리
      • ID 목록 기반 쿼리 작업
      • 작업 이미지의 시드 가져오기
      • 작업 실행
      • Blend 작업 제출
      • 제출 작업 설명
      • 모달 제출
    • Ideogram
      • 3.0 생성(빈센트 차트) 생성
      • 생성 3.0(그림 편집)편집
      • 3.0(사진 리믹스) 리믹스 생성
      • 3.0 생성(이미지 재구성) 리프레임
      • 3.0 생성(배경 교체) 배경 교체
      • 표의 문자
      • 리믹스
      • 고급형(HD 확대)
      • 설명하다
    • GPT 이미지 시리즈
      • gpt-이미지-1 생성
      • gpt-image-1 편집
      • 마스크 gpt-image-1
      • gpt-image-1.5 생성
      • gpt-image-1.5 편집
      • 마스크 gpt-image-1.5
    • 꿈의 그림
      • 그림 만들기
      • 사진 편집
    • DALL·E 3
      • DALL·E 3 생성
    • FLUX 시리즈
      • gpt 호환 형식
        • Flux 생성(OpenAI dall-e-3 형식)
        • Flux 편집(OpenAI dall-e-3 형식)
      • 공식 형식 복제
        • 자속 분해능
        • 튜토리얼 이용
        • 작업 생성 black-forest-labs/flux-kontext-dev
        • 쿼리 작업
    • 빈백 시리즈
      • doubao-seedream-3-0-t2i-250415
      • doubao-seededit-3-0-i2i-250628
      • doubao-seedream-4-0-250828-文生图
      • doubao-seedream-4-0-250828-图生图
      • doubao-seedream-4-0-250828-多图生图
      • doubao-seedream-4-5-251128 Vincent 그림(일반 텍스트 입력 단일 그림 출력)
      • doubao-seedream-4-5-251128 그림과 텍스트는 그림을 생성합니다(단일 그림 입력, 단일 그림 출력)
      • doubao-seedream-4-5-251128 다중 이미지 융합(다중 이미지 입력 ​​및 단일 이미지 출력)
      • doubao-seedream-4-5-251128 그룹 사진 출력(복수 사진 출력)
      • doubao-seedream-4-5-251128 단일 사진 단체 사진
      • doubao-seedream-4-5-251128 여러 참조 사진
    • Fal.ai 플랫폼
      • 상태 코드
      • 요청 결과 받기
      • /fal-ai/nano-banana Wen Sheng Tu
      • /fal-ai/nano-banana/edit 이미지 편집
    • Tencent AIGC 원시 사진
      • 상태 코드
      • 요청 결과 받기
      • 작업 만들기
    • Qwen 시리즈
      • qwen-image-max
      • z-image-turbo
      • qwen-image-edit-2509
  • 비디오 모델
    • Veo 비디오 세대
      • 비디오 통합 형식
        • 상태 코드
        • 비디오 만들기
        • 사진으로 비디오 만들기
        • 쿼리 작업
        • 동영상 만들기(참고 이미지)
      • OpenAI 비디오 형식
        • openai는 사진으로 비디오를 만듭니다.
        • openai 쿼리 작업
        • openai 다운로드 비디오
    • 루마 비디오 생성
      • 공식 API 형식
        • 상태 코드
        • 영상 생성 과제 제출
        • 확장된 비디오
      • 쿼리 작업
        • 단일 작업 쿼리
        • 작업을 일괄적으로 가져오기
    • 런웨이 영상 생성
      • 상태 코드
      • 영상 생성 과제 제출
      • 비디오 작업 쿼리(무료)
    • 꿈의 영상세대
      • 상태 코드
      • 비디오 통합 형식
        • 상태 코드
        • 비디오 만들기
        • 쿼리 작업
      • 공식 형식
        • 첨가
      • 영상 생성 과제 제출
      • 비디오 작업 쿼리(무료)
    • 소라 비디오 생성
      • 상태 코드
      • 영상 생성 과제 제출
      • 비디오 작업 상태 쿼리
      • 투셍 비디오
      • 첫 번째 및 마지막 프레임 비디오
    • 두바오(Doubao) 비디오 생성
      • 빈센트 영상 예시
      • Tusheng 비디오-첫 번째 프레임
      • Seedance-lite-첫 번째 및 마지막 프레임
      • Tusheng 비디오-base64 인코딩
      • Seedance-lite-참조 사진
      • 단일 작업 쿼리
      • 동영상 생성 작업 목록 쿼리-기본값
      • 비디오 생성 작업 목록 쿼리 - 여러 작업 ID 검색
      • Seedance-1-5-pro-첫 번째 및 마지막 프레임
    • 소라 비디오 세대
      • 통합된 비디오 형식
        • 쿼리 작업
        • 사진으로 비디오 만들기 sora-2
        • 비디오 sora-2 만들기
        • 비디오 sora-2-pro 만들기
        • 비디오 만들기(캐릭터 포함)
      • 채팅 형식
        • 비디오 만들기
        • 사진과 함께 비디오 만들기
        • 지속적으로 비디오를 수정하고 생성합니다.
      • OpenAI 공식 비디오 형식
        • openai는 사진으로 비디오를 만듭니다.
        • 스토리보드를 사용하여 비디오 만들기
        • openai는 비공개 모드에서 사진으로 비디오를 만듭니다.
        • openai가 동영상을 만듭니다(캐릭터 포함).
        • 동영상 편집 열기
        • openai 다운로드 비디오
        • openai 쿼리 작업
      • 역할 만들기
    • 그록 비디오 생성
      • 비디오 통합 형식
        • 상태 코드
        • 비디오 만들기
        • 쿼리 작업
    • Tongyi Wanxiang 비디오 생성
      • 비디오 생성
      • 비디오 쿼리
    • Tencent AIGC 비디오 생성
      • 상태 코드
      • 작업 만들기
      • 요청 결과 받기
  • GPT 관련
    • 소개
    • GPT 대화
  • 시스템 API
    • 토큰 목록 가져오기
    • 새 토큰 추가
    • 토큰 지원 모델 받기
    • 계정 정보 얻기
    • 토큰 수정
    • 검색 토큰
    • 토큰 삭제
  • 빈센트 뮤직 수노
    • 설명하다
    • 매개변수
    • 과제 제출
      • 노래 생성(영감 모드)
      • 노래 생성(사용자 정의 모드)
      • 노래 생성(연속 모드)
      • 노래 생성(가수 스타일)
      • 노래 생성(2차 창작을 위해 노래 업로드)
      • 노래 생성(노래 접합)
      • 가사 생성
      • 노래 접합
      • 보고서 업로드 완료
      • 쿼리 업로드 처리 상태
      • 오디오 파일 초기화
      • 업로드 승인 요청
      • s3 업로드 예시
    • 쿼리 인터페이스
      • 작업을 일괄적으로 가져오기
      • 단일 작업 쿼리
      • WAV 받기
  • Python 구성 방법
    • Python은 음성을 텍스트로 변환합니다.
    • Python은 텍스트를 음성으로 변환합니다.
    • Python은 임베딩 벡터화를 사용합니다.
    • Python이 DALL·E를 호출함
    • Python 간단한 호출 openai 함수 호출 데모
    • Python 간단한 langchain이 openai 데모를 호출합니다.
    • 파이썬 라마_인덱스 구성
    • 파이썬 기본 대화
    • Python은 gpt-4o를 사용하여 사진-로컬 사진을 식별합니다.
    • Python은 gpt-4o를 사용하여 이미지를 식별합니다.
    • Python은 Claude를 사용하여 이미지를 식별합니다.
    • Python 라이브러리 스트리밍 출력
    • GPT 실시간 모델 호출
    • Python 요청 요청 스트리밍 출력 데모
    • Python은 gpt-image-1을 사용하여 그림을 만들고 편집합니다.
    • Python openai 공식 라이브러리(AutoGPT, langchain 등 사용)
    • 파이썬 연속 대화
  • 모델 재지정
    • 재정렬
  • 클링 플랫폼
    • 콜백 프로토콜
    • 빈센트 비디오
      • 빈센트 비디오
      • 쿼리 작업(단일)
    • 투셍 비디오
      • 투셍 비디오
      • 쿼리 작업(단일)
    • Omni-Video
      • Omni-Video
      • 쿼리 작업(단일)
    • 다중 사진 참조 학생 비디오
      • 다중 사진 참조 학생 비디오
      • 쿼리 작업(단일)
    • 다중 모드 비디오 편집
      • 편집할 영상을 초기화하세요
      • 비디오 선택 추가
      • 선택한 동영상 삭제
      • 선택한 비디오 미리보기
      • 다중 모드 비디오
      • 쿼리 작업(단일)
    • 비디오 확장
      • 비디오 확장
      • 쿼리 작업(단일)
    • 비디오 효과
      • 비디오 효과
      • 쿼리 작업(단일)
    • 이미지 생성
      • 이미지 생성
      • 쿼리 작업(단일)
    • 여러 참조 사진
      • 여러 참조 사진
      • 쿼리 작업(단일)
    • Omni-Image
      • Omni-Image
      • 쿼리 작업(단일)
    • 이미지 펼치기
      • 이미지 펼치기
      • 쿼리 작업(단일)
    • 이미지 인식
      • 이미지 인식
    • 디지털 맨
      • 디지털 맨
      • 쿼리 작업(단일)
    • 빈센트 음향 효과
      • 빈센트 음향 효과
      • 쿼리 작업(단일)
    • 비디오 음향 효과
      • 비디오 음향 효과
      • 쿼리 작업(단일)
    • 음성 합성
      • 음성 합성
    • 가상으로 입어보세요
      • 가상으로 입어보세요
      • 쿼리 작업(단일)
    • 립싱크
      • 얼굴 인식
      • 립싱크
      • 쿼리 작업(단일)
    • 맞춤 사운드
      • 맞춤 사운드
      • 커스텀 음색 쿼리(싱글)
    • 모션 제어
      • 모션 제어
      • 쿼리 작업(단일)
    • 본체
      • 본체
  • 집계 플랫폼 복제
    • 튜토리얼 이용
    • 자속 분해능
    • 쿼리 작업
    • 작업 만들기 - 모델 버전 전달(예측)
    • 작업 안정성-AI/안정-확산 생성
    • 작업 안정성-ai/sdxl 생성
    • 작업 stable-ai/stable-diffusion-inpainting 만들기
    • 작업 Stable-ai/stable-diffusion-img2img 생성
    • lucataco/flux-schnell-lora 작업 생성
    • lucataco/flux-dev-lora 작업 생성
    • andreasjansson/stable-diffusion-animation 작업 만들기
    • sujaykhandekar/object-removal 작업 생성
    • 작업 생성 cjwbw/rembg
    • lucataco/animate-diff 작업 생성
    • ideogram-ai/ideogram-v2-turbo 작업 생성
    • 작업 생성 black-forest-labs/flux-kontext-dev
    • 작업 minimax/video-01-live 만들기
    • 작업 minimax/video-01 만들기
    • recraft-ai/recraft-v3 작업 생성
    • recraft-ai/recraft-v3-svg 작업 생성
    • 작업 black-forest-labs/flux-1.1-pro-ultra 생성
    • 작업 생성 black-forest-labs/flux-kontext-pro
    • black-forest-labs/flux-kontext-max 작업 생성
    • flux-kontext-apps/multi-image-kontext-max 작업 생성
    • 작업 flux-kontext-apps/multi-image-kontext-pro 만들기
    • lucataco/remove-bg 작업 생성
    • 업무분류/분류 생성
    • 작업 생성 black-forest-labs/flux-fill-dev
    • 작업 생성 black-forest-labs/flux-fill-pro
    • google/imagen-4-fast 작업 만들기
    • google/imagen-4-ultra 작업 만들기
    • google/imagen-4 작업 만들기
    • 작업 생성 prunaai/vace-14b
    • 작업 바이트댄스/seedream-4 만들기
  • Fal-ai 집계 플랫폼
    • 튜토리얼 이용
    • falai-veo3 비디오 생성
      • /fal-ai/veo3
      • /fal-ai/veo3/fast/image-to-video
      • /fal-ai/veo3/fast
      • /fal-ai/veo3/requests/{request_id}
      • /fal-ai/veo3/image-to-video
    • 요청 결과 받기
    • /fal-ai/flux-1/dev
    • /fal-ai/flux-1/dev/image-to-image
    • /fal-ai/flux-1/dev/redux
    • /fal-ai/flux-1/schnell/redux
    • /fal-ai/flux-pro/kontext
    • /fal-ai/flux-pro/kontext/text-to-image
    • /fal-ai/flux-pro/kontext/max
    • /fal-ai/flux-pro/kontext/max/multi
    • /fal-ai/wan/v2.2-a14b/image-to-image
    • /fal-ai/bytedance/seedream/v4/text-to-image
    • /fal-ai/bytedance/seedream/v4/edit
    • /fal-ai/vidu/reference-to-image
    • /fal-ai/imagen4/preview
    • /fal-ai/qwen-image-edit-lora
    • /fal-ai/qwen-image-edit-plus
    • /fal-ai/kling-video/v2.5-turbo/pro/text-to-video
    • /fal-ai/kling-video/v2.5-turbo/pro/image-to-video
    • /fal-ai/flux-lora
    • /fal-ai/flux-lora/image-to-image
    • /fal-ai/flux-lora/inpainting
    • /fal-ai/kling-video/v2.5-turbo/pro/text-to-video
    • /fal-ai/qwen-image-edit-lora
  • PHP 구성 방법
    • PHP 이미지 편집 데모
  • nodejs 구성 방법
    • nodejs 기본 대화
  • 다양한 플러그인/소프트웨어 사용 튜토리얼
    • 코덱스 구성 튜토리얼
    • 대중교통 API 튜토리얼을 사용한 N8N 워크플로
    • Gemini CLI 전송 스테이션 구성 및 사용 튜토리얼
    • Claude Code 설치 및 사용 튜토리얼
    • CherryStudio가 CLUDE MCP를 호출합니다.
    • Cherry Studio 구성 튜토리얼
    • Cherry Studio 구성 바나나 프로 4K 및 해상도 튜토리얼
    • CherryStudio는 o4 추론 수준을 구성합니다.
    • 입력부터 URL 획득까지 버튼 작업흐름을 간단하게 구성
    • 모델 추가
    • 클라인 구성 튜토리얼
    • 에이더 구성 튜토리얼
    • 커서 구성 튜토리얼
    • lobechat 설정 튜토리얼
    • 챗박스(권장)
    • 오픈 소스 gpt_academic
    • 넥스트챗 설정 튜토리얼
    • zotero gpt 구성 방법
    • CLAUDE DEV 구성 튜토리얼
    • 몰입형 번역 gpt 번역 설정
    • 브라우저 플러그인 ChatGPT 사이드바
    • chatgpt-on-wechat 구성 튜토리얼
    • chatgpt GPT 학술 학술 최적화 구성 gpt 튜토리얼
    • RikkaHub 구성 튜토리얼
    • 대중교통 API 튜토리얼을 사용한 Coze 워크플로
    • n8n 워크플로우는 로컬 이미지를 획득하고 비디오 예제를 생성합니다.
  • 도움말 센터
    • AI 반환 필드: 사고 관련
    • HTTP 상태 코드와 그 의미
    • 자체 구축된 이미지 베드 API
    • 사진 침대에 사진 업로드
  1. Python 구성 방법

Python은 텍스트를 음성으로 변환합니다.

텍스트 음성 변환(TTS) API 가이드#

개요#

오디오 API는 TTS 모델을 기반으로 다음 기능을 구현하기 위해 '음성' 엔드포인트를 제공합니다.
📝 블로그 기사 소리내어 읽기
🌍 다국어 오디오 생성
🎵 실시간 오디오 스트리밍 출력
중요: 사용자에게 듣고 있는 내용은 사람의 목소리가 아니라 AI에서 생성된 음성임을 명시해야 합니다.

기본 사용법#

기본 예#

``파이썬
pathlib import 경로에서
openai 가져오기 OpenAI에서
클라이언트 = OpenAI(
base_url="https://yossapi.com/v1",
api_key=키
)
speech_file_path = 경로(file).parent / "speech.mp3"
응답 = client.audio.speech.create(
모델="tts-1",
음성="합금",
input="오늘은 사람들이 좋아하는 것을 만들 수 있는 멋진 날입니다!"
)
response.stream_to_file(speech_file_path)



## 기능

### 오디오 품질 옵션
- **tts-1**: 낮은 대기 시간, 실시간 애플리케이션에 적합
- **tts-1-hd**: 품질이 높으며 정적 콘텐츠가 적을 수 있습니다.

### 사용 가능한 사운드
-합금
-에코
-우화
-노바
-쉬머
- 오닉스

### 지원되는 출력 형식
| 형식 | 특징 | 적용 가능한 시나리오 |
|------|------|----------|
| MP3 | 기본 형식 | 일반적인 장면 |
| 오퍼스 | 낮은 대기 시간 | 웹 스트리밍 및 커뮤니케이션 |
| AAC | 효율적인 압축 | 모바일 장치 재생 |
| FLAC | 무손실 압축 | 오디오 보관 |
| 웨이브 | 압축 없음 | 대기 시간이 짧은 애플리케이션 |
| PCM | 원시 샘플 | 24kHz, 16비트 부호 있음 |

### 라이브 오디오 스트리밍
``파이썬
openai 가져오기 OpenAI에서

클라이언트 = OpenAI(
    base_url="https://yossapi.com/v1",
    api_key=키
)

응답 = client.audio.speech.create(
    모델="tts-1",
    음성="합금",
    input="안녕하세요! 스트리밍 테스트입니다.",
)

response.stream_to_file("output.mp3")

지원되는 언어#

다음을 포함한 여러 언어를 지원합니다.
아시아 언어: 중국어, 일본어, 한국어 등
유럽 언어: 영어, 프랑스어, 독일어 등
기타 언어: 아랍어, 힌디어 등
참고: 현재 사운드는 주로 영어에 최적화되어 있습니다.

FAQ#

Q: 생성된 오디오의 감정을 어떻게 제어하나요?#

A: 현재 직접 제어 메커니즘은 없습니다. 대문자 사용이나 구문이 출력에 영향을 미칠 수 있지만 그 효과는 불확실합니다.

Q: 맞춤형 사운드를 만들 수 있나요?#

A: 사용자 정의 사운드 생성은 지원되지 않습니다.

Q: 생성된 오디오의 소유권은 무엇인가요?#

A: 창작자의 소유이지만 AI가 생성한 오디오라는 점을 사용자에게 알려야 합니다.
修改于 2026-01-22 11:36:39
上一页
Python은 음성을 텍스트로 변환합니다.
下一页
Python은 임베딩 벡터화를 사용합니다.
Built with