из openai импорт OpenAI
клиент = OpenAI(
base_url="https://yossapi.com/v1",
api_key=ключ
)
#Базовая транскрипция
audio_file = open("/путь/к/файлу/audio.mp3", "rb")
транскрипция = client.audio.transscriptions.create(
модель="шепот-1",
файл = аудио_файл
)
печать(транскрипция.текст)
#Указываем выходной формат
транскрипция = client.audio.transscriptions.create(
модель="шепот-1",
файл = аудио_файл,
ответ_формат="текст"
)из openai импорт OpenAI
клиент = OpenAI(
base_url="https://yossapi.com/v1",
api_key=ключ
)
audio_file = open("/путь/к/файлу/german.mp3", "rb")
перевод = client.audio.translations.create(
модель="шепот-1",
файл = аудио_файл
)
печать(перевод.текст)из openai импорт OpenAI
клиент = OpenAI(
base_url="https://yossapi.com/v1",
api_key=ключ
)
audio_file = open("speech.mp3", "rb")
расшифровка = client.audio.transscriptions.create(
файл = аудио_файл,
модель="шепот-1",
response_format="verbose_json",
timestamp_granularities=["слово"]
)
печать(транскрипт.слова)из pydub импортировать AudioSegment
песня = AudioSegment.from_mp3("good_morning.mp3")
# Разделить на 10-минутные сегменты
десять_минут = 10 * 60 * 1000
first_10_MINUT = песня[:ten_MINUT]
first_10_MINUT.export("good_morning_10.mp3", format="mp3")Примечание. В списке указаны только языки с коэффициентом ошибок в словах (WER) менее 50 %. Другие языки поддерживаются, но качество может быть ниже.