desde openai importar OpenAI
cliente = OpenAI (
base_url="https://yossapi.com/v1",
api_key=clave
)
#Transcripción Básica
archivo_audio = abrir("/ruta/al/archivo/audio.mp3", "rb")
transcripción = cliente.audio.transcripciones.create(
modelo="susurro-1",
archivo=archivo_audio
)
imprimir (transcripción.texto)
#Especificar formato de salida
transcripción = cliente.audio.transcripciones.create(
modelo="susurro-1",
archivo=archivo_audio,
respuesta_formato="texto"
)desde openai importar OpenAI
cliente = OpenAI (
base_url="https://yossapi.com/v1",
api_key=clave
)
archivo_audio = abrir("/ruta/al/archivo/alemán.mp3", "rb")
traducción = cliente.audio.traducciones.create(
modelo="susurro-1",
archivo=archivo_audio
)
imprimir(traducción.texto)desde openai importar OpenAI
cliente = OpenAI (
base_url="https://yossapi.com/v1",
api_key=clave
)
archivo_audio = abrir("voz.mp3", "rb")
transcripción = cliente.audio.transcripciones.create(
archivo=archivo_audio,
modelo="susurro-1",
respuesta_formato="verbose_json",
timestamp_granularities=["palabra"]
)
imprimir (transcripción.palabras)desde pydub importar AudioSegment
canción = AudioSegment.from_mp3("buenos_días.mp3")
# Dividir en segmentos de 10 minutos
diez_minutos = 10 * 60 * 1000
primeros_10_minutos = canción[:diez_minutos]
primeros_10_minutos.export("buenos_días_10.mp3", formato="mp3")Nota: Solo se enumeran los idiomas con una tasa de error de palabras (WER) inferior al 50%. Se admiten otros idiomas, pero pueden tener una calidad inferior.