из openai импорт OpenAI
клиент = OpenAI(
base_url="https://yossapi.com/v1",
api_key=ключ
)
ответ = client.embeddings.create(
input="Здесь будет ваша текстовая строка",
model="text-embedding-3-small"
)
печать(response.data[0].embedding){
"объект": "список",
"данные": [
{
"объект": "вложение",
«индекс»: 0,
"вложение": [
-0,006929283495992422,
-0,005336422007530928,
// ...больше значений
],
}
],
"модель": "текст-встраивание-3-маленький",
"использование": {
«prompt_tokens»: 5,
"total_tokens": 5
}
}| Модель | Страниц на доллар | Оценка производительности MTEB | Максимальный ввод |
|---|---|---|---|
| встраивание текста-3-маленький | 62 500 | 62,3% | 8191 |
| встраивание текста-3-большой | 9,615 | 64,6% | 8191 |
| встраивание текста-ада-002 | 12 500 | 61,0% | 8191 |
из openai импорт OpenAI
клиент = OpenAI(
base_url="https://yossapi.com/v1",
api_key=ключ
)
def get_embedding(text, model="text-embedding-3-small"):
text = text.replace("\n", " ")
return client.embeddings.create(input = [текст], модель=модель).data[0].embedding
# Обрабатываем фрейм данных
df['ada_embedding'] = df.combined.apply(lambda x: get_embedding(x, model='text-embedding-3-small'))
df.to_csv('output/embedded_1k_reviews.csv', index=False)
# Загрузить сохраненную вставку
импортировать панд как pd
импортировать numpy как np
df = pd.read_csv('output/embedded_1k_reviews.csv')
df['ada_embedding'] = df.ada_embedding.apply(eval).apply(np.array)