综合使用OpenAI文本嵌入模型的全面指南

2024-11-18 11:26:06 +0800 CST views 1099

OpenAI 文本嵌入模型之初学者指南

导读

本文将为大家提供关于使用 OpenAI 文本嵌入模型在生成式人工智能应用程序中进行嵌入创建和语义搜索的全面指南。向量嵌入在 AI 中扮演了关键角色，它能够将复杂的非结构化数据转换为机器可处理的向量表示，帮助 AI 模型更高效地理解和处理数据。

什么是向量嵌入与嵌入模型？

向量嵌入

向量嵌入是数据的数字表示，能够捕捉数据中的语义含义与关系，常用于文本、图像、视频、音频等非结构化数据中。通过这些向量，AI 系统可以在高维空间中有效地处理、存储和检索这些数据。类似的单词或数据在向量空间中彼此接近，这便于模型理解它们之间的关系。
images

嵌入模型

嵌入模型是一种将非结构化数据转换为向量嵌入的算法。其目的是学习数据中的模式和关系，并在高维空间中表达这些关系。例如，嵌入模型可能会学习到 "king" 和 "queen" 这两个词语在语义上有相似的含义，因此它们在向量空间中应更接近，而像 "banana" 这样的无关词则会远离它们。

向量嵌入的应用场景

向量嵌入广泛应用于语义搜索、聚类、推荐系统、异常检测等任务。在检索增强生成（RAG）系统中，向量嵌入起到桥梁作用，将查询和内容数据映射到高维向量空间中，从而实现更智能的搜索和推荐。

OpenAI 文本嵌入模型

OpenAI 提供了多种嵌入模型，支持语义搜索、聚类、推荐系统等任务。以下是一些常用的 OpenAI 嵌入模型：

text-embedding-ada-002：性能强劲的第二代嵌入模型，性价比高。
text-embedding-3-small：性能较优的嵌入模型，适合实时应用。
text-embedding-3-large：针对复杂任务的高精度模型，资源消耗较大。

模型比较

模型	描述	输出维度	最大输入	价格
text-embedding-3-large	高精度模型，适合复杂任务	3,072	8,191 tokens	$0.13 / 100 万个 tokens
text-embedding-3-small	性能高效，适合实时应用	8,191	8,191 tokens	$0.10 / 100 万个 tokens
text-embedding-ada-002	性价比最高的嵌入模型	1,536	8,191 tokens	$0.02 / 100 万个 tokens

如何选择模型

选择嵌入模型时需要根据任务需求、性能要求和资源限制进行权衡。例如：

text-embedding-3-large：适合需要极高精度的任务，但其计算开销较大。
text-embedding-3-small：适合对实时响应和效率要求较高的应用。
text-embedding-ada-002：性价比较高的选择，适合大多数常见任务。

使用 OpenAI 生成向量嵌入

下面我们来看看如何使用 OpenAI 的嵌入模型生成向量嵌入，并将其存储在 Zilliz Cloud 中进行语义搜索。

1. 配置与工具

我们将使用 PyMilvus，这是 Milvus 的 Python SDK，可以与 OpenAI 嵌入模型无缝集成。

2. 生成向量嵌入并存储

使用 `text-embedding-ada-002` 模型：

from pymilvus.model.dense import OpenAIEmbeddingFunction
from pymilvus import MilvusClient

OPENAI_API_KEY = "your-openai-api-key"
ef = OpenAIEmbeddingFunction("text-embedding-ada-002", api_key=OPENAI_API_KEY)

docs = [
  "Artificial intelligence was founded as an academic discipline in 1956.",
  "Alan Turing was the first person to conduct substantial research in AI.",
  "Born in Maida Vale, London, Turing was raised in southern England."
]

# Generate embeddings for documents
docs_embeddings = ef(docs)

queries = ["When was artificial intelligence founded",
           "Where was Alan Turing born?"]

# Generate embeddings for queries
query_embeddings = ef(queries)

# Connect to Zilliz Cloud with Public Endpoint and API Key
client = MilvusClient(
   uri="ZILLIZ_PUBLIC_ENDPOINT",
   token="ZILLIZ_API_KEY"
)

COLLECTION = "documents"
if client.has_collection(collection_name=COLLECTION):
   client.drop_collection(collection_name=COLLECTION)

client.create_collection(
   collection_name=COLLECTION,
   dimension=ef.dim,
   auto_id=True
)

for doc, embedding in zip(docs, docs_embeddings):
   client.insert(COLLECTION, {"text": doc, "vector": embedding})

results = client.search(
   collection_name=COLLECTION,
   data=query_embeddings,
   consistency_level="Strong",
   output_fields=["text"]
)

使用 `text-embedding-3-small` 模型：

from pymilvus import model, MilvusClient

OPENAI_API_KEY = "your-openai-api-key"
ef = model.dense.OpenAIEmbeddingFunction(
  model_name="text-embedding-3-small",
  api_key=OPENAI_API_KEY,
)

docs = [
  "Artificial intelligence was founded as an academic discipline in 1956.",
  "Alan Turing was the first person to conduct substantial research in AI.",
  "Born in Maida Vale, London, Turing was raised in southern England."
]

# Generate embeddings for documents
docs_embeddings = ef.encode_documents(docs)

# Generate embeddings for queries
queries = ["When was artificial intelligence founded",
           "Where was Alan Turing born?"]
query_embeddings = ef.encode_queries(queries)

# Connect to Zilliz Cloud
client = MilvusClient(
   uri="ZILLIZ_PUBLIC_ENDPOINT",
   token="ZILLIZ_API_KEY"
)

COLLECTION = "documents"
if client.has_collection(collection_name=COLLECTION):
   client.drop_collection(collection_name=COLLECTION)

client.create_collection(
   collection_name=COLLECTION,
   dimension=ef.dim,
   auto_id=True
)

for doc, embedding in zip(docs, docs_embeddings):
   client.insert(COLLECTION, {"text": doc, "vector": embedding})

results = client.search(
   collection_name=COLLECTION,
   data=query_embeddings,
   consistency_level="Strong",
   output_fields=["text"]
)

结语

OpenAI 文本嵌入模型为开发者提供了强大的向量嵌入工具，适用于广泛的 AI 应用场景，如语义搜索、内容推荐和异常检测。结合向量数据库（如 Milvus 和 Zilliz Cloud），可以实现高效的向量存储和搜索，构建更智能的 AI 系统。

希望这篇指南能帮助你快速上手 OpenAI 嵌入模型，探索更多生成式 AI 应用的可能性。

复制全文生成海报人工智能机器学习数据处理技术指南开发者资源

推荐文章

5个 CSS 新功能，简单好用还超省时间

2025-07-18 07:48:14 +0800 CST

btp-devops是一个在Python中非常有用的库，旨在简化开发运维过程

2024-11-19 07:50:26 +0800 CST

OwlAdmin是一个基于Vue3和Laravel的开源后台管理系统

2024-11-19 04:56:20 +0800 CST

FcDesigner：低代码表单设计平台

2024-11-19 03:50:18 +0800 CST

如何在Vue中实现简单的计算属性，用于基于其他数据来源的实时更新

2024-11-19 05:10:34 +0800 CST

JS新特性：`?=`操作符助你告别bug！

2024-11-19 09:33:53 +0800 CST

Pydantic是一个流行的Python数据验证库

2024-11-19 06:03:00 +0800 CST

在Vue3中处理表单数据的方式是什么？与Vue2相比，是否有显著的变化或者新的建议？

2024-11-19 02:11:49 +0800 CST

`world-rowing`库的安装和使用方法，帮助用户与世界赛艇数据交互

2024-11-18 17:40:50 +0800 CST

如何在Vue3中使用组合API创建一个简单的计数器？

2024-11-19 10:11:56 +0800 CST

支付宝批量转账

2024-11-18 20:26:17 +0800 CST

LangChainGo 一个 LangChain 的 Go 语言扩展

2025-03-09 22:27:54 +0800 CST

前端开发者如何一键部署项目？试试这几个网站，无需购买服务器！

2024-11-19 01:27:18 +0800 CST

CentOS 镜像源配置

2024-11-18 11:28:06 +0800 CST

“信创”浪潮下IT人员的机遇与准备

2024-11-18 18:26:47 +0800 CST

Node.js中接入微信支付

2024-11-19 06:28:31 +0800 CST

Docker 搭建一款开源高性能的个人图床系统

2024-11-19 04:02:04 +0800 CST

Mysql允许外网访问详细流程

2024-11-17 05:03:26 +0800 CST

linux下执行脚本，提示Command not found解决办法

2024-11-19 07:58:56 +0800 CST

HTML和JavaScript创建的烟花动画效果

2024-11-19 04:21:02 +0800 CST

Vue3结合Driver.js实现新手指引功能

2024-11-19 08:46:50 +0800 CST

使用Vue3及其setup语法糖实现无刷新数据加载，提升用户体验。通过响应式系统和异步数据处理，开发者可以高效地组织代码，避免手动刷新页面

2024-11-18 21:42:15 +0800 CST

Requests库详细介绍

2024-11-18 05:53:37 +0800 CST

您应该了解的 15 个有用的 CSS 属性

2024-11-18 17:58:16 +0800 CST

Manus被越狱：提示词注入再现江湖

2025-03-10 19:37:20 +0800 CST

Go 开发中的热加载指南

2024-11-18 23:01:27 +0800 CST

整理了8款基于CSS和JavaScript的创意通知界面，展示了现代网页通知的多样性和设计可能性

2024-11-19 10:13:33 +0800 CST

Paper.js是一个开源的JavaScript库，基于HTML5Canvas构建，提供强大的工具用于创建和操作矢量图形

2024-11-18 15:08:45 +0800 CST

windows下mysql使用source导入数据

2024-11-17 05:03:50 +0800 CST

js使用canvas进行图片文字合成技术

2024-11-19 09:07:51 +0800 CST

Rust 中的所有权机制

2024-11-18 20:54:50 +0800 CST

实现系统的动态热部署功能，允许用户上传自定义实现的Jar包并在不重启系统的情况下自动加载

2024-11-18 20:57:45 +0800 CST

cool-ip-api是一个用于获取IP地址详细信息的Python库

2024-11-18 22:05:45 +0800 CST

attrs是一个强大的Python库，旨在简化类定义，减少样板代码

2024-11-18 04:47:26 +0800 CST

Node.js 发邮件全指南：高效、安全的自动化邮件发送解决方案

2024-11-18 03:16:18 +0800 CST

如何结合Rust和Python构建高性能应用程序

2024-11-18 23:40:24 +0800 CST

一键脚本搭建Frp服务，并配置NAS和OpenWrt软路由，最后设置反向代理以便通过子域名访问内网服务

2024-11-19 05:14:20 +0800 CST

Git 常用命令详解

2024-11-18 16:57:24 +0800 CST

最强的Python继承：让代码复用无缝无痕

2024-11-18 04:41:32 +0800 CST

Linux 网站访问日志分析脚本

2024-11-18 19:58:45 +0800 CST

UGit 为程序开发者提供的强大 Git 客户端

2024-11-19 04:54:30 +0800 CST

html一个包含iPhoneX和MacBook模拟器

2024-11-19 08:03:47 +0800 CST

抛弃 Ajax：拥抱更简洁强大的 Fetch API

2025-05-09 09:31:56 +0800 CST

dotenv-linter是一款使用Rust编写的开源工具，旨在快速校验.env文件的语法和规范性

2024-11-19 03:25:51 +0800 CST

如何使用JavaScript让HTML中的Canvas画布全屏显示

2024-11-19 09:24:54 +0800 CST

彻底删除 Git 中的较大文件（包括历史提交记录）

2024-11-18 06:30:20 +0800 CST

vue打包后如何进行调试错误

2024-11-17 18:20:37 +0800 CST

jieba是一个广受欢迎的Python库，专门用于中文文本的分词处理

2024-11-18 18:18:43 +0800 CST

php指定版本安装php扩展

2024-11-19 04:10:55 +0800 CST

Vue 3中的 `setup` 函数有什么作用？

2024-11-18 08:42:09 +0800 CST