向量数据库安全
向量数据库安全 是什么?
向量数据库安全保护 AI 系统所使用的向量数据库,防范数据泄露、投毒、租户串通以及运营或供应链入侵的一组控制措施。
Pinecone、Weaviate、Milvus、Qdrant、Chroma 以及 PostgreSQL 的 pgvector 扩展等向量数据库,存储着支撑 RAG、语义搜索、推荐与 AI 智能体的嵌入向量。它们的安全模型类似传统数据库,但带来新的风险:向量可被反演还原原始文本;通过反复的相似度查询可以渐进式地外泄敏感内容;若过滤规则配置错误,多租户索引会在客户之间串通;语料库还可能被投毒以影响模型输出。良好实践包括对数据进行静态与传输加密、细粒度的身份认证与授权、基于 namespace 和元数据的过滤、对查询行为的审计日志、入库时的内容校验,以及把嵌入视为可能的个人数据来处理。
● 示例
- 01
通过 Postgres 行级安全(RLS)让每个租户只能访问自己的 pgvector 嵌入。
- 02
Pinecone 的 namespace 与 API Key 作用域避免不同租户之间的相似度结果泄露。
● 常见问题
向量数据库安全 是什么?
保护 AI 系统所使用的向量数据库,防范数据泄露、投毒、租户串通以及运营或供应链入侵的一组控制措施。 它属于网络安全的 AI 与机器学习安全 分类。
向量数据库安全 是什么意思?
保护 AI 系统所使用的向量数据库,防范数据泄露、投毒、租户串通以及运营或供应链入侵的一组控制措施。
向量数据库安全 是如何工作的?
Pinecone、Weaviate、Milvus、Qdrant、Chroma 以及 PostgreSQL 的 pgvector 扩展等向量数据库,存储着支撑 RAG、语义搜索、推荐与 AI 智能体的嵌入向量。它们的安全模型类似传统数据库,但带来新的风险:向量可被反演还原原始文本;通过反复的相似度查询可以渐进式地外泄敏感内容;若过滤规则配置错误,多租户索引会在客户之间串通;语料库还可能被投毒以影响模型输出。良好实践包括对数据进行静态与传输加密、细粒度的身份认证与授权、基于 namespace 和元数据的过滤、对查询行为的审计日志、入库时的内容校验,以及把嵌入视为可能的个人数据来处理。
如何防御 向量数据库安全?
针对 向量数据库安全 的防御通常结合技术控制与运营实践,详见上方完整定义。
向量数据库安全 还有哪些其他名称?
常见的别称包括: 向量库安全, 向量数据库加固。