LLM 防火墙

Q: LLM 防火墙 是什么?

位于用户与大型语言模型之间的安全控制,实时检查提示、检索上下文与输出,对违反策略的流量进行拦截或改写。 它属于网络安全的 AI 与机器学习安全 分类。

Q: 如何防御 LLM 防火墙?

针对 LLM 防火墙 的防御通常结合技术控制与运营实践,详见上方完整定义。

审核人Florian AmetteCybersecurity entrepreneur & security researcher

LLM 防火墙是什么?

LLM 防火墙位于用户与大型语言模型之间的安全控制,实时检查提示、检索上下文与输出,对违反策略的流量进行拦截或改写。

LLM 防火墙(也称 AI 防火墙或 LLM 网关)对流入流出 LLM 端点的流量进行检查、分类与策略执行。常见能力包括提示注入与越狱检测、PII 与机密屏蔽、内容审核、Schema 与工具调用校验、按身份的速率限制、RAG 出站控制以及详细审计日志。该领域的产品和开源项目包括 LLM Guard、Prompt Shield、Lakera Guard,以及 Cloudflare、F5、Palo Alto 及主流超大规模云厂商的方案。LLM 防火墙是模型内置守护栏、安全的 RAG 设计、身份感知访问控制与 MLSecOps 实践的补充,而非替代。在纵深防御架构中最为有效,可在厂商默认安全策略之上叠加组织特有的策略。

● 示例

01
网关在请求到达 LLM API 之前拦截含有信用卡号的提示。
02
LLM 防火墙在文档被加入 RAG 上下文之前,去除已知的提示词注入签名。

● 常见问题

LLM 防火墙是什么?

位于用户与大型语言模型之间的安全控制,实时检查提示、检索上下文与输出,对违反策略的流量进行拦截或改写。它属于网络安全的 AI 与机器学习安全分类。

LLM 防火墙是什么意思?

位于用户与大型语言模型之间的安全控制,实时检查提示、检索上下文与输出,对违反策略的流量进行拦截或改写。

如何防御 LLM 防火墙?

针对 LLM 防火墙的防御通常结合技术控制与运营实践,详见上方完整定义。

LLM 防火墙还有哪些其他名称?

常见的别称包括: AI 防火墙, LLM 网关。

LLM 防火墙 是什么?

● 示例

● 常见问题

● 相关术语

LLM 防火墙是什么?