模型上下文协议(MCP)
模型上下文协议(MCP) 是什么?
模型上下文协议(MCP)Anthropic 于 2024 年底发布的开放协议,统一规范 LLM 客户端通过服务器连接外部工具、数据源与提示的方式,使 MCP 服务器成为智能体 AI 的关键安全边界。
模型上下文协议(MCP)是 Anthropic 于 2024 年 11 月首次发布的开放规范,迅速在业界被采纳,成为 LLM 客户端(Claude Desktop、Claude Code、IDE、智能体运行时)接入外部能力的事实标准。MCP 服务器对外暴露一组带类型的工具、资源与提示模板,而 MCP 客户端负责中介模型能与哪些服务器通信、以何种方式通信。从安全角度看,MCP 服务器把三类高风险能力集中在一处:读取敏感数据(数据库、文件、Slack、Drive)、触发副作用(写接口、部署、支付),以及向模型上下文窗口注入文本。这使 MCP 成为智能体 AI 的核心攻击面:恶意 MCP 服务器、工具投毒、通过返回内容进行的间接提示注入、过宽的同意提示以及缺少能力细粒度作用域,都是现实存在的问题。常见防御做法包括使用签名或经审核的服务器目录、按工具划分能力作用域、写入类工具要求人工批准、对输出做净化处理,以及把任何非自研的 MCP 服务器都视为不可信源。
● 示例
- 01
Claude Desktop 连接到本地的「文件系统」MCP 服务器,该服务器仅暴露根植于特定项目目录的读写工具。
- 02
攻击者发布一个第三方 MCP 服务器,当它被纳入某个智能体的工具链时,会悄悄将检索到的文档外发到远程端点。
● 常见问题
模型上下文协议(MCP) 是什么?
Anthropic 于 2024 年底发布的开放协议,统一规范 LLM 客户端通过服务器连接外部工具、数据源与提示的方式,使 MCP 服务器成为智能体 AI 的关键安全边界。 它属于网络安全的 AI 与机器学习安全 分类。
模型上下文协议(MCP) 是什么意思?
Anthropic 于 2024 年底发布的开放协议,统一规范 LLM 客户端通过服务器连接外部工具、数据源与提示的方式,使 MCP 服务器成为智能体 AI 的关键安全边界。
模型上下文协议(MCP) 是如何工作的?
模型上下文协议(MCP)是 Anthropic 于 2024 年 11 月首次发布的开放规范,迅速在业界被采纳,成为 LLM 客户端(Claude Desktop、Claude Code、IDE、智能体运行时)接入外部能力的事实标准。MCP 服务器对外暴露一组带类型的工具、资源与提示模板,而 MCP 客户端负责中介模型能与哪些服务器通信、以何种方式通信。从安全角度看,MCP 服务器把三类高风险能力集中在一处:读取敏感数据(数据库、文件、Slack、Drive)、触发副作用(写接口、部署、支付),以及向模型上下文窗口注入文本。这使 MCP 成为智能体 AI 的核心攻击面:恶意 MCP 服务器、工具投毒、通过返回内容进行的间接提示注入、过宽的同意提示以及缺少能力细粒度作用域,都是现实存在的问题。常见防御做法包括使用签名或经审核的服务器目录、按工具划分能力作用域、写入类工具要求人工批准、对输出做净化处理,以及把任何非自研的 MCP 服务器都视为不可信源。
如何防御 模型上下文协议(MCP)?
针对 模型上下文协议(MCP) 的防御通常结合技术控制与运营实践,详见上方完整定义。
模型上下文协议(MCP) 还有哪些其他名称?
常见的别称包括: MCP, MCP 协议。
● 相关术语
- ai-security№ 731
MCP 攻击
利用模型上下文协议 (MCP) 注入提示、滥用工具或通过 AI 助手所信任的服务器进行横向渗透的攻击。
- ai-security№ 027
智能体 AI 安全
面向可自主规划、调用工具并在真实系统中执行操作的 LLM 智能体的安全实践;在此场景下,提示注入可转化为远程代码执行,过度授权则带来真实的破坏面。
- ai-security№ 1285
Tool-Use Injection
Attacks that manipulate an LLM agent's tool-calling layer — forging tool arguments, smuggling instructions through tool outputs, or coaxing the model into calling unsanctioned tools.
- ai-security№ 586
间接提示词注入
提示词注入的变种,恶意指令被隐藏在第三方内容(网页、文档、邮件)中,由 LLM 通过检索、浏览或工具调用而读入。
- ai-security№ 969
提示词注入
通过向提示中夹带对抗性文本来覆盖 LLM 原有指令的攻击,使模型忽略安全限制或执行攻击者指定的操作。
- ai-security№ 689
LLM 守护栏
约束基于 LLM 的应用能接收或输出哪些内容的机制,围绕底层模型落实 Safety、安全与业务规则。