Skip to content
Vol. 1 · Ed. 2026
CyberGlossary
Entry № 281

数据投毒

数据投毒 是什么?

数据投毒针对机器学习系统的攻击,攻击者注入、篡改或重新标注训练数据,使最终模型出现错误行为或被植入隐蔽后门。


数据投毒攻击的目标是 ML 生命周期中的训练阶段。攻击者通过操纵数据集——公开网络爬取、众包标签、微调语料或反馈日志——来引入偏差、降低准确率,或植入由特定触发器激活的行为。Carlini 等人在 2023 年的研究表明,即使仅极小比例的被污染网页数据,也足以破坏大型预训练语料。常见变种包括可用性攻击(整体降准)、定向攻击(造成特定误分类)和后门攻击(由触发器激活)。防御重点在于数据集的来源管理与签名、去重、训练数据的异常检测、稳健学习算法,以及对基线与对抗测试集的持续评估。

示例

  1. 01

    攻击者编辑维基百科或过期域名,使被污染的文本进入未来的预训练语料。

  2. 02

    恶意贡献者向开源图像分类数据集提交错误标注的样本。

常见问题

数据投毒 是什么?

针对机器学习系统的攻击,攻击者注入、篡改或重新标注训练数据,使最终模型出现错误行为或被植入隐蔽后门。 它属于网络安全的 AI 与机器学习安全 分类。

数据投毒 是什么意思?

针对机器学习系统的攻击,攻击者注入、篡改或重新标注训练数据,使最终模型出现错误行为或被植入隐蔽后门。

数据投毒 是如何工作的?

数据投毒攻击的目标是 ML 生命周期中的训练阶段。攻击者通过操纵数据集——公开网络爬取、众包标签、微调语料或反馈日志——来引入偏差、降低准确率,或植入由特定触发器激活的行为。Carlini 等人在 2023 年的研究表明,即使仅极小比例的被污染网页数据,也足以破坏大型预训练语料。常见变种包括可用性攻击(整体降准)、定向攻击(造成特定误分类)和后门攻击(由触发器激活)。防御重点在于数据集的来源管理与签名、去重、训练数据的异常检测、稳健学习算法,以及对基线与对抗测试集的持续评估。

如何防御 数据投毒?

针对 数据投毒 的防御通常结合技术控制与运营实践,详见上方完整定义。

数据投毒 还有哪些其他名称?

常见的别称包括: 训练数据投毒, 数据集投毒。

相关术语

参见