AI 水印
AI 水印 是什么?
AI 水印在 AI 生成内容中嵌入可检测信号的技术,用于事后验证其来源、所属模型或与训练集的关联。
AI 水印涵盖多种形态:像 C2PA 这样的密码学内容凭证,把已签名的清单附加在媒体上;在像素或音频样本中作微妙改动的感知型水印;以及在模型层面对 LLM 的 token 采样进行偏置的模型水印,例如 Google 的 SynthID Text,使生成的文本在统计上可被识别。水印支撑欧盟《人工智能法》中的透明度义务,帮助平台为 AI 内容打标签,并在虚假信息、欺诈和儿童安全相关取证中提供支持。对抗裁剪、改写、压缩与对抗攻击的鲁棒性仍是活跃的研究方向,水印还需避免损害模型质量或泄露训练数据指纹。
● 示例
- 01
图像生成服务在每次导出时同时写入 C2PA Content Credentials 与 SynthID 图像水印。
- 02
某平台借助 SynthID Text 在学术诚信流程中标注 AI 撰写的作文。
● 常见问题
AI 水印 是什么?
在 AI 生成内容中嵌入可检测信号的技术,用于事后验证其来源、所属模型或与训练集的关联。 它属于网络安全的 AI 与机器学习安全 分类。
AI 水印 是什么意思?
在 AI 生成内容中嵌入可检测信号的技术,用于事后验证其来源、所属模型或与训练集的关联。
AI 水印 是如何工作的?
AI 水印涵盖多种形态:像 C2PA 这样的密码学内容凭证,把已签名的清单附加在媒体上;在像素或音频样本中作微妙改动的感知型水印;以及在模型层面对 LLM 的 token 采样进行偏置的模型水印,例如 Google 的 SynthID Text,使生成的文本在统计上可被识别。水印支撑欧盟《人工智能法》中的透明度义务,帮助平台为 AI 内容打标签,并在虚假信息、欺诈和儿童安全相关取证中提供支持。对抗裁剪、改写、压缩与对抗攻击的鲁棒性仍是活跃的研究方向,水印还需避免损害模型质量或泄露训练数据指纹。
如何防御 AI 水印?
针对 AI 水印 的防御通常结合技术控制与运营实践,详见上方完整定义。
AI 水印 还有哪些其他名称?
常见的别称包括: 内容来源凭证, 生成式 AI 水印。
● 相关术语
- ai-security№ 026
AI 内容检测
用于估计一段文本、图像、音频或视频是否由 AI 模型生成、而非来自人类的工具和技术。
- ai-security№ 1123
合成媒体
由生成式 AI 制作或大量修改的音频、图像、视频或文本内容,而非直接从物理世界采集得到的素材。
- ai-security№ 297
深度伪造(Deepfake)
由 AI 生成、能以假乱真地呈现真实人物说出或做出未曾发生之事的合成音视频或图像。
- ai-security№ 027
AI 治理
组织和监管机构用于确保 AI 系统以负责任、合法方式开发、部署与运营的政策、流程、角色与控制的总和。
- ai-security№ 025
AI 物料清单(AIBOM)
对构成 AI 系统的每一项组件——数据集、基础模型、微调数据、依赖库、提示与评估制品——的机读清单,用于安全、合规与问责。
- ai-security№ 033
AI 安全(Safety)
致力于防止 AI 系统对用户、运营者及社会造成非预期危害的学科,涵盖技术、运营与社会三个维度。
● 参见
- № 703模型抽取
- № 729Nightshade 攻击