Skip to content
Vol. 1 · Ed. 2026
CyberGlossary
Entry № 281

Отравление данных

Что такое Отравление данных?

Отравление данныхАтака на систему машинного обучения, при которой злоумышленники внедряют, изменяют или меняют разметку обучающих данных, чтобы итоговая модель работала неверно или содержала скрытые бэкдоры.


Отравление данных направлено на этап обучения в ML-жизненном цикле. Злоумышленник манипулирует датасетами — веб-краулы, краудсорсинговые метки, корпуса для дообучения, журналы обратной связи — чтобы внести смещение, снизить точность или встроить поведение, активируемое триггером. Carlini и соавторы показали в 2023 году, что даже ничтожная доля отравленных веб-данных способна испортить крупные корпуса предобучения. Варианты включают атаки на доступность, целевые атаки и бэкдор-атаки. Защита строится на происхождении и подписи датасетов, дедупликации, выявлении аномалий в обучающих данных, устойчивых алгоритмах обучения и непрерывной оценке на бенчмарках и adversarial-тестах.

Примеры

  1. 01

    Злоумышленник правит Википедию или истёкшие домены, чтобы загрязнённый текст попал в будущий корпус предобучения.

  2. 02

    Вредоносный участник передаёт неверно размеченные образцы в открытый датасет классификации изображений.

Частые вопросы

Что такое Отравление данных?

Атака на систему машинного обучения, при которой злоумышленники внедряют, изменяют или меняют разметку обучающих данных, чтобы итоговая модель работала неверно или содержала скрытые бэкдоры. Относится к категории Безопасность ИИ и ML в кибербезопасности.

Что означает Отравление данных?

Атака на систему машинного обучения, при которой злоумышленники внедряют, изменяют или меняют разметку обучающих данных, чтобы итоговая модель работала неверно или содержала скрытые бэкдоры.

Как работает Отравление данных?

Отравление данных направлено на этап обучения в ML-жизненном цикле. Злоумышленник манипулирует датасетами — веб-краулы, краудсорсинговые метки, корпуса для дообучения, журналы обратной связи — чтобы внести смещение, снизить точность или встроить поведение, активируемое триггером. Carlini и соавторы показали в 2023 году, что даже ничтожная доля отравленных веб-данных способна испортить крупные корпуса предобучения. Варианты включают атаки на доступность, целевые атаки и бэкдор-атаки. Защита строится на происхождении и подписи датасетов, дедупликации, выявлении аномалий в обучающих данных, устойчивых алгоритмах обучения и непрерывной оценке на бенчмарках и adversarial-тестах.

Как защититься от Отравление данных?

Защита от Отравление данных обычно сочетает технические меры и операционные практики, как описано в определении выше.

Какие есть другие названия Отравление данных?

Распространённые альтернативные названия: Отравление обучающих данных, Отравление датасета.

Связанные термины

См. также