Атака на вывод членства
Что такое Атака на вывод членства?
Атака на вывод членстваАтака на приватность, определяющая, входила ли конкретная запись в обучающую выборку модели, через анализ её поведения на этой записи.
Атака на вывод членства формализована Shokri и соавторами (2017) и эксплуатирует склонность ML-моделей быть увереннее на примерах, виденных при обучении. Злоумышленник запрашивает целевую модель с кандидатом и сравнивает уверенность, лосс или поклассовые оценки со shadow-моделями, обученными на похожих данных. Часто хватает только API-доступа. Атака — кирпич для более широких приватных угроз: подтверждение того, что медицинская запись, фото или документ использовались в обучении, может нарушать GDPR, HIPAA или EU AI Act. Защита включает дифференциальную приватность, регуляризацию (dropout), минимизацию выводов и тщательную дедупликацию обучающего набора.
● Примеры
- 01
Через сравнение значений лосса установить, что медицинская карта конкретного пациента использовалась при обучении больничной диагностической модели.
- 02
Через тесты членства выявить, входила ли защищённая авторским правом книга в корпус предобучения LLM.
● Частые вопросы
Что такое Атака на вывод членства?
Атака на приватность, определяющая, входила ли конкретная запись в обучающую выборку модели, через анализ её поведения на этой записи. Относится к категории Безопасность ИИ и ML в кибербезопасности.
Что означает Атака на вывод членства?
Атака на приватность, определяющая, входила ли конкретная запись в обучающую выборку модели, через анализ её поведения на этой записи.
Как защититься от Атака на вывод членства?
Защита от Атака на вывод членства обычно сочетает технические меры и операционные практики, как описано в определении выше.
Какие есть другие названия Атака на вывод членства?
Распространённые альтернативные названия: MIA, Атака членства в обучающей выборке.