Membership-Inference-Angriff

Geprüft vonFlorian AmetteCybersecurity entrepreneur & security researcher

Was ist Membership-Inference-Angriff?

Membership-Inference-AngriffPrivacy-Angriff, der durch Analyse des Modellverhaltens auf einem Datensatz bestimmt, ob dieser Datensatz Teil der Trainingsdaten war.

Membership Inference wurde von Shokri et al. (2017) formalisiert. Der Angriff nutzt aus, dass ML-Modelle bei während des Trainings gesehenen Beispielen tendenziell höhere Konfidenz zeigen. Der Angreifer fragt das Zielmodell mit einer Kandidatenprobe ab und vergleicht Konfidenz, Loss oder Per-Class-Scores mit Shadow-Modellen, die auf vergleichbaren Daten trainiert wurden. Reiner API-Zugriff genügt oft. Der Angriff ist Baustein größerer Privacy-Bedrohungen: Die Bestätigung, dass eine medizinische Akte, ein Foto oder ein Dokument zum Training verwendet wurde, kann DSGVO, HIPAA oder den EU AI Act verletzen. Schutz bieten Differential Privacy, Regularisierung (z. B. Dropout), Output-Minimierung und sorgfältige Deduplikation der Trainingsdaten.

● Beispiele

01
Feststellen, dass die Akte eines bestimmten Patienten ein Krankenhaus-Diagnosemodell trainiert hat, indem Loss-Werte verglichen werden.
02
Identifizieren, ob ein urheberrechtlich geschütztes Buch im Pre-Training-Korpus eines LLM enthalten war, über Membership-Tests.

● Häufige Fragen

Was ist Membership-Inference-Angriff?

Privacy-Angriff, der durch Analyse des Modellverhaltens auf einem Datensatz bestimmt, ob dieser Datensatz Teil der Trainingsdaten war. Es gehört zur Kategorie KI- und ML-Sicherheit der Cybersicherheit.

Was bedeutet Membership-Inference-Angriff?

Privacy-Angriff, der durch Analyse des Modellverhaltens auf einem Datensatz bestimmt, ob dieser Datensatz Teil der Trainingsdaten war.

Wie schützt man sich gegen Membership-Inference-Angriff?

Schutzmaßnahmen gegen Membership-Inference-Angriff kombinieren typischerweise technische Kontrollen und operative Praktiken, wie in der Definition oben beschrieben.

Welche anderen Bezeichnungen gibt es für Membership-Inference-Angriff?

Übliche alternative Bezeichnungen: MIA, Trainingsdaten-Mitgliedschaftsangriff.

● Verwandte Begriffe

● Siehe auch

Embedding-Angriffe