Adaptiver Angriff
Was ist Adaptiver Angriff?
Adaptiver AngriffAngriff auf ein ML-System, der gezielt entworfen ist, eine bekannte Verteidigung zu umgehen oder zu brechen, statt eine generische, defense-agnostische Methode zu verwenden.
Ein adaptiver Angriff wird in voller Kenntnis der Zielverteidigung und ihrer Annahmen konstruiert; seine Verlustfunktion oder Nebenbedingungen werden so zugeschnitten, dass sie genau diese Verteidigung umgehen. Bekannt wurde der Begriff durch Carlini und Wagner: Ihre Evaluierungen zeigten wiederholt, dass Verteidigungen, die sich gegenueber generischen adversarialen Beispielen als robust ausgaben, fielen, sobald ein Angreifer ein gegen sie zugeschnittenes Ziel definierte. Adaptive Angriffe gelten heute als Standard: Jede Verteidigung gegen adversariale Beispiele, Wasserzeichen oder Erkennung sollte gegen Gegner getestet werden, die die Verteidigung kennen und ihre Methode anpassen. Diesen Schritt zu ueberspringen, fuehrt zu ueberzogenen Robustheitsbehauptungen, die einfache, prinzipiengeleitete Angriffe leicht aushebeln.
● Beispiele
- 01
Carlini und Wagner brechen mehrere Adversarial-Example-Detektoren, indem sie den Angriffsverlust gegen die jeweilige Entscheidungsregel ausrichten.
- 02
Ein adaptiver Angriff bricht ein Wasserzeichenverfahren fuer KI-Bilder, indem Stoerungen gegen den veroeffentlichten Detektor optimiert werden.
● Häufige Fragen
Was ist Adaptiver Angriff?
Angriff auf ein ML-System, der gezielt entworfen ist, eine bekannte Verteidigung zu umgehen oder zu brechen, statt eine generische, defense-agnostische Methode zu verwenden. Es gehört zur Kategorie KI- und ML-Sicherheit der Cybersicherheit.
Was bedeutet Adaptiver Angriff?
Angriff auf ein ML-System, der gezielt entworfen ist, eine bekannte Verteidigung zu umgehen oder zu brechen, statt eine generische, defense-agnostische Methode zu verwenden.
Wie funktioniert Adaptiver Angriff?
Ein adaptiver Angriff wird in voller Kenntnis der Zielverteidigung und ihrer Annahmen konstruiert; seine Verlustfunktion oder Nebenbedingungen werden so zugeschnitten, dass sie genau diese Verteidigung umgehen. Bekannt wurde der Begriff durch Carlini und Wagner: Ihre Evaluierungen zeigten wiederholt, dass Verteidigungen, die sich gegenueber generischen adversarialen Beispielen als robust ausgaben, fielen, sobald ein Angreifer ein gegen sie zugeschnittenes Ziel definierte. Adaptive Angriffe gelten heute als Standard: Jede Verteidigung gegen adversariale Beispiele, Wasserzeichen oder Erkennung sollte gegen Gegner getestet werden, die die Verteidigung kennen und ihre Methode anpassen. Diesen Schritt zu ueberspringen, fuehrt zu ueberzogenen Robustheitsbehauptungen, die einfache, prinzipiengeleitete Angriffe leicht aushebeln.
Wie schützt man sich gegen Adaptiver Angriff?
Schutzmaßnahmen gegen Adaptiver Angriff kombinieren typischerweise technische Kontrollen und operative Praktiken, wie in der Definition oben beschrieben.
Welche anderen Bezeichnungen gibt es für Adaptiver Angriff?
Übliche alternative Bezeichnungen: Verteidigungsbewusster Angriff, White-Box-Adaptive-Evaluation.
● Verwandte Begriffe
- ai-security№ 1168
Uebertragbarer Adversarialer Angriff
Angriff, bei dem gegen ein ML-Modell erzeugte adversarielle Beispiele auch andere, unbekannte Modelle taeuschen und so Black-Box-Angriffe ohne Zugriff auf das Ziel ermoeglichen.
- ai-security№ 018
Adversariales Beispiel
Eine gezielt — oft für Menschen unmerklich — gestörte Eingabe, die ein ML-Modell zu einer falschen oder vom Angreifer gewählten Vorhersage zwingt.
- ai-security№ 032
KI-Red-Team
Spezialteam, das Angreifer gegen KI-Systeme simuliert, um Sicherheits-, Safety- und Missbrauchsrisiken vor realen Angreifern aufzudecken.
- ai-security№ 026
Erkennung KI-generierter Inhalte
Werkzeuge und Techniken, die abschätzen, ob ein Text, Bild, Audio oder Video von einem KI-Modell statt von einem Menschen erzeugt wurde.