Skip to content
Vol. 1 · Ed. 2026
CyberGlossary
Entry № 1168

Uebertragbarer Adversarialer Angriff

Was ist Uebertragbarer Adversarialer Angriff?

Uebertragbarer Adversarialer AngriffAngriff, bei dem gegen ein ML-Modell erzeugte adversarielle Beispiele auch andere, unbekannte Modelle taeuschen und so Black-Box-Angriffe ohne Zugriff auf das Ziel ermoeglichen.


Ein uebertragbarer adversarialer Angriff nutzt die von Papernot, McDaniel und Goodfellow systematisierte Beobachtung, dass gegen ein Modell erzeugte adversarielle Beispiele oft auch von anderen, auf aehnlichen Daten trainierten Modellen falsch klassifiziert werden. Der Angreifer trainiert lokal ein Ersatzmodell, erzeugt mit White-Box-Verfahren wie FGSM oder PGD adversarielle Eingaben und schickt sie an ein entferntes Black-Box-Ziel ohne internen Zugriff. Uebertragbarkeit wurde fuer Bildklassifikatoren, Malware-Detektoren, NLP-Modelle und kommerzielle Cloud-APIs gezeigt. Verteidigungen umfassen adversariales Training mit vielfaeltigen Stoerungen, Eingabetransformationen, Ensemble-Disagreement-Detektoren und zertifizierte Robustheitsverfahren wie randomized smoothing.

Beispiele

  1. 01

    Ein Angreifer trainiert lokal ein Ersatz-CNN und erzeugt FGSM-Beispiele, die zugleich eine entfernte Bildmoderations-API umgehen.

  2. 02

    Adversariale Malware-Samples gegen einen Open-Source-Klassifikator umgehen zudem mehrere kommerzielle ML-AV-Engines.

Häufige Fragen

Was ist Uebertragbarer Adversarialer Angriff?

Angriff, bei dem gegen ein ML-Modell erzeugte adversarielle Beispiele auch andere, unbekannte Modelle taeuschen und so Black-Box-Angriffe ohne Zugriff auf das Ziel ermoeglichen. Es gehört zur Kategorie KI- und ML-Sicherheit der Cybersicherheit.

Was bedeutet Uebertragbarer Adversarialer Angriff?

Angriff, bei dem gegen ein ML-Modell erzeugte adversarielle Beispiele auch andere, unbekannte Modelle taeuschen und so Black-Box-Angriffe ohne Zugriff auf das Ziel ermoeglichen.

Wie funktioniert Uebertragbarer Adversarialer Angriff?

Ein uebertragbarer adversarialer Angriff nutzt die von Papernot, McDaniel und Goodfellow systematisierte Beobachtung, dass gegen ein Modell erzeugte adversarielle Beispiele oft auch von anderen, auf aehnlichen Daten trainierten Modellen falsch klassifiziert werden. Der Angreifer trainiert lokal ein Ersatzmodell, erzeugt mit White-Box-Verfahren wie FGSM oder PGD adversarielle Eingaben und schickt sie an ein entferntes Black-Box-Ziel ohne internen Zugriff. Uebertragbarkeit wurde fuer Bildklassifikatoren, Malware-Detektoren, NLP-Modelle und kommerzielle Cloud-APIs gezeigt. Verteidigungen umfassen adversariales Training mit vielfaeltigen Stoerungen, Eingabetransformationen, Ensemble-Disagreement-Detektoren und zertifizierte Robustheitsverfahren wie randomized smoothing.

Wie schützt man sich gegen Uebertragbarer Adversarialer Angriff?

Schutzmaßnahmen gegen Uebertragbarer Adversarialer Angriff kombinieren typischerweise technische Kontrollen und operative Praktiken, wie in der Definition oben beschrieben.

Welche anderen Bezeichnungen gibt es für Uebertragbarer Adversarialer Angriff?

Übliche alternative Bezeichnungen: Modelluebergreifender Adversarial-Transfer, Black-Box-Transferangriff.

Verwandte Begriffe