Skip to content
Vol. 1 · Ed. 2026
CyberGlossary
Entry № 376

Embedding-Angriffe

Was ist Embedding-Angriffe?

Embedding-AngriffeAngriffsklasse auf KI-Embedding-Vektoren, die das urspruengliche Input oder seine Semantik wiederherstellen, manipulieren oder missbrauchen — etwa Embedding Inversion und Similarity-Poisoning.


Embeddings sind dichte Vektorrepraesentationen von Text, Bild oder anderen Daten, die moderne KI-Systeme fuer Suche, Empfehlung und RAG nutzen. Lange galten sie als undurchsichtig, doch Forschung hat gezeigt, dass sie viel Information ueber den Quelltext preisgeben. Embedding-Inversion-Angriffe (etwa die Vec2Text-Familie) rekonstruieren den Originalsatz mit hoher Genauigkeit aus dem Vektor und brechen so Datenschutzannahmen fuer Chatbot-Logs, medizinische Notizen oder vertrauliche Dokumente in Vector Stores. Weitere Angriffe sind Similarity Poisoning — Eingaben, die Nearest-Neighbor-Resultate in einem RAG-Korpus kapern — sowie Membership-Inference gegen Embedding-Endpunkte. Verteidigung umfasst Verschluesselung at rest, Zugriffskontrolle fuer Similarity-Queries, Rate Limits, Dimensionsreduktion und das Behandeln von Embeddings als personenbezogene Daten.

Beispiele

  1. 01

    Forscher rekonstruieren mit Vec2Text mehr als 90 % des Satzinhalts aus OpenAI-Embeddings.

  2. 02

    Ein vergiftetes Dokument liegt im Vektorraum nahe gaengiger HR-Fragen und kapert die RAG-Antworten.

Häufige Fragen

Was ist Embedding-Angriffe?

Angriffsklasse auf KI-Embedding-Vektoren, die das urspruengliche Input oder seine Semantik wiederherstellen, manipulieren oder missbrauchen — etwa Embedding Inversion und Similarity-Poisoning. Es gehört zur Kategorie KI- und ML-Sicherheit der Cybersicherheit.

Was bedeutet Embedding-Angriffe?

Angriffsklasse auf KI-Embedding-Vektoren, die das urspruengliche Input oder seine Semantik wiederherstellen, manipulieren oder missbrauchen — etwa Embedding Inversion und Similarity-Poisoning.

Wie funktioniert Embedding-Angriffe?

Embeddings sind dichte Vektorrepraesentationen von Text, Bild oder anderen Daten, die moderne KI-Systeme fuer Suche, Empfehlung und RAG nutzen. Lange galten sie als undurchsichtig, doch Forschung hat gezeigt, dass sie viel Information ueber den Quelltext preisgeben. Embedding-Inversion-Angriffe (etwa die Vec2Text-Familie) rekonstruieren den Originalsatz mit hoher Genauigkeit aus dem Vektor und brechen so Datenschutzannahmen fuer Chatbot-Logs, medizinische Notizen oder vertrauliche Dokumente in Vector Stores. Weitere Angriffe sind Similarity Poisoning — Eingaben, die Nearest-Neighbor-Resultate in einem RAG-Korpus kapern — sowie Membership-Inference gegen Embedding-Endpunkte. Verteidigung umfasst Verschluesselung at rest, Zugriffskontrolle fuer Similarity-Queries, Rate Limits, Dimensionsreduktion und das Behandeln von Embeddings als personenbezogene Daten.

Wie schützt man sich gegen Embedding-Angriffe?

Schutzmaßnahmen gegen Embedding-Angriffe kombinieren typischerweise technische Kontrollen und operative Praktiken, wie in der Definition oben beschrieben.

Welche anderen Bezeichnungen gibt es für Embedding-Angriffe?

Übliche alternative Bezeichnungen: Embedding Inversion, Vec2Text-Angriff.

Verwandte Begriffe