KI-Halluzination
Was ist KI-Halluzination?
KI-HalluzinationFehlermodus, bei dem ein generatives KI-System flüssige, selbstbewusste Ausgaben erzeugt, die jedoch faktisch falsch, frei erfunden oder durch die Quellen nicht gedeckt sind.
Halluzinationen ergeben sich aus der statistischen Natur generativer Modelle: Sie sagen plausible Fortsetzungen voraus, keine verifizierten Fakten. Dazu zählen erfundene Zitate, fiktive API-Parameter, nicht existente Gerichtsverfahren (etwa Mata v. Avianca, 2023), halluzinierte CVE-Nummern oder unbelegte Aussagen in RAG-Antworten. Sicherheitskritisch werden sie, sobald Anwender auf falsche Ausgaben reagieren — etwa ein vom LLM "slopsquatted" erfundenes npm-Paket installieren, einer erfundenen Rechtsauskunft folgen oder Exploit-Code auf imaginierten Verhalten aufbauen. Schutz bieten RAG mit Quellenangaben, strukturierte Ausgaben, Tool-Aufrufe für Faktenchecks, Evaluations-Suiten (TruthfulQA, FActScore), kalibrierte Enthaltung und menschliche Review in Hochrisikobereichen.
● Beispiele
- 01
Ein LLM zitiert einen nicht existenten Gerichtsfall von 2023 inklusive erfundener Aktenzeichen.
- 02
Ein Coding-Assistent empfiehlt einen npm-Paketnamen, den es nie gab, und öffnet damit Typosquatting Tür und Tor.
● Häufige Fragen
Was ist KI-Halluzination?
Fehlermodus, bei dem ein generatives KI-System flüssige, selbstbewusste Ausgaben erzeugt, die jedoch faktisch falsch, frei erfunden oder durch die Quellen nicht gedeckt sind. Es gehört zur Kategorie KI- und ML-Sicherheit der Cybersicherheit.
Was bedeutet KI-Halluzination?
Fehlermodus, bei dem ein generatives KI-System flüssige, selbstbewusste Ausgaben erzeugt, die jedoch faktisch falsch, frei erfunden oder durch die Quellen nicht gedeckt sind.
Wie funktioniert KI-Halluzination?
Halluzinationen ergeben sich aus der statistischen Natur generativer Modelle: Sie sagen plausible Fortsetzungen voraus, keine verifizierten Fakten. Dazu zählen erfundene Zitate, fiktive API-Parameter, nicht existente Gerichtsverfahren (etwa Mata v. Avianca, 2023), halluzinierte CVE-Nummern oder unbelegte Aussagen in RAG-Antworten. Sicherheitskritisch werden sie, sobald Anwender auf falsche Ausgaben reagieren — etwa ein vom LLM "slopsquatted" erfundenes npm-Paket installieren, einer erfundenen Rechtsauskunft folgen oder Exploit-Code auf imaginierten Verhalten aufbauen. Schutz bieten RAG mit Quellenangaben, strukturierte Ausgaben, Tool-Aufrufe für Faktenchecks, Evaluations-Suiten (TruthfulQA, FActScore), kalibrierte Enthaltung und menschliche Review in Hochrisikobereichen.
Wie schützt man sich gegen KI-Halluzination?
Schutzmaßnahmen gegen KI-Halluzination kombinieren typischerweise technische Kontrollen und operative Praktiken, wie in der Definition oben beschrieben.
Welche anderen Bezeichnungen gibt es für KI-Halluzination?
Übliche alternative Bezeichnungen: LLM-Halluzination, Konfabulation.
● Verwandte Begriffe
- ai-security№ 898
RAG-Security
Disziplin zur Absicherung von Retrieval-Augmented-Generation-Pipelines, sodass die Dokumente, Vector Stores und Retrieval-Schritte, die ein LLM speisen, nicht vergiftet, missbraucht oder zur Datenexfiltration genutzt werden können.
- ai-security№ 033
KI-Safety
Disziplin, die unbeabsichtigte Schäden von KI-Systemen für Nutzer, Betreiber und Gesellschaft verhindern soll und technische, operative wie gesellschaftliche Aspekte umfasst.
- ai-security№ 026
Erkennung KI-generierter Inhalte
Werkzeuge und Techniken, die abschätzen, ob ein Text, Bild, Audio oder Video von einem KI-Modell statt von einem Menschen erzeugt wurde.
- ai-security№ 034
AI-Supply-Chain-Risiko
Summe der Bedrohungen aus Drittanbieter-Datensätzen, Basismodellen, Bibliotheken, Plug-ins und Infrastruktur, die Organisationen zum Bau und Betrieb von KI-Systemen kombinieren.
- ai-security№ 777
OWASP LLM Top 10
Von OWASP gepflegte Liste der zehn kritischsten Sicherheitsrisiken für Anwendungen, die auf großen Sprachmodellen aufbauen.
- ai-security№ 618
LLM-Guardrails
Mechanismen, die einschränken, was eine LLM-basierte Anwendung empfangen oder ausgeben darf, und damit Safety-, Sicherheits- und Geschäftsregeln rund um das zugrunde liegende Modell durchsetzen.
● Siehe auch
- № 024KI-Alignment