Alucinación de IA
¿Qué es Alucinación de IA?
Alucinación de IAModo de fallo en el que un sistema de IA generativa produce contenido fluido y confiado pero factualmente erróneo, inventado o sin respaldo en sus fuentes.
Las alucinaciones surgen de la naturaleza estadística de los modelos generativos, que predicen continuaciones plausibles más que hechos verificados. Incluyen citas inventadas, parámetros de API ficticios, casos judiciales inexistentes (como en el incidente Mata vs. Avianca de 2023), números CVE imaginados o afirmaciones sin sustento en respuestas RAG. Se convierten en problema de seguridad cuando alguien actúa sobre la salida falsa: instalar un paquete npm que un LLM "slopsquatted" inventó, confiar en orientaciones legales fabricadas o escribir exploits sobre comportamientos imaginados. Las mitigaciones incluyen RAG con citas, salidas estructuradas, llamadas a herramientas para datos factuales, suites de evaluación (TruthfulQA, FActScore), abstención calibrada y revisión humana en dominios críticos.
● Ejemplos
- 01
Un LLM que cita un caso judicial inexistente de 2023, con números de expediente inventados.
- 02
Un asistente de código recomienda un paquete npm nunca publicado, abriendo la puerta al typosquatting.
● Preguntas frecuentes
¿Qué es Alucinación de IA?
Modo de fallo en el que un sistema de IA generativa produce contenido fluido y confiado pero factualmente erróneo, inventado o sin respaldo en sus fuentes. Pertenece a la categoría de Seguridad de IA y ML en ciberseguridad.
¿Qué significa Alucinación de IA?
Modo de fallo en el que un sistema de IA generativa produce contenido fluido y confiado pero factualmente erróneo, inventado o sin respaldo en sus fuentes.
¿Cómo funciona Alucinación de IA?
Las alucinaciones surgen de la naturaleza estadística de los modelos generativos, que predicen continuaciones plausibles más que hechos verificados. Incluyen citas inventadas, parámetros de API ficticios, casos judiciales inexistentes (como en el incidente Mata vs. Avianca de 2023), números CVE imaginados o afirmaciones sin sustento en respuestas RAG. Se convierten en problema de seguridad cuando alguien actúa sobre la salida falsa: instalar un paquete npm que un LLM "slopsquatted" inventó, confiar en orientaciones legales fabricadas o escribir exploits sobre comportamientos imaginados. Las mitigaciones incluyen RAG con citas, salidas estructuradas, llamadas a herramientas para datos factuales, suites de evaluación (TruthfulQA, FActScore), abstención calibrada y revisión humana en dominios críticos.
¿Cómo defenderse de Alucinación de IA?
Las defensas contra Alucinación de IA combinan habitualmente controles técnicos y prácticas operativas, como se detalla en la definición.
¿Cuáles son otros nombres para Alucinación de IA?
Nombres alternativos comunes: Alucinación de LLM, Confabulación.
● Términos relacionados
- ai-security№ 898
Seguridad de RAG
Disciplina dedicada a proteger los pipelines de generación aumentada por recuperación para que los documentos, almacenes vectoriales y pasos de recuperación que alimentan al LLM no puedan envenenarse, abusarse ni filtrar datos.
- ai-security№ 033
Safety de IA
Disciplina que busca evitar que los sistemas de IA causen daños no intencionados a usuarios, operadores y sociedad, abarcando dimensiones técnicas, operativas y sociales.
- ai-security№ 026
Detección de contenido generado por IA
Herramientas y técnicas que estiman si un texto, imagen, audio o vídeo fue producido por un modelo de IA en lugar de un humano.
- ai-security№ 034
Riesgo de cadena de suministro de IA
Conjunto de amenazas derivadas de los datasets, modelos base, librerías, plug-ins e infraestructuras de terceros que las organizaciones combinan para construir y desplegar sistemas de IA.
- ai-security№ 777
OWASP LLM Top 10
Lista mantenida por OWASP con los diez riesgos de seguridad más críticos para aplicaciones construidas sobre grandes modelos de lenguaje.
- ai-security№ 618
Guardrails de LLM
Mecanismos que restringen lo que una aplicación basada en LLM puede recibir o emitir, aplicando reglas de safety, seguridad y negocio alrededor del modelo subyacente.
● Véase también
- № 024Alineamiento de IA