Agencia excesiva
¿Qué es Agencia excesiva?
Agencia excesivaOWASP LLM06: dar a un sistema basado en LLM más funcionalidad, permisos o autonomía de los que realmente necesita, de modo que una inyección de prompt o un error del modelo se traduzca en un impacto real desproporcionado.
La agencia excesiva es el ítem LLM06 del OWASP Top 10 para aplicaciones de modelos de lenguaje. Describe la clase de daños que aparecen cuando un sistema basado en LLM recibe más herramientas, permisos más amplios o mayor autonomía de los que su caso de uso justifica — por ejemplo, un agente de soporte con permisos de escritura en la API de facturación de producción, o un asistente de código que puede leer repositorios y a la vez hacer push a main sin revisión. La vulnerabilidad no está en el modelo, sino en el sistema que lo rodea: cuando el agente acaba siendo subvertido (por inyección de prompt, alucinación o simplemente un mal día), el área de impacto la define lo que se le ha permitido hacer. Las mitigaciones siguen el principio de mínimo privilegio: acotar cada herramienta a los datos y acciones mínimos necesarios, exigir aprobación humana para operaciones irreversibles, preferir herramientas de solo lectura o en entornos de staging, separar los modelos de planificación y ejecución, e instrumentar las llamadas para que secuencias anómalas afloren en detección.
● Ejemplos
- 01
Una herramienta de triaje de tickets basada en LLM tiene admin total en el CRM y termina modificando masivamente registros de clientes tras una inyección de prompt en un correo de soporte.
- 02
Un agente de programación está limitado a abrir pull requests en lugar de hacer push directo a main, de modo que una sugerencia mala queda revisable y no llega a producción.
● Preguntas frecuentes
¿Qué es Agencia excesiva?
OWASP LLM06: dar a un sistema basado en LLM más funcionalidad, permisos o autonomía de los que realmente necesita, de modo que una inyección de prompt o un error del modelo se traduzca en un impacto real desproporcionado. Pertenece a la categoría de Seguridad de IA y ML en ciberseguridad.
¿Qué significa Agencia excesiva?
OWASP LLM06: dar a un sistema basado en LLM más funcionalidad, permisos o autonomía de los que realmente necesita, de modo que una inyección de prompt o un error del modelo se traduzca en un impacto real desproporcionado.
¿Cómo funciona Agencia excesiva?
La agencia excesiva es el ítem LLM06 del OWASP Top 10 para aplicaciones de modelos de lenguaje. Describe la clase de daños que aparecen cuando un sistema basado en LLM recibe más herramientas, permisos más amplios o mayor autonomía de los que su caso de uso justifica — por ejemplo, un agente de soporte con permisos de escritura en la API de facturación de producción, o un asistente de código que puede leer repositorios y a la vez hacer push a main sin revisión. La vulnerabilidad no está en el modelo, sino en el sistema que lo rodea: cuando el agente acaba siendo subvertido (por inyección de prompt, alucinación o simplemente un mal día), el área de impacto la define lo que se le ha permitido hacer. Las mitigaciones siguen el principio de mínimo privilegio: acotar cada herramienta a los datos y acciones mínimos necesarios, exigir aprobación humana para operaciones irreversibles, preferir herramientas de solo lectura o en entornos de staging, separar los modelos de planificación y ejecución, e instrumentar las llamadas para que secuencias anómalas afloren en detección.
¿Cómo defenderse de Agencia excesiva?
Las defensas contra Agencia excesiva combinan habitualmente controles técnicos y prácticas operativas, como se detalla en la definición.
¿Cuáles son otros nombres para Agencia excesiva?
Nombres alternativos comunes: LLM06, Agente de IA con privilegios excesivos.
● Términos relacionados
- ai-security№ 870
OWASP LLM Top 10
Lista mantenida por OWASP con los diez riesgos de seguridad más críticos para aplicaciones construidas sobre grandes modelos de lenguaje.
- ai-security№ 027
Seguridad de IA agéntica
Disciplina que protege a los agentes LLM autónomos que planifican, invocan herramientas y actúan sobre sistemas reales, donde la inyección de prompts se convierte en ejecución remota y la agencia excesiva en daño efectivo.
- identity-access№ 955
Principio de mínimo privilegio
Principio de seguridad que otorga a cada usuario, proceso o servicio sólo los privilegios mínimos imprescindibles para cumplir su función.
- ai-security№ 689
Guardrails de LLM
Mecanismos que restringen lo que una aplicación basada en LLM puede recibir o emitir, aplicando reglas de safety, seguridad y negocio alrededor del modelo subyacente.
- ai-security№ 969
Inyección de prompts
Ataque que anula las instrucciones originales de un LLM al introducir texto adversarial en el prompt, haciendo que el modelo ignore sus salvaguardas o ejecute acciones del atacante.
- ai-security№ 1285
Tool-Use Injection
Attacks that manipulate an LLM agent's tool-calling layer — forging tool arguments, smuggling instructions through tool outputs, or coaxing the model into calling unsanctioned tools.