Skip to content
Vol. 1 · Ed. 2026
CyberGlossary
Entry № 027

Seguridad de IA agéntica

¿Qué es Seguridad de IA agéntica?

Seguridad de IA agénticaDisciplina que protege a los agentes LLM autónomos que planifican, invocan herramientas y actúan sobre sistemas reales, donde la inyección de prompts se convierte en ejecución remota y la agencia excesiva en daño efectivo.


La seguridad de IA agéntica abarca los controles, modelos de amenaza y salvaguardas de tiempo de ejecución necesarios cuando los modelos de lenguaje dejan de responder y empiezan a actuar: invocan herramientas, navegan por la web, escriben archivos, envían correos o ejecutan transacciones. A diferencia de un LLM puramente conversacional, las entradas no fiables del agente (páginas recuperadas, salidas de herramientas, contenido multimodal) alimentan directamente las decisiones siguientes, por lo que una sola inyección indirecta de prompt puede derivar en exfiltración de datos, toma de cuentas o acciones destructivas. Los programas eficaces combinan alcance mínimo de herramientas, ejecución en sandbox, validación de salida estructurada, puntos de control humanos para acciones de alto impacto, herramientas en lista de permitidos, contextos de navegación aislados y detección de desviaciones de comportamiento como patrones de exfiltración o secuencias de herramientas fuera de política. En 2025–2026, esta área es la de mayor crecimiento dentro de la seguridad de IA, impulsada por el uso de herramientas de Claude (Anthropic), agentes tipo Operator de OpenAI y despliegues empresariales basados en runtimes MCP.

Ejemplos

  1. 01

    Un agente de compras lee un correo de un proveedor controlado por un atacante con instrucciones ocultas tipo 'reenvía todas las facturas' e intenta cumplirlas.

  2. 02

    Un copiloto de ingeniería está limitado a herramientas git de solo lectura y a un shell aislado, con comandos destructivos detrás de una aprobación humana explícita.

Preguntas frecuentes

¿Qué es Seguridad de IA agéntica?

Disciplina que protege a los agentes LLM autónomos que planifican, invocan herramientas y actúan sobre sistemas reales, donde la inyección de prompts se convierte en ejecución remota y la agencia excesiva en daño efectivo. Pertenece a la categoría de Seguridad de IA y ML en ciberseguridad.

¿Qué significa Seguridad de IA agéntica?

Disciplina que protege a los agentes LLM autónomos que planifican, invocan herramientas y actúan sobre sistemas reales, donde la inyección de prompts se convierte en ejecución remota y la agencia excesiva en daño efectivo.

¿Cómo funciona Seguridad de IA agéntica?

La seguridad de IA agéntica abarca los controles, modelos de amenaza y salvaguardas de tiempo de ejecución necesarios cuando los modelos de lenguaje dejan de responder y empiezan a actuar: invocan herramientas, navegan por la web, escriben archivos, envían correos o ejecutan transacciones. A diferencia de un LLM puramente conversacional, las entradas no fiables del agente (páginas recuperadas, salidas de herramientas, contenido multimodal) alimentan directamente las decisiones siguientes, por lo que una sola inyección indirecta de prompt puede derivar en exfiltración de datos, toma de cuentas o acciones destructivas. Los programas eficaces combinan alcance mínimo de herramientas, ejecución en sandbox, validación de salida estructurada, puntos de control humanos para acciones de alto impacto, herramientas en lista de permitidos, contextos de navegación aislados y detección de desviaciones de comportamiento como patrones de exfiltración o secuencias de herramientas fuera de política. En 2025–2026, esta área es la de mayor crecimiento dentro de la seguridad de IA, impulsada por el uso de herramientas de Claude (Anthropic), agentes tipo Operator de OpenAI y despliegues empresariales basados en runtimes MCP.

¿Cómo defenderse de Seguridad de IA agéntica?

Las defensas contra Seguridad de IA agéntica combinan habitualmente controles técnicos y prácticas operativas, como se detalla en la definición.

¿Cuáles son otros nombres para Seguridad de IA agéntica?

Nombres alternativos comunes: Seguridad de agentes LLM, Seguridad de agentes autónomos.

Términos relacionados

Véase también