Skip to content
Vol. 1 · Ed. 2026
CyberGlossary
Entry № 657

Ataques a MCP

¿Qué es Ataques a MCP?

Ataques a MCPAtaques que explotan el Model Context Protocol (MCP) para inyectar prompts, abusar de herramientas o pivotar a traves de servidores en los que confia el asistente de IA.


Los ataques MCP se dirigen al Model Context Protocol, un estandar abierto introducido por Anthropic que permite a los asistentes de IA conectarse a herramientas, fuentes de datos y aplicaciones externas mediante una interfaz comun. Dado que un servidor MCP puede exponer herramientas, recursos y prompts al modelo, un servidor malicioso o comprometido puede inyectar instrucciones ocultas, exfiltrar datos del usuario, solicitar llamadas peligrosas o redefinir herramientas despues de su aprobacion ('rug pull'). Tecnicas afines incluyen la contaminacion de descripciones de herramientas, ataques cross-server de confused deputy y la inyeccion de prompts mediante documentos devueltos. Las mitigaciones pasan por identidades de servidor firmadas y fijadas, permisos acotados, consentimiento explicito por llamada y aislamiento de los procesos del servidor MCP.

Ejemplos

  1. 01

    Un servidor MCP malicioso cambia la descripcion de una herramienta ya aprobada para exfiltrar correos en futuras llamadas.

  2. 02

    Un documento devuelto por un servidor MCP contiene instrucciones ocultas que ordenan al asistente enviar las claves API del usuario a un webhook del atacante.

Preguntas frecuentes

¿Qué es Ataques a MCP?

Ataques que explotan el Model Context Protocol (MCP) para inyectar prompts, abusar de herramientas o pivotar a traves de servidores en los que confia el asistente de IA. Pertenece a la categoría de Seguridad de IA y ML en ciberseguridad.

¿Qué significa Ataques a MCP?

Ataques que explotan el Model Context Protocol (MCP) para inyectar prompts, abusar de herramientas o pivotar a traves de servidores en los que confia el asistente de IA.

¿Cómo funciona Ataques a MCP?

Los ataques MCP se dirigen al Model Context Protocol, un estandar abierto introducido por Anthropic que permite a los asistentes de IA conectarse a herramientas, fuentes de datos y aplicaciones externas mediante una interfaz comun. Dado que un servidor MCP puede exponer herramientas, recursos y prompts al modelo, un servidor malicioso o comprometido puede inyectar instrucciones ocultas, exfiltrar datos del usuario, solicitar llamadas peligrosas o redefinir herramientas despues de su aprobacion ('rug pull'). Tecnicas afines incluyen la contaminacion de descripciones de herramientas, ataques cross-server de confused deputy y la inyeccion de prompts mediante documentos devueltos. Las mitigaciones pasan por identidades de servidor firmadas y fijadas, permisos acotados, consentimiento explicito por llamada y aislamiento de los procesos del servidor MCP.

¿Cómo defenderse de Ataques a MCP?

Las defensas contra Ataques a MCP combinan habitualmente controles técnicos y prácticas operativas, como se detalla en la definición.

¿Cuáles son otros nombres para Ataques a MCP?

Nombres alternativos comunes: Ataque al Model Context Protocol, Inyeccion en herramientas MCP.

Términos relacionados