Model Context Protocol (MCP)
¿Qué es Model Context Protocol (MCP)?
Model Context Protocol (MCP)Protocolo abierto presentado por Anthropic a finales de 2024 que estandariza cómo los clientes LLM se conectan a herramientas, datos y prompts externos mediante servidores, convirtiendo a los servidores MCP en una frontera de seguridad clave para la IA agéntica.
Model Context Protocol (MCP) es una especificación abierta publicada por primera vez por Anthropic en noviembre de 2024, adoptada rápidamente por la industria como forma estándar de conectar clientes LLM (Claude Desktop, Claude Code, IDEs, runtimes de agentes) con capacidades externas. Un servidor MCP expone un conjunto tipado de herramientas, recursos y prompts, mientras que un cliente MCP media qué servidores puede usar el modelo y cómo. Desde el punto de vista de seguridad, los servidores MCP concentran tres poderes de alto riesgo en un mismo lugar: pueden leer datos sensibles (bases de datos, archivos, Slack, Drive), provocar efectos secundarios (APIs de escritura, despliegues, pagos) e inyectar texto directamente en el contexto del modelo. Eso convierte a MCP en una superficie de ataque prioritaria para la IA agéntica: servidores MCP maliciosos, envenenamiento de herramientas, inyección indirecta de prompts vía contenido devuelto, prompts de consentimiento demasiado amplios y falta de control fino de capacidades son preocupaciones reales. Las buenas prácticas incluyen catálogos firmados o curados de servidores, alcances de capacidad por herramienta, aprobación humana para herramientas de escritura, saneamiento de salida y tratar como no fiable cualquier servidor MCP que no hayas escrito.
● Ejemplos
- 01
Claude Desktop se conecta a un servidor MCP local de 'sistema de ficheros' que expone herramientas de lectura/escritura limitadas a un directorio de proyecto concreto.
- 02
Un atacante publica un servidor MCP de terceros que exfiltra silenciosamente los documentos recuperados a un endpoint remoto al integrarse en la cadena de herramientas de un agente.
● Preguntas frecuentes
¿Qué es Model Context Protocol (MCP)?
Protocolo abierto presentado por Anthropic a finales de 2024 que estandariza cómo los clientes LLM se conectan a herramientas, datos y prompts externos mediante servidores, convirtiendo a los servidores MCP en una frontera de seguridad clave para la IA agéntica. Pertenece a la categoría de Seguridad de IA y ML en ciberseguridad.
¿Qué significa Model Context Protocol (MCP)?
Protocolo abierto presentado por Anthropic a finales de 2024 que estandariza cómo los clientes LLM se conectan a herramientas, datos y prompts externos mediante servidores, convirtiendo a los servidores MCP en una frontera de seguridad clave para la IA agéntica.
¿Cómo funciona Model Context Protocol (MCP)?
Model Context Protocol (MCP) es una especificación abierta publicada por primera vez por Anthropic en noviembre de 2024, adoptada rápidamente por la industria como forma estándar de conectar clientes LLM (Claude Desktop, Claude Code, IDEs, runtimes de agentes) con capacidades externas. Un servidor MCP expone un conjunto tipado de herramientas, recursos y prompts, mientras que un cliente MCP media qué servidores puede usar el modelo y cómo. Desde el punto de vista de seguridad, los servidores MCP concentran tres poderes de alto riesgo en un mismo lugar: pueden leer datos sensibles (bases de datos, archivos, Slack, Drive), provocar efectos secundarios (APIs de escritura, despliegues, pagos) e inyectar texto directamente en el contexto del modelo. Eso convierte a MCP en una superficie de ataque prioritaria para la IA agéntica: servidores MCP maliciosos, envenenamiento de herramientas, inyección indirecta de prompts vía contenido devuelto, prompts de consentimiento demasiado amplios y falta de control fino de capacidades son preocupaciones reales. Las buenas prácticas incluyen catálogos firmados o curados de servidores, alcances de capacidad por herramienta, aprobación humana para herramientas de escritura, saneamiento de salida y tratar como no fiable cualquier servidor MCP que no hayas escrito.
¿Cómo defenderse de Model Context Protocol (MCP)?
Las defensas contra Model Context Protocol (MCP) combinan habitualmente controles técnicos y prácticas operativas, como se detalla en la definición.
¿Cuáles son otros nombres para Model Context Protocol (MCP)?
Nombres alternativos comunes: MCP, Protocolo MCP.
● Términos relacionados
- ai-security№ 731
Ataques a MCP
Ataques que explotan el Model Context Protocol (MCP) para inyectar prompts, abusar de herramientas o pivotar a traves de servidores en los que confia el asistente de IA.
- ai-security№ 027
Seguridad de IA agéntica
Disciplina que protege a los agentes LLM autónomos que planifican, invocan herramientas y actúan sobre sistemas reales, donde la inyección de prompts se convierte en ejecución remota y la agencia excesiva en daño efectivo.
- ai-security№ 1285
Tool-Use Injection
Attacks that manipulate an LLM agent's tool-calling layer — forging tool arguments, smuggling instructions through tool outputs, or coaxing the model into calling unsanctioned tools.
- ai-security№ 586
Inyección indirecta de prompts
Variante de inyección de prompts en la que las instrucciones maliciosas se ocultan en contenido de terceros (páginas, documentos, correos) que el LLM consume posteriormente mediante recuperación, navegación o herramientas.
- ai-security№ 969
Inyección de prompts
Ataque que anula las instrucciones originales de un LLM al introducir texto adversarial en el prompt, haciendo que el modelo ignore sus salvaguardas o ejecute acciones del atacante.
- ai-security№ 689
Guardrails de LLM
Mecanismos que restringen lo que una aplicación basada en LLM puede recibir o emitir, aplicando reglas de safety, seguridad y negocio alrededor del modelo subyacente.