Model Context Protocol (MCP)
O que é Model Context Protocol (MCP)?
Model Context Protocol (MCP)Protocolo aberto introduzido pela Anthropic no final de 2024 que normaliza como clientes LLM se ligam a ferramentas, fontes de dados e prompts externos através de servidores, transformando os servidores MCP numa fronteira de segurança crítica para a IA agêntica.
O Model Context Protocol (MCP) é uma especificação aberta lançada pela primeira vez pela Anthropic em novembro de 2024, rapidamente adotada pela indústria como forma padrão de ligar clientes LLM (Claude Desktop, Claude Code, IDEs, runtimes de agentes) a capacidades externas. Um servidor MCP expõe um conjunto tipado de ferramentas, recursos e prompts, enquanto um cliente MCP medeia com que servidores o modelo pode comunicar e de que forma. Do ponto de vista de segurança, os servidores MCP concentram três poderes de elevado risco num mesmo ponto: leitura de dados sensíveis (bases de dados, ficheiros, Slack, Drive), efeitos colaterais (APIs de escrita, deploys, pagamentos) e injeção de texto diretamente na janela de contexto do modelo. Isto faz do MCP uma superfície de ataque central para a IA agêntica: servidores MCP maliciosos, envenenamento de ferramentas, injeção indireta de prompts via conteúdo devolvido, prompts de consentimento demasiado abrangentes e falta de âmbitos finos de capacidade são preocupações reais. Boas práticas incluem catálogos assinados ou curados de servidores, âmbitos de capacidade por ferramenta, aprovação humana para ferramentas de escrita, sanitização de saída e tratar como não confiável qualquer servidor MCP que não tenha escrito.
● Exemplos
- 01
O Claude Desktop liga-se a um servidor MCP local de 'sistema de ficheiros' que expõe ferramentas de leitura/escrita limitadas a um diretório de projeto específico.
- 02
Um atacante publica um servidor MCP de terceiros que exfiltra silenciosamente os documentos obtidos para um endpoint remoto quando integrado na cadeia de ferramentas de um agente.
● Perguntas frequentes
O que é Model Context Protocol (MCP)?
Protocolo aberto introduzido pela Anthropic no final de 2024 que normaliza como clientes LLM se ligam a ferramentas, fontes de dados e prompts externos através de servidores, transformando os servidores MCP numa fronteira de segurança crítica para a IA agêntica. Pertence à categoria Segurança de IA e ML da cibersegurança.
O que significa Model Context Protocol (MCP)?
Protocolo aberto introduzido pela Anthropic no final de 2024 que normaliza como clientes LLM se ligam a ferramentas, fontes de dados e prompts externos através de servidores, transformando os servidores MCP numa fronteira de segurança crítica para a IA agêntica.
Como funciona Model Context Protocol (MCP)?
O Model Context Protocol (MCP) é uma especificação aberta lançada pela primeira vez pela Anthropic em novembro de 2024, rapidamente adotada pela indústria como forma padrão de ligar clientes LLM (Claude Desktop, Claude Code, IDEs, runtimes de agentes) a capacidades externas. Um servidor MCP expõe um conjunto tipado de ferramentas, recursos e prompts, enquanto um cliente MCP medeia com que servidores o modelo pode comunicar e de que forma. Do ponto de vista de segurança, os servidores MCP concentram três poderes de elevado risco num mesmo ponto: leitura de dados sensíveis (bases de dados, ficheiros, Slack, Drive), efeitos colaterais (APIs de escrita, deploys, pagamentos) e injeção de texto diretamente na janela de contexto do modelo. Isto faz do MCP uma superfície de ataque central para a IA agêntica: servidores MCP maliciosos, envenenamento de ferramentas, injeção indireta de prompts via conteúdo devolvido, prompts de consentimento demasiado abrangentes e falta de âmbitos finos de capacidade são preocupações reais. Boas práticas incluem catálogos assinados ou curados de servidores, âmbitos de capacidade por ferramenta, aprovação humana para ferramentas de escrita, sanitização de saída e tratar como não confiável qualquer servidor MCP que não tenha escrito.
Como se defender contra Model Context Protocol (MCP)?
As defesas contra Model Context Protocol (MCP) costumam combinar controles técnicos e práticas operacionais, conforme detalhado na definição acima.
Quais são outros nomes para Model Context Protocol (MCP)?
Nomes alternativos comuns: MCP, Protocolo MCP.
● Termos relacionados
- ai-security№ 731
Ataques a MCP
Ataques que exploram o Model Context Protocol (MCP) para injetar prompts, abusar de ferramentas ou pivotar por servidores em que o assistente de IA confia.
- ai-security№ 027
Segurança de IA agêntica
Disciplina que protege agentes LLM autónomos que planeiam, invocam ferramentas e atuam em sistemas reais, onde a injeção de prompt se transforma em execução remota e a agência excessiva em dano efetivo.
- ai-security№ 1285
Tool-Use Injection
Attacks that manipulate an LLM agent's tool-calling layer — forging tool arguments, smuggling instructions through tool outputs, or coaxing the model into calling unsanctioned tools.
- ai-security№ 586
Injeção indireta de prompt
Variante da injeção de prompt em que instruções maliciosas são escondidas em conteúdo de terceiros (páginas, documentos, e-mails) que o LLM consome depois via recuperação, navegação ou uso de ferramentas.
- ai-security№ 969
Injeção de prompt
Ataque que sobrepõe as instruções originais de um LLM ao inserir texto adversarial no prompt, fazendo com que o modelo ignore salvaguardas ou execute ações escolhidas pelo atacante.
- ai-security№ 689
Guardrails de LLM
Mecanismos que limitam o que uma aplicação baseada em LLM pode receber ou produzir, aplicando regras de safety, segurança e negócio em torno do modelo subjacente.