Skip to content
Vol. 1 · Ed. 2026
CyberGlossary
Entry № 027

Segurança de IA agêntica

O que é Segurança de IA agêntica?

Segurança de IA agênticaDisciplina que protege agentes LLM autónomos que planeiam, invocam ferramentas e atuam em sistemas reais, onde a injeção de prompt se transforma em execução remota e a agência excessiva em dano efetivo.


A segurança de IA agêntica abrange os controlos, modelos de ameaça e salvaguardas em tempo de execução necessários quando os grandes modelos de linguagem deixam de apenas responder e passam a agir: invocar ferramentas, navegar na web, escrever ficheiros, enviar emails ou executar transações. Ao contrário de um LLM puramente conversacional, as entradas não confiáveis do agente (páginas obtidas, saídas de ferramentas, conteúdo multimodal) alimentam diretamente as decisões seguintes, pelo que uma única injeção indireta de prompt pode resultar em exfiltração de dados, tomada de conta ou ações destrutivas. Os programas eficazes combinam alcance mínimo de ferramentas, execução em sandbox, validação de saída estruturada, pontos de controlo humanos para ações de elevado impacto, listas brancas de ferramentas, contextos de navegação isolados e deteção de desvios comportamentais como padrões de exfiltração ou sequências de ferramentas fora da política. Em 2025–2026, a segurança de IA agêntica é o segmento de crescimento mais rápido dentro da segurança de IA, impulsionada pelo uso de ferramentas do Claude (Anthropic), pelos agentes do tipo Operator da OpenAI e por implantações empresariais em runtimes baseados em MCP.

Exemplos

  1. 01

    Um agente de compras lê um email de fornecedor controlado por um atacante com instruções ocultas como 'reencaminha todas as faturas' e tenta cumpri-las.

  2. 02

    Um copiloto de engenharia está limitado a ferramentas git de leitura e a uma shell em sandbox, com comandos destrutivos dependentes de aprovação humana explícita.

Perguntas frequentes

O que é Segurança de IA agêntica?

Disciplina que protege agentes LLM autónomos que planeiam, invocam ferramentas e atuam em sistemas reais, onde a injeção de prompt se transforma em execução remota e a agência excessiva em dano efetivo. Pertence à categoria Segurança de IA e ML da cibersegurança.

O que significa Segurança de IA agêntica?

Disciplina que protege agentes LLM autónomos que planeiam, invocam ferramentas e atuam em sistemas reais, onde a injeção de prompt se transforma em execução remota e a agência excessiva em dano efetivo.

Como funciona Segurança de IA agêntica?

A segurança de IA agêntica abrange os controlos, modelos de ameaça e salvaguardas em tempo de execução necessários quando os grandes modelos de linguagem deixam de apenas responder e passam a agir: invocar ferramentas, navegar na web, escrever ficheiros, enviar emails ou executar transações. Ao contrário de um LLM puramente conversacional, as entradas não confiáveis do agente (páginas obtidas, saídas de ferramentas, conteúdo multimodal) alimentam diretamente as decisões seguintes, pelo que uma única injeção indireta de prompt pode resultar em exfiltração de dados, tomada de conta ou ações destrutivas. Os programas eficazes combinam alcance mínimo de ferramentas, execução em sandbox, validação de saída estruturada, pontos de controlo humanos para ações de elevado impacto, listas brancas de ferramentas, contextos de navegação isolados e deteção de desvios comportamentais como padrões de exfiltração ou sequências de ferramentas fora da política. Em 2025–2026, a segurança de IA agêntica é o segmento de crescimento mais rápido dentro da segurança de IA, impulsionada pelo uso de ferramentas do Claude (Anthropic), pelos agentes do tipo Operator da OpenAI e por implantações empresariais em runtimes baseados em MCP.

Como se defender contra Segurança de IA agêntica?

As defesas contra Segurança de IA agêntica costumam combinar controles técnicos e práticas operacionais, conforme detalhado na definição acima.

Quais são outros nomes para Segurança de IA agêntica?

Nomes alternativos comuns: Segurança de agentes LLM, Segurança de agentes autónomos.

Termos relacionados

Veja também