Skip to content
Vol. 1 · Ed. 2026
CyberGlossary
Entry № 033

Safety de IA

O que é Safety de IA?

Safety de IADisciplina que procura evitar que sistemas de IA causem danos não intencionais a utilizadores, operadores e à sociedade, abrangendo dimensões técnicas, operacionais e sociais.


A AI safety é mais ampla do que a segurança tradicional: trata danos mesmo sem adversário, como acidentes, viés, engano, comportamento autónomo descontrolado, uso indevido de duplo uso e riscos catastróficos ou existenciais. Tecnicamente abrange alinhamento, interpretabilidade, avaliação, treino robusto, monitorização e elicitação de capacidades. Operacionalmente cobre políticas de escalonamento responsável, model cards, guardrails de implantação e controlos de acesso. Os AI Safety Institutes do Reino Unido e EUA, a AI Office europeia, o NIST (AI RMF) e os principais laboratórios publicam normas. É distinta mas profundamente sobreposta com a segurança de IA: modelos inseguros tendem a ser pouco safe, e vice-versa.

Exemplos

  1. 01

    Um fornecedor de LLM aplica uma política de escalonamento responsável que pausa o treino acima de um limiar de capacidades.

  2. 02

    Avaliar a capacidade de auto-replicação e auto-exfiltração de um modelo agêntico antes do lançamento público.

Perguntas frequentes

O que é Safety de IA?

Disciplina que procura evitar que sistemas de IA causem danos não intencionais a utilizadores, operadores e à sociedade, abrangendo dimensões técnicas, operacionais e sociais. Pertence à categoria Segurança de IA e ML da cibersegurança.

O que significa Safety de IA?

Disciplina que procura evitar que sistemas de IA causem danos não intencionais a utilizadores, operadores e à sociedade, abrangendo dimensões técnicas, operacionais e sociais.

Como funciona Safety de IA?

A AI safety é mais ampla do que a segurança tradicional: trata danos mesmo sem adversário, como acidentes, viés, engano, comportamento autónomo descontrolado, uso indevido de duplo uso e riscos catastróficos ou existenciais. Tecnicamente abrange alinhamento, interpretabilidade, avaliação, treino robusto, monitorização e elicitação de capacidades. Operacionalmente cobre políticas de escalonamento responsável, model cards, guardrails de implantação e controlos de acesso. Os AI Safety Institutes do Reino Unido e EUA, a AI Office europeia, o NIST (AI RMF) e os principais laboratórios publicam normas. É distinta mas profundamente sobreposta com a segurança de IA: modelos inseguros tendem a ser pouco safe, e vice-versa.

Como se defender contra Safety de IA?

As defesas contra Safety de IA costumam combinar controles técnicos e práticas operacionais, conforme detalhado na definição acima.

Quais são outros nomes para Safety de IA?

Nomes alternativos comuns: Safety de IA de fronteira, IA responsável.

Termos relacionados

Veja também