Alucinação de IA
O que é Alucinação de IA?
Alucinação de IAModo de falha em que um sistema de IA generativa produz conteúdo fluente e confiante mas factualmente errado, inventado ou sem suporte nas suas fontes.
As alucinações resultam da natureza estatística dos modelos generativos, que preveem continuações plausíveis e não factos verificados. Incluem citações inventadas, parâmetros de API fictícios, processos judiciais inexistentes (como Mata v. Avianca em 2023), números CVE imaginados ou afirmações sem suporte em respostas RAG. Tornam-se um problema de segurança quando os utilizadores agem sobre a saída falsa: instalar um pacote npm "slopsquatted" inventado por um LLM, confiar em orientações jurídicas fabricadas ou escrever exploits sobre comportamentos imaginados. As mitigações incluem RAG com citações, saídas estruturadas, chamadas a ferramentas para consulta de factos, suites de avaliação (TruthfulQA, FActScore), abstenção calibrada e revisão humana em domínios críticos.
● Exemplos
- 01
Um LLM cita um processo judicial de 2023 inexistente, com números de processo inventados.
- 02
Um assistente de código recomenda um pacote npm nunca publicado, abrindo caminho ao typosquatting.
● Perguntas frequentes
O que é Alucinação de IA?
Modo de falha em que um sistema de IA generativa produz conteúdo fluente e confiante mas factualmente errado, inventado ou sem suporte nas suas fontes. Pertence à categoria Segurança de IA e ML da cibersegurança.
O que significa Alucinação de IA?
Modo de falha em que um sistema de IA generativa produz conteúdo fluente e confiante mas factualmente errado, inventado ou sem suporte nas suas fontes.
Como funciona Alucinação de IA?
As alucinações resultam da natureza estatística dos modelos generativos, que preveem continuações plausíveis e não factos verificados. Incluem citações inventadas, parâmetros de API fictícios, processos judiciais inexistentes (como Mata v. Avianca em 2023), números CVE imaginados ou afirmações sem suporte em respostas RAG. Tornam-se um problema de segurança quando os utilizadores agem sobre a saída falsa: instalar um pacote npm "slopsquatted" inventado por um LLM, confiar em orientações jurídicas fabricadas ou escrever exploits sobre comportamentos imaginados. As mitigações incluem RAG com citações, saídas estruturadas, chamadas a ferramentas para consulta de factos, suites de avaliação (TruthfulQA, FActScore), abstenção calibrada e revisão humana em domínios críticos.
Como se defender contra Alucinação de IA?
As defesas contra Alucinação de IA costumam combinar controles técnicos e práticas operacionais, conforme detalhado na definição acima.
Quais são outros nomes para Alucinação de IA?
Nomes alternativos comuns: Alucinação de LLM, Confabulação.
● Termos relacionados
- ai-security№ 898
Segurança RAG
Disciplina dedicada a proteger pipelines de retrieval-augmented generation para que os documentos, vector stores e passos de retrieval que alimentam um LLM não possam ser envenenados, abusados ou usados para exfiltrar dados.
- ai-security№ 033
Safety de IA
Disciplina que procura evitar que sistemas de IA causem danos não intencionais a utilizadores, operadores e à sociedade, abrangendo dimensões técnicas, operacionais e sociais.
- ai-security№ 026
Deteção de conteúdo gerado por IA
Ferramentas e técnicas que estimam se um texto, imagem, áudio ou vídeo foi produzido por um modelo de IA e não por um humano.
- ai-security№ 034
Risco de cadeia de fornecimento de IA
Conjunto de ameaças decorrentes dos datasets, modelos base, bibliotecas, plug-ins e infraestrutura de terceiros que as organizações combinam para construir e implementar sistemas de IA.
- ai-security№ 777
OWASP LLM Top 10
Lista mantida pela OWASP com os dez riscos de segurança mais críticos para aplicações construídas sobre grandes modelos de linguagem.
- ai-security№ 618
Guardrails de LLM
Mecanismos que limitam o que uma aplicação baseada em LLM pode receber ou produzir, aplicando regras de safety, segurança e negócio em torno do modelo subjacente.
● Veja também
- № 024Alinhamento de IA