Skip to content
Vol. 1 · Ed. 2026
CyberGlossary
Entry № 393

Ataque de evasión (ML)

¿Qué es Ataque de evasión (ML)?

Ataque de evasión (ML)Ataque en tiempo de inferencia en el que el adversario crea entradas que evaden la decisión prevista de un modelo desplegado, como un clasificador de malware o un filtro de contenido.


Los ataques de evasión actúan tras el entrenamiento y despliegue: el atacante no toca el pipeline de entrenamiento, sino que manipula las consultas para esquivar la detección. La mayoría emplean ejemplos adversariales, pero la familia también incluye tácticas más simples como malware polimórfico, ofuscación de caracteres contra moderación de texto, clonado de voz contra verificación de locutor o transformaciones frente al hashing perceptual. El informe NIST AI 100-2 clasifica la evasión como una de las cuatro grandes amenazas ML junto al envenenamiento, la privacidad y el abuso. Las defensas incluyen entrenamiento adversarial, ingeniería de características robusta, detección multimodal o por ensembles, sanitización de entradas en tiempo de ejecución, telemetría de drift y controles estrictos sobre las APIs.

Ejemplos

  1. 01

    Malware ofuscado que un clasificador ML estático considera benigno pero que ejecuta su payload.

  2. 02

    Texto con homoglifos que esquiva un clasificador de toxicidad aunque para una persona luzca idéntico.

Preguntas frecuentes

¿Qué es Ataque de evasión (ML)?

Ataque en tiempo de inferencia en el que el adversario crea entradas que evaden la decisión prevista de un modelo desplegado, como un clasificador de malware o un filtro de contenido. Pertenece a la categoría de Seguridad de IA y ML en ciberseguridad.

¿Qué significa Ataque de evasión (ML)?

Ataque en tiempo de inferencia en el que el adversario crea entradas que evaden la decisión prevista de un modelo desplegado, como un clasificador de malware o un filtro de contenido.

¿Cómo funciona Ataque de evasión (ML)?

Los ataques de evasión actúan tras el entrenamiento y despliegue: el atacante no toca el pipeline de entrenamiento, sino que manipula las consultas para esquivar la detección. La mayoría emplean ejemplos adversariales, pero la familia también incluye tácticas más simples como malware polimórfico, ofuscación de caracteres contra moderación de texto, clonado de voz contra verificación de locutor o transformaciones frente al hashing perceptual. El informe NIST AI 100-2 clasifica la evasión como una de las cuatro grandes amenazas ML junto al envenenamiento, la privacidad y el abuso. Las defensas incluyen entrenamiento adversarial, ingeniería de características robusta, detección multimodal o por ensembles, sanitización de entradas en tiempo de ejecución, telemetría de drift y controles estrictos sobre las APIs.

¿Cómo defenderse de Ataque de evasión (ML)?

Las defensas contra Ataque de evasión (ML) combinan habitualmente controles técnicos y prácticas operativas, como se detalla en la definición.

¿Cuáles son otros nombres para Ataque de evasión (ML)?

Nombres alternativos comunes: Ataque en inferencia, Evasión de modelo.

Términos relacionados