Ataque Nightshade
¿Qué es Ataque Nightshade?
Ataque NightshadeTécnica de envenenamiento de datos desarrollada por el equipo Glaze de la Universidad de Chicago que añade perturbaciones imperceptibles a imágenes para que los modelos text-to-image entrenados con ellas aprendan conceptos profundamente distorsionados.
Publicado en 2023-2024 por Shan et al., Nightshade permite a los artistas reaccionar al raspado no autorizado de sus obras para entrenar IA generativa. Las imágenes perturbadas se ven iguales a un humano, pero al integrarse en un dataset llevan al modelo a asociar mal los conceptos: una imagen "perro" envenenada puede enseñar al modelo a dibujar gatos, o deformar estilos artísticos hasta hacerlos inutilizables. Pocas imágenes Nightshade bastan para degradar la calidad. Aunque se presenta como herramienta defensiva para creadores, técnicamente es un ataque de cadena de suministro contra corpus raspados, y ha impulsado más investigación en sourcing respetuoso con derechos, higiene de datasets, registros de opt-out y herramientas de procedencia en empresas como OpenAI, Stability o Adobe.
● Ejemplos
- 01
Un ilustrador publica imágenes de portfolio perturbadas con Nightshade para desincentivar su uso en corpus de entrenamiento.
- 02
Un modelo de difusión cuya calidad se degrada tras ingerir unas pocas miles de imágenes Nightshade de conceptos comunes.
● Preguntas frecuentes
¿Qué es Ataque Nightshade?
Técnica de envenenamiento de datos desarrollada por el equipo Glaze de la Universidad de Chicago que añade perturbaciones imperceptibles a imágenes para que los modelos text-to-image entrenados con ellas aprendan conceptos profundamente distorsionados. Pertenece a la categoría de Seguridad de IA y ML en ciberseguridad.
¿Qué significa Ataque Nightshade?
Técnica de envenenamiento de datos desarrollada por el equipo Glaze de la Universidad de Chicago que añade perturbaciones imperceptibles a imágenes para que los modelos text-to-image entrenados con ellas aprendan conceptos profundamente distorsionados.
¿Cómo funciona Ataque Nightshade?
Publicado en 2023-2024 por Shan et al., Nightshade permite a los artistas reaccionar al raspado no autorizado de sus obras para entrenar IA generativa. Las imágenes perturbadas se ven iguales a un humano, pero al integrarse en un dataset llevan al modelo a asociar mal los conceptos: una imagen "perro" envenenada puede enseñar al modelo a dibujar gatos, o deformar estilos artísticos hasta hacerlos inutilizables. Pocas imágenes Nightshade bastan para degradar la calidad. Aunque se presenta como herramienta defensiva para creadores, técnicamente es un ataque de cadena de suministro contra corpus raspados, y ha impulsado más investigación en sourcing respetuoso con derechos, higiene de datasets, registros de opt-out y herramientas de procedencia en empresas como OpenAI, Stability o Adobe.
¿Cómo defenderse de Ataque Nightshade?
Las defensas contra Ataque Nightshade combinan habitualmente controles técnicos y prácticas operativas, como se detalla en la definición.
¿Cuáles son otros nombres para Ataque Nightshade?
Nombres alternativos comunes: Envenenamiento Nightshade, Variante ofensiva de Glaze.
● Términos relacionados
- ai-security№ 281
Envenenamiento de datos
Ataque a un sistema de aprendizaje automático en el que el adversario inyecta, altera o reetiqueta datos de entrenamiento para que el modelo se comporte de forma incorrecta o contenga puertas traseras ocultas.
- ai-security№ 034
Riesgo de cadena de suministro de IA
Conjunto de amenazas derivadas de los datasets, modelos base, librerías, plug-ins e infraestructuras de terceros que las organizaciones combinan para construir y desplegar sistemas de IA.
- ai-security№ 035
Marca de agua de IA
Técnicas que insertan una señal detectable en el contenido generado por IA para verificar más tarde su procedencia, el modelo de origen o su pertenencia al entrenamiento.
- ai-security№ 027
Gobernanza de IA
Conjunto de políticas, procesos, roles y controles con los que organizaciones y reguladores garantizan que los sistemas de IA se desarrollan, despliegan y operan de forma responsable y legal.
- ai-security№ 1123
Medios sintéticos
Audio, imágenes, vídeos o texto producidos o modificados sustancialmente por IA generativa, en lugar de captados directamente del mundo físico.
- ai-security№ 026
Detección de contenido generado por IA
Herramientas y técnicas que estiman si un texto, imagen, audio o vídeo fue producido por un modelo de IA en lugar de un humano.