Attaque Nightshade
Qu'est-ce que Attaque Nightshade ?
Attaque NightshadeTechnique d'empoisonnement de données conçue par l'équipe Glaze de l'Université de Chicago, qui ajoute des perturbations imperceptibles aux images afin que les modèles text-to-image entraînés dessus apprennent des concepts profondément déformés.
Publié en 2023-2024 par Shan et al., Nightshade permet aux artistes de riposter face au scraping non autorisé de leurs œuvres pour l'entraînement d'IA générative. Les images perturbées semblent identiques pour l'humain, mais intégrées à un dataset, elles poussent le modèle à mal associer les concepts : une image étiquetée "chien" empoisonnée peut amener le modèle à dessiner des chats, ou déformer des styles artistiques jusqu'à les rendre inutilisables. Quelques milliers d'images suffisent à dégrader la qualité. Présenté comme un outil défensif pour créateurs, Nightshade est techniquement une attaque de chaîne d'approvisionnement contre les corpus scrapés, et a stimulé la recherche sur les datasets respectueux du droit d'auteur, l'hygiène des données, les registres d'opt-out et la provenance chez OpenAI, Stability, Adobe et d'autres.
● Exemples
- 01
Un illustrateur publie son portfolio avec des images perturbées par Nightshade pour dissuader leur intégration dans des corpus.
- 02
Un modèle de diffusion dont la qualité s'effondre après ingestion de quelques milliers d'images Nightshade portant sur des concepts courants.
● Questions fréquentes
Qu'est-ce que Attaque Nightshade ?
Technique d'empoisonnement de données conçue par l'équipe Glaze de l'Université de Chicago, qui ajoute des perturbations imperceptibles aux images afin que les modèles text-to-image entraînés dessus apprennent des concepts profondément déformés. Cette notion relève de la catégorie Sécurité de l'IA et du ML en cybersécurité.
Que signifie Attaque Nightshade ?
Technique d'empoisonnement de données conçue par l'équipe Glaze de l'Université de Chicago, qui ajoute des perturbations imperceptibles aux images afin que les modèles text-to-image entraînés dessus apprennent des concepts profondément déformés.
Comment fonctionne Attaque Nightshade ?
Publié en 2023-2024 par Shan et al., Nightshade permet aux artistes de riposter face au scraping non autorisé de leurs œuvres pour l'entraînement d'IA générative. Les images perturbées semblent identiques pour l'humain, mais intégrées à un dataset, elles poussent le modèle à mal associer les concepts : une image étiquetée "chien" empoisonnée peut amener le modèle à dessiner des chats, ou déformer des styles artistiques jusqu'à les rendre inutilisables. Quelques milliers d'images suffisent à dégrader la qualité. Présenté comme un outil défensif pour créateurs, Nightshade est techniquement une attaque de chaîne d'approvisionnement contre les corpus scrapés, et a stimulé la recherche sur les datasets respectueux du droit d'auteur, l'hygiène des données, les registres d'opt-out et la provenance chez OpenAI, Stability, Adobe et d'autres.
Comment se défendre contre Attaque Nightshade ?
Les défenses contre Attaque Nightshade combinent habituellement des contrôles techniques et des pratiques opérationnelles, comme détaillé dans la définition ci-dessus.
Quels sont les autres noms de Attaque Nightshade ?
Noms alternatifs courants : Empoisonnement Nightshade, Variante offensive de Glaze.
● Termes liés
- ai-security№ 281
Empoisonnement de données
Attaque contre un système d'apprentissage automatique dans laquelle l'adversaire injecte, modifie ou réétiquette des données d'entraînement pour que le modèle résultant se comporte mal ou contienne des portes dérobées cachées.
- ai-security№ 034
Risque de chaîne d'approvisionnement IA
Ensemble de menaces issues des datasets, modèles de base, bibliothèques, plug-ins et infrastructures tiers que les organisations combinent pour construire et déployer des systèmes d'IA.
- ai-security№ 035
Watermarking d'IA
Techniques qui intègrent un signal détectable dans des contenus générés par IA afin de vérifier ultérieurement leur provenance, leur modèle d'origine ou leur appartenance à un jeu d'entraînement.
- ai-security№ 027
Gouvernance de l'IA
Ensemble de politiques, processus, rôles et contrôles qu'organisations et régulateurs mobilisent pour garantir un développement, un déploiement et une exploitation responsables et conformes des systèmes d'IA.
- ai-security№ 1123
Médias synthétiques
Tout contenu audio, image, vidéo ou texte produit ou modifié de manière substantielle par une IA générative plutôt que capté directement dans le monde physique.
- ai-security№ 026
Détection de contenus générés par IA
Outils et techniques qui estiment si un texte, une image, un audio ou une vidéo a été produit par un modèle d'IA plutôt que par un humain.