Qu'est-ce que Fuite de System Prompt de LLM ? Signification, définition et exemples

Une fuite de system prompt survient quand un utilisateur amene une application LLM en production a reveler son prompt systeme cache, les instructions du developpeur ou le contexte associe (cles API, documentation interne, definitions d'outils). Les attaquants utilisent des demandes directes, des mises en scene de jeu de role, des astuces de traduction, l'obfuscation par encodage de caracteres, ou l'injection indirecte via des documents que le modele doit resumer. Meme partielles, ces fuites aident a retro-ingenier la logique metier, a trouver des contournements de guardrails et a concevoir des jailbreaks ou contenus d'ingenierie sociale sur mesure. Les mitigations consistent a traiter le system prompt comme donnee publique peu fiable, eliminer les secrets, appliquer des controles serveur, filtrer les sorties et instruire le modele de ne pas reveler ses instructions, tout en admettant qu'un attaquant determine y parvient souvent.

● Exemples

Un attaquant demande au chatbot de repeter, en blocs de code, tout ce qui precede son premier message utilisateur, devoilant le system prompt complet avec une cle API integree.

Un assistant de resume recoit un PDF malveillant qui lui ordonne de divulguer ses descriptions d'outils cachees, ce qu'il fait.

● Questions fréquentes

Qu'est-ce que Fuite de System Prompt de LLM ?

Attaque qui extrait le system prompt ou les instructions cachees d'une application LLM en production, devoilant logique, secrets et outils associes. Cette notion relève de la catégorie Sécurité de l'IA et du ML en cybersécurité.

Que signifie Fuite de System Prompt de LLM ?

Attaque qui extrait le system prompt ou les instructions cachees d'une application LLM en production, devoilant logique, secrets et outils associes.

Comment se défendre contre Fuite de System Prompt de LLM ?

Les défenses contre Fuite de System Prompt de LLM combinent habituellement des contrôles techniques et des pratiques opérationnelles, comme détaillé dans la définition ci-dessus.

Quels sont les autres noms de Fuite de System Prompt de LLM ?

Noms alternatifs courants : Extraction de system prompt, Exfiltration de prompt.