Skip to content
Vol. 1 · Ed. 2026
CyberGlossary
Entry № 033

Safety de l'IA

Qu'est-ce que Safety de l'IA ?

Safety de l'IADiscipline visant à éviter que les systèmes d'IA causent des préjudices non intentionnels aux utilisateurs, opérateurs et à la société, sur les plans technique, opérationnel et sociétal.


La AI safety est plus large que la sécurité classique : elle traite les dommages même en l'absence d'adversaire — accidents, biais, tromperie, comportements autonomes incontrôlés, usage dual ou détourné, risques catastrophiques voire existentiels. Le volet technique couvre alignement, interprétabilité, évaluation, entraînement robuste, supervision et élicitation des capacités. Côté opérationnel : politiques de mise à l'échelle responsable, model cards, guardrails de déploiement, contrôles d'accès. Les AI Safety Institutes britannique et américain, l'AI Office européen, le NIST (AI RMF) et les grands labs publient des référentiels. Distincte de la sécurité de l'IA, elle s'y recoupe profondément : un modèle non sécurisé est souvent non safe, et inversement.

Exemples

  1. 01

    Un fournisseur de LLM applique une politique de scaling responsable suspendant l'entraînement au-delà d'un seuil de capacités.

  2. 02

    Évaluer les capacités d'auto-réplication et d'auto-exfiltration d'un modèle agentique avant sa mise sur le marché.

Questions fréquentes

Qu'est-ce que Safety de l'IA ?

Discipline visant à éviter que les systèmes d'IA causent des préjudices non intentionnels aux utilisateurs, opérateurs et à la société, sur les plans technique, opérationnel et sociétal. Cette notion relève de la catégorie Sécurité de l'IA et du ML en cybersécurité.

Que signifie Safety de l'IA ?

Discipline visant à éviter que les systèmes d'IA causent des préjudices non intentionnels aux utilisateurs, opérateurs et à la société, sur les plans technique, opérationnel et sociétal.

Comment fonctionne Safety de l'IA ?

La AI safety est plus large que la sécurité classique : elle traite les dommages même en l'absence d'adversaire — accidents, biais, tromperie, comportements autonomes incontrôlés, usage dual ou détourné, risques catastrophiques voire existentiels. Le volet technique couvre alignement, interprétabilité, évaluation, entraînement robuste, supervision et élicitation des capacités. Côté opérationnel : politiques de mise à l'échelle responsable, model cards, guardrails de déploiement, contrôles d'accès. Les AI Safety Institutes britannique et américain, l'AI Office européen, le NIST (AI RMF) et les grands labs publient des référentiels. Distincte de la sécurité de l'IA, elle s'y recoupe profondément : un modèle non sécurisé est souvent non safe, et inversement.

Comment se défendre contre Safety de l'IA ?

Les défenses contre Safety de l'IA combinent habituellement des contrôles techniques et des pratiques opérationnelles, comme détaillé dans la définition ci-dessus.

Quels sont les autres noms de Safety de l'IA ?

Noms alternatifs courants : Safety de l'IA de frontière, IA responsable.

Termes liés

Voir aussi