Entry № 744
メンバーシップ推論攻撃
メンバーシップ推論攻撃 とは何ですか?
メンバーシップ推論攻撃あるデータがモデルの学習セットに含まれていたかどうかを、モデルの挙動を解析することで判定するプライバシー攻撃。
メンバーシップ推論攻撃は Shokri ら(2017)によって体系化され、ML モデルが学習時に見たサンプルに対してより高い信頼度を示しがちであるという性質を突きます。攻撃者は候補サンプルで対象モデルにクエリを投げ、信頼度・損失・クラス別スコアを、類似データで訓練したシャドウモデルと比較してメンバーシップを推定します。API アクセスのみでも成立することが多くあります。本攻撃はより広範なプライバシー脅威の基盤で、ある人物の医療記録・写真・文書が学習に使われたかを確認できれば、GDPR、HIPAA、EU AI Act 等への抵触に直結します。対策には差分プライバシー、ドロップアウト等の正則化、出力の最小化、学習データの厳密な重複除去などがあります。
● 例
- 01
損失値の比較により、特定の患者の記録が病院の診断モデルの学習に使われたことを判定する。
- 02
メンバーシップ検査により、ある著作権付き書籍が LLM の事前学習コーパスに含まれていたかを特定する。
● よくある質問
メンバーシップ推論攻撃 とは何ですか?
あるデータがモデルの学習セットに含まれていたかどうかを、モデルの挙動を解析することで判定するプライバシー攻撃。 サイバーセキュリティの AI / ML セキュリティ カテゴリに属します。
メンバーシップ推論攻撃 とはどういう意味ですか?
あるデータがモデルの学習セットに含まれていたかどうかを、モデルの挙動を解析することで判定するプライバシー攻撃。
メンバーシップ推論攻撃 からどのように防御しますか?
メンバーシップ推論攻撃 に対する防御は通常、上記の定義で述べたとおり、技術的統制と運用上の実践を組み合わせます。
メンバーシップ推論攻撃 の別名は何ですか?
一般的な別名: MIA, 学習セット所属攻撃。