Question 1

トークンスマグリング とは何ですか?

Accepted Answer

安全フィルタが危険と認識しないエンコーディング・言語・トークン列の中に LLM 向けの有害な指示を隠す、一連のジェイルブレイク手法。 サイバーセキュリティの AI / ML セキュリティ カテゴリに属します。

Question 2

トークンスマグリング とはどういう意味ですか?

Accepted Answer

安全フィルタが危険と認識しないエンコーディング・言語・トークン列の中に LLM 向けの有害な指示を隠す、一連のジェイルブレイク手法。

Question 3

トークンスマグリング からどのように防御しますか?

Accepted Answer

トークンスマグリング に対する防御は通常、上記の定義で述べたとおり、技術的統制と運用上の実践を組み合わせます。

Question 4

トークンスマグリング の別名は何ですか?

Accepted Answer

一般的な別名: トークンスマグリング型ジェイルブレイク, 符号化型プロンプトインジェクション。

トークンスマグリング

トークンスマグリングとは何ですか?