← 返回首页

标签: 对抗攻击 (1 篇)

对大语言模型的对抗攻击：挑战与应对

本文探讨了对大语言模型（LLM）的对抗攻击，包括攻击类型、威胁模型及其对生成文本安全性的影响，揭示了在AI安全性领域的重大挑战。

Lilian Weng · Wed, 25 Oct 2023 00:00:00 +0000