一、研究背景与技术挑战 随着大语言模型(LLM)在智能客服、内容生成等领域的广泛应用,其安全性问题日益凸显。攻击者通过提示工程(Prompt Engineering)绕过模型的安全限制,诱导模型输出违规内容(如暴力、虚假……