一、引言:大语言模型安全挑战与越狱攻击概述 随着大语言模型(LLM)在自然语言处理、智能客服、内容生成等领域的广泛应用,其安全性问题日益凸显。越狱攻击作为一种通过精心设计提示(prompt)绕过模型安全限制的……