一、安全测试的分级攻击框架 大语言模型安全测试需建立多层次的攻击模拟体系,通过差异化攻击强度设计,全面评估模型防御能力。我们创新性提出四级攻击强度模型,每级对应特定技术手段与实施场景。 1.1 L1随机攻击……