一、漏洞发现:20%关键词引发的模型失控 某国际研究团队在arXiv发布的论文中,揭示了AI视觉语言模型(VLM)存在的致命缺陷:攻击者仅需修改生成文本中20%的特定位置词汇,即可使模型输出有害内容。例如,当用户请……