SmartTrim：多模态大模型的高效自适应剪枝方案 - 云主机网

最新文章

SmartTrim：多模态大模型的高效自适应剪枝方案

一、多模态模型部署的效率困局当前视觉语言模型（VLM）的参数量普遍突破十亿级，其自注意力机制带来的计算复杂度呈平方级增长。以某主流多模态架构为例，单次推理需要处理文本token序列与图像patch序列的跨模态交……

2026年2月8日互联网