一、技术背景与行业痛点 在多模态大模型(LMM)领域,视觉与语言模型的融合始终面临计算效率与特征粒度的矛盾。传统方法主要分为两类:序列维度拼接与特征维度操作。前者以LLaVA-1.5的AnyRes技术为代表,通过将高……