一、架构演进背景:从单模态到多模态融合的跨越 视觉搜索的核心是通过图像或视频内容理解用户意图,其架构演进始终围绕准确性、实时性、扩展性三大目标展开。早期架构以单模态(图像)特征提取为主,依赖传统CV算……