一、多模态检索的技术演进与核心挑战 多模态检索是指通过融合文本、图像、音频、视频等不同模态的数据,实现跨模态信息的关联与检索。传统检索系统通常依赖单一模态的关键词匹配,例如文本检索依赖TF-IDF或BERT文……