一、跨模态AI提示词框架的现状与挑战 在图像生成、视频理解、多模态对话等场景中,跨模态AI需同时处理文本、图像、语音等多种输入,但传统提示词设计往往局限于单一模态。例如,图像生成模型的提示词侧重空间描述……