视觉语言模型详解:从理论到实践的跨模态智能探索