一、框架定位与技术演进 在具身智能研究领域,视觉-语言-动作(VLA)框架的演进经历了三个阶段:早期基于规则的简单任务映射、中期依赖深度学习的端到端模型,以及当前强调多模态解耦与可解释性的第三代架构。Dexb……