一、传统视频识别系统的认知困境 当前主流视频识别系统普遍采用”槽位注意力”机制,其核心逻辑是为每个物体分配独立记忆单元(槽位),通过并行处理实现高效识别。但这种设计存在三个致命缺陷: 静态槽位分配:系……