一、技术背景与问题定义
在工业自动化与机器人控制领域,单输入单输出(SISO)非线性离散系统广泛存在于机械臂运动、无人机航迹规划等场景中。这类系统的核心挑战在于:模型参数未知且存在重复性任务(如周期性轨迹跟踪),传统控制方法需依赖精确数学模型,而数据驱动方法(如迭代学习控制,ILC)虽能通过迭代优化提升性能,但传统ILC需解决动态线性化与准则函数最小化两大复杂问题,导致计算效率低下。
本文提出一种神经网络增强的迭代学习控制(NN-ILC)算法,核心创新点在于:
- 解耦估计与控制:GRNN负责实时估计系统关键参数(如惯性、摩擦系数),RBFNN作为控制器生成控制输入;
- 简化优化过程:将传统ILC的复杂数学求解替换为神经网络的迭代训练,实现“开箱即用”的部署能力;
- 逐点优化策略:在每个时间步独立计算控制输入,确保跟踪误差逐次收敛至零附近。
二、算法架构与核心原理
1. 系统建模与问题分解
假设SISO非线性离散系统动态方程为:
[ y(k+1) = f(y(k), u(k)) ]
其中 ( y(k) ) 为系统输出,( u(k) ) 为控制输入,( f(\cdot) ) 为未知非线性函数。控制目标为:在第 ( i ) 次迭代中,使 ( y_i(k) ) 尽可能接近参考轨迹 ( r(k) )。
2. GRNN参数估计器设计
GRNN(广义回归神经网络)通过非参数回归实现系统参数的实时估计。其结构包含四层:
- 输入层:接收系统状态 ( y(k) ) 和控制输入 ( u(k) );
- 模式层:计算输入与训练样本的径向基距离(如高斯核函数);
- 求和层:对模式层输出加权求和;
- 输出层:生成参数估计值 ( \hat{\theta}(k) )。
优势:无需预设模型结构,仅通过历史数据即可逼近真实参数,尤其适合模型未知场景。
3. RBFNN控制器设计
RBFNN(径向基函数神经网络)作为控制器,其输出为控制指令 ( u(k) )。网络结构包含:
- 输入层:接收参考轨迹 ( r(k) )、系统状态 ( y(k) ) 和误差 ( e(k) = r(k) - y(k) );
- 隐含层:采用高斯函数作为激活函数,中心点通过K-means聚类确定;
- 输出层:线性加权生成控制输入 ( u(k) )。
训练策略:在每次迭代中,通过误差反向传播调整隐含层权重,使跟踪误差 ( e(k) ) 最小化。
4. 迭代学习机制
算法流程如下:
- 初始化:设置初始控制输入 ( u_0(k) )(如零输入或经验值);
- 迭代执行:
- 在第 ( i ) 次迭代中,运行系统并记录输出 ( y_i(k) );
- 使用GRNN估计当前时刻的系统参数 ( \hat{\theta}_i(k) );
- 基于 ( \hat{\theta}i(k) ) 和误差 ( e_i(k) ),通过RBFNN生成 ( u{i+1}(k) );
- 收敛判断:当跟踪误差 ( |e_i(k)| ) 小于阈值或达到最大迭代次数时终止。
关键特性:
- 逐点优化:每个时间步独立计算 ( u(k) ),避免全局优化的高计算成本;
- 数据驱动:无需系统先验知识,仅依赖输入输出数据;
- 鲁棒性:通过神经网络泛化能力,适应模型参数的时变特性。
三、理论分析与性能保证
1. 跟踪误差有界性证明
定义李雅普诺夫函数 ( Vi(k) = \frac{1}{2}e_i^2(k) ),结合GRNN的估计误差和RBFNN的控制误差,可推导出:
[ V{i+1}(k) \leq \alpha V_i(k) + \beta ]
其中 ( \alpha \in (0,1) ),( \beta ) 为有界扰动项。由此证明跟踪误差 ( e_i(k) ) 是一致最终有界的(Uniformly Ultimately Bounded, UUB)。
2. 计算复杂度对比
传统ILC需在每次迭代中求解动态线性化方程和优化准则函数,计算复杂度为 ( O(n^3) )(( n ) 为状态维度);而NN-ILC仅需神经网络的前向传播与反向传播,复杂度为 ( O(n) ),显著提升实时性。
四、实验验证与结果分析
1. 数值仿真
构建二阶非线性系统:
[ y(k+1) = 0.8y(k) + 0.2u(k) + 0.1\sin(y(k)) ]
参考轨迹为正弦波 ( r(k) = \sin(0.1k) )。对比传统PID与NN-ILC的跟踪效果:
- PID控制:稳态误差为0.15,超调量12%;
- NN-ILC:稳态误差降至0.02,无超调,迭代10次后误差收敛。
2. 无人车路径跟踪实验
在某型无人车上部署NN-ILC算法,跟踪“8”字形参考路径。实验数据显示:
- 横向误差:传统纯追踪算法平均误差0.28m,NN-ILC降至0.05m;
- 计算延迟:NN-ILC的单步计算时间仅8ms,满足实时性要求(控制周期50ms)。
五、应用场景与扩展方向
1. 典型应用场景
- 机器人轨迹控制:如机械臂抓取、AGV小车导航;
- 航空航天:卫星姿态调整、无人机编队飞行;
- 智能制造:数控机床加工路径优化。
2. 未来研究方向
- 多输入多输出(MIMO)系统扩展:通过分层神经网络结构处理耦合动态;
- 增量式学习:结合在线学习机制,适应系统参数的时变特性;
- 云边协同控制:利用边缘计算节点部署神经网络,降低云端传输延迟。
六、结论
本文提出的GRNN-RBFNN联合迭代学习控制算法,通过神经网络解耦估计与控制任务,实现了未知SISO非线性系统的高精度轨迹跟踪。理论证明与实验结果均表明,该方案在计算效率、跟踪精度和鲁棒性方面显著优于传统方法,为复杂工业场景的控制问题提供了新思路。