径向基
1	径向基RBF(radial basis function)函数、RBF神经网络、反推(back-stepping)控制

文章目录

3. 基于RBF网络逼近的自适应控制
4. RBF神经网络自适应控制matlab仿真_RBF神经网络及其在控制中的应用简介
- 1. 采用梯度下降法计算权值
- 2. 依据稳定性理论设计权值
5. RBF神经网络在控制中的应用
6. 严格反馈结构
7. 反推控制 Backstepping

3. 基于RBF网络逼近的自适应控制

3.1 问题描述

简单的运动系统动力学方程为：
$\ddot{\theta} = f(\theta, \dot{\theta}) + u \tag{1}$

其中 $\theta$ 为角度， $u$ 为控制输入。

写成状态方程形式为：
$\begin{aligned} &\dot{x}_1 = x_2 \\ &\dot{x}_2 = f(x) + u \end{aligned} \tag{2}$

其中 $f (x)$ 为未知非线性函数。

未知指令为 $x_d$ ，则误差及其变化率为：
$\begin{aligned} e &= x_1 - x_d \\ \dot{e} &= \dot{x}_1 - \dot{x}_d \\ &=x_2 - \dot{x}_d \end{aligned}$

定义误差函数为
$\dot{e}, ~~~ c>0 \tag{3}$

则
$\begin{aligned} \dot{s} &= c\dot{e}+\ddot{e}\\ &=c\dot{e}+\dot{x}_2-\ddot{x}_d \\ &=c\dot{e}+f(x)+u-\ddot{x}_d \end{aligned} \tag{4}$

由式（3）可知，如果 $s\rightarrow 0$ ，则 $e\rightarrow 0$ 且 $\dot{e}\rightarrow 0$ 。

若对滑模控制有了解的，可以发现上述误差函数 (3) 的形式与滑模控制中的滑模面类似，可以看一下文章【控制】滑模控制，滑模面的选择。这里还有滑模的解决方案，也就是趋近律的选择。

借助趋近律 $\dot{s} = -\eta ~\text{sgn}(s)$ ，那么基于上式 (4) 可以得到
$\begin{aligned} \dot{s} &=c\dot{e}+f(x)+u-\ddot{x}_d = -\eta ~\text{sgn}(s) \\ u& = -c\dot{e} - f(x) + \ddot{x}_d -\eta ~\text{sgn}(s) \end{aligned} \tag{5}$

式 (5) 就是包含了未知非线性函数 $f (x)$ 的系统控制器。

但是 $f (x)$ 往往是未知的，我们没有一个具体的显式表达式。而这个控制器并不能让系统达到期望输入，根本原因就是 $f (x)$ 的存在影响了系统。

3.2 验证没有未知干扰项的控制器

不过为了方便理解，我们先验证一下没有未知项 $f (x)$ 干扰时的控制器。

也就是将模型式 (2) 简化为
$\begin{aligned} &\dot{x}_1 = x_2 \\ &\dot{x}_2 = u \end{aligned} \tag{6}$

将控制器式 (5) 简化为

$\begin{aligned} u& = -c\dot{e} + \ddot{x}_d -\eta ~\text{sgn}(s) \end{aligned} \tag{7}$

系统初始状态为 $x_1(0) = \text{rand}$ ， $x_2(0) = \text{rand}$ 。期望状态为 $x_d = \sin(t)$ ， $\dot{x}_d = \cos(t)$ ， $\ddot{x}_d = -\sin(t)$ 。参数假设为 $\eta = 1$ 。
虽然我们把未知干扰项简化掉了，但是我们这里还是给出一个 $f(x)=10 x_1 x_2$ 。画画图，看看效果。

首先是没有未知干扰项的仿真结果，如下图所示。

基于 RBF 径向基神经网络的自适应控制，原理，实现，Matlab 程序

紧接着给出有 $f (x)$ 的仿真结果。

基于 RBF 径向基神经网络的自适应控制，原理，实现，Matlab 程序

最后再把程序给出。

% Paper: 2020_面向多船协同的自适应编队控制方法研究
% Author: Z-JC
% Data: 2022-10-03
clear
clc

%%
% states
x_1(:,1) = rand;
x_2(:,1) = rand;

fx(:,1) = 10 * x_1(:,1) * x_2(:,1);

% Control inputs
u(:,1) = rand;

% Desired 
x_d(:,1) = sin(0);
ddot_x_d(:,1) = cos(0);
dot_x_d(:,1) = -sin(0);

% Parameters
c = 1;
eta = 1;

%% Time state
t(1,1) = 0;
tBegin = 0;
tFinal = 20;
dT = 0.05;
times = (tFinal-tBegin)/dT;

% Iterations
for i=1:times
    % Record time
    t(:,i+1) = t(:,i) + dT;
    
    fx(:,i) = 10 * x_1(:,i) * x_2(:,i);
    
    % error
    x_d(:,i+1) = sin(t(:,i+1));
    e = x_1(:,i) - x_d(:,i+1);
    
    dot_x_d(:,i+1) = cos(t(:,i+1));
    dot_e = x_2(:,i) - dot_x_d(:,i+1);
    
    s = c*e + dot_e;
    
    ddot_x_d(:,i+1) = -sin(t(:,i+1));
    u(:,i+1) = -c*dot_e + ddot_x_d(:,i+1) - eta * sign(s);
    
    % update states
    x_2(:,i+1) = x_2(:,i) + dT * ( 0*fx(:,i)+u(:,i+1) );
    x_1(:,i+1) = x_1(:,i) + dT * x_2(:,i+1);
    
    fx(:,i+1) = 10 * x_1(:,i+1) * x_2(:,i+1);
end

%% Plot results
figure(1)
subplot(2,1,1)
plot(t,x_1, t,x_d, 'linewidth',1.5); hold on
legend('$x_{1}$', '$x_{d}$', 'interpreter','latex');
grid on

subplot(2,1,2)
plot(t,x_2, t,dot_x_d, 'linewidth',1.5); hold on
legend('$x_{2}$', '$\dot{x}_{d}$', 'interpreter', 'latex');
grid on

figure(2)
subplot(2,1,1)
plot(t,u, 'linewidth',1.5); hold on
legend('$u$', 'interpreter','latex');
grid on

subplot(2,1,2)
plot(t,fx, 'linewidth',1.5); hold on
legend('$f(x)$', 'interpreter','latex');
grid on

3.2 RBF 网络原理

对比上述结果也可以看到， $f (x)$ 对系统影响特别大。这时候就需要 RBF 来发挥作用了。

由于 RBF 网络具有万能逼近特性，采用 RBF 神经网络逼近 $f (x)$ ，网络算法为：
$h_j = \exp(\frac{\|x-c_j\|^2}{2b^2_j}) \tag{4}$

$W^{*\text{T}}h(x) + \varepsilon \tag{5}$

其中， $x$ 为网络的输入， $j$ 为网络隐含层第 $j$ 个节点， $h=[h_j]^\text{T}$ 为网络的高斯基函数输出， $W^*$ 为网络的理想权值， $\varepsilon$ 为网络的逼近误差， $\varepsilon\le\varepsilon_N$ 。

网络输入取状态变量 $x=[x_1, x_2]^\text{T}$ ，则网络输出为：
$\hat{f}(x) = \hat{W}^\text{T} h(x) \tag{6}$

3.3 控制算法设计与分析

由于
$\begin{aligned} f(x) - \hat{f}(x) &= W^{*\text{T}}h(x) + \varepsilon - \hat{W}^\text{T}h(x)\\ &=-\tilde{W}^\text{T} h(x) + \varepsilon \end{aligned}$

定义 Lyapunov 函数为
$\frac{1}{2}s^2+\frac{1}{2\gamma}\tilde{W}^\text{T} \tilde{W} \tag{7}$

其中 $\gamma>0, \tilde{W}=\hat{W}-W^*$ 。

则
$\begin{aligned} \dot{V} &= s\dot{s} + \frac{1}{2\gamma}\tilde{W}^\text{T} \dot{\hat{W}} \\ &=s(c\dot{e}+f(x)+u-\ddot{x}_d)+\frac{1}{2\gamma}\tilde{W}^\text{T} \dot{\hat{W}} \end{aligned}$

设计控制律为
$u=-c\dot{e} - \hat{f}(x) + \ddot{x}_d - \eta~ \text{sgn}(s) \tag{8}$

则
$\begin{aligned} \dot{V} &= s (f(x) - \hat{f}(x) - \eta~ \text{sgn}(s)) + \frac{1}{\gamma}\tilde{W}^\text{T} \dot{\hat{W}} \\ &= s(-\tilde{W}^\text{T} h(x) + \varepsilon - \eta~\text{sgn}(x)) + \frac{1}{\gamma}\tilde{W}^\text{T} \dot{\hat{W}} \\ &= \varepsilon s - \eta |s| + \tilde{W}^\text{T} (\frac{1}{\gamma}\dot{\hat{W}}-s h(x)) \end{aligned}$

取 $\eta > |\varepsilon|_{\max}$ ，自适应律为
$\dot{\hat{W}} = \gamma s h(x) \tag{9}$

则 $\dot{V}=\varepsilon s - \eta |s| < 0$ 。

3.4 仿真实例

考虑如下被控对象
$\begin{aligned} &\dot{x}_1 = x_2 \\ &\dot{x}_2 = f(x) + u \end{aligned}$

其中 $f(x)=10 x_1 x_2$ 。

控制律采用式（8），自适应律采用式（9），取 $\gamma=500, \eta=0.50$ 。根据网络的输入 $x_1$ 和 $x_2$ 的实际范围，高斯基函数的参数 $c_i$ 和 $b_i$ 的取值分别为 [-2 -1 0 1 2] 和 3.0。网络权值矩阵中各个元素的初始值取 0.10。

仿真结果如下图所示。

Ref: 一种简单的基于RBF网络逼近的自适应控制

4. RBF神经网络自适应控制matlab仿真_RBF神经网络及其在控制中的应用简介

RBF神经网络在控制中的应用，可以按其隐含层与输出层连接权值的计算方式分为以下两类：

1. 采用梯度下降法计算权值

2. 依据稳定性理论设计权值

依据稳定性理论设计权值，即通过分析系统的Lyapunov稳定性，设计权值，从而保证系统的稳定性和收敛性。

考虑如下二阶非线性系统，以自适应RBF控制器的设计为例，对该权值设计方式进行简要介绍。

$\ddot{x} = f(x, \dot{x}) + g(x, \dot{x}) u \tag{3}$

其中， $f$ 为未知非线性函数， $g$ 为已知非线性函数； $u\in\mathbb{R}^n$ 和 $y\in\mathbb{R}^n$ 分别为系统的控制输入和输出。

令 $x_1 = x, x_2 = \dot{x}$ 和 $y=x_1$ ，（3）式可改写为

$\begin{aligned} &\dot{x}_1 = x_2 \\ &\dot{x}_2 = f(x_1,x_2) + g(x_1,x_2) u \\ & y = x_1 \end{aligned}$

设理想跟踪指令为 $y_d$ ，则误差为
$\begin{aligned} e &= y_d - y \\ &= y_d - x_1 \\ E &= [e, \dot{e}]^\text{T} \end{aligned}$

设计 $K=[k_p, k_d]^\text{T}$ 使多项式 $s^2 + k_d s + k_p = 0$ 的根都在左半复平面。

将 RBF 神经网络的输出代替式（3）中未知函数，可设计控制律为
$\frac{1}{g(x)} []$

Ref: rbf神经网络自适应控制matlab仿真_RBF神经网络及其在控制中的应用简介

5. RBF神经网络在控制中的应用

Ref: RBF神经网络参考模型自适应MATLAB实现（分析）

6. 严格反馈结构

控制理论中，什么是严格反馈结构？

严格反馈系统和纯反馈系统的区别是？

7. 反推控制 Backstepping

反推控制

学习笔记（1）——反步控制法

反步（Back-Stepping）设计方法

秒客网

基于 RBF 径向基神经网络的自适应控制，原理，实现，Matlab 程序

文章目录

3. 基于RBF网络逼近的自适应控制

3.1 问题描述

3.2 验证没有未知干扰项的控制器

3.2 RBF 网络原理

3.3 控制算法设计与分析

3.4 仿真实例

4. RBF神经网络自适应控制matlab仿真_RBF神经网络及其在控制中的应用简介

1. 采用梯度下降法计算权值

2. 依据稳定性理论设计权值

5. RBF神经网络在控制中的应用

6. 严格反馈结构

7. 反推控制 Backstepping

相关文章