本发明涉及机器人编队、交通车辆管理、无人机驾驶、水下航行器领域,特别涉及一种异构非线性多领导者系统的固定/指定时间神经网络自适应包容一致性方法。
背景技术:
1、多智能体系统是由相互连接的独立实体组成的大规模系统,它们通过网络在共享环境中感知、决策和行动,每个代理是一个自主执行任务并与其他代理进行交互的独立实体。多智能体系统的主要特征是通过与各个agent的相互协调来完成复杂的任务。这更符合实际情况,因为很多任务并不是单靠一个系统就能完成的,比如机器人编队、军事监视和侦察、无人机驾驶、水下航行器等需要多智能体系统的协同控制以达到预期任务。
2、为实现协同控制的有效性,分布式一致性控制显得尤为关键。值得强调的是,先前的研究主要聚焦于线性多智能体系统的一致性问题。然而,实际物理系统通常具备固有的非线性动力学特性,甚至非线性动力学无法精确建模。为应对这一挑战,提出了具有函数逼近能力的神经网络和模糊系统智能控制方法。基于系统的非线性动力学行为,多智能体系统可分为同构和异构系统。由于个体之间存在差异,它们可能在能力、特性、行为或任务方面呈现多样性。这种差异性在构建灵活性和任务分解的复杂性方面具有优势。因此研究异构非线性系统是非常有必要的。
3、然而,现有结果大多数集中在时间趋于无穷时才能实现的情况,鉴于有限时间内的收敛在实际应用中更为实际,有限时间一致性问题得到了很多关注。不幸的是,停息时间的估计上界依赖于个体的初始值,随着初始条件的不确定性增加,系统的收敛时间可能会变得难以预测,这直接影响系统的稳定性。为解决这一问题,polyakov[a.polyakov,nonlinear feedback design for fixed-time stabilization of linear controlsystems[j],ieee transactions on automatic control,vol.57,no.8,pp.2106-2110,2012.]提出固定时间控制策略去移除初始值对停息时间估计的限制。包容一致性在控制中是提高收敛速度的关键性能指标之一,对于评估智能体的动态行为至关重要。目前异构非线性多智能体的固定时间控制策略。近年来,多领导者固定时间包容控制问题成为研究的热点,其主要目标是使追随者进入并保持在由领导者的状态变量或输出变量跨越的凸包中。然而,现有的研究主要采用同构非线性动力学建模。因此,考虑异构非线性包容的固定时间一致性变得十分必要。
4、通常情况下,固定时间控制器需要经过精心参数调优,以确保在特定条件下能够提供良好的性能。鉴于这一背景,提出了固定时间自适应控制协议。解决了一类具有不可观测状态的随机非线性异构多智能体系统的自适应包容控制问题,然而固定时间自适应包容控制问题尚未得到充分考虑。因此,研究了具有多领导者的异构系统的二部固定时间输出包容编队跟踪问题,其中系统是线性的且控制器是静止的[y.cai,h.zhang,y.wang,z.gaoand q.he,"adaptive bipartite fixed-time time-varying output formation-containment tracking of heterogeneous linear multiagent systems[j],bieeetransactions on neural networks and learning systems,vol.33,no.9,pp.4688-4698,2022,]。因此,对于异构非线性多智能体系统的固定时间自适应包容控制问题的研究是非常必要的。固定时间控制算法能够根据系统的实际运行状况和变化来调整控制器的参数,获得期望的收敛时间。然而,在指定的时间内推动追随者进入特定凸壳的问题一直没有得到充分解决。为了克服这一困难,提出了指定时间包容控制算法。liu等人研究了不确定非线性多智能体系统的规定时间包容控制[d.liu,zhi,liua.b,c.chenc,y.zhang,prescribed-time containment control with prescribed performance for uncertainnonlinear multi-agent systems[j],journal ofthe franklin institute,vol.358,pp.1782-1811,2021.]。zhao等人研究了高阶非线性多智能体系统规定时间包容控制,其中包括分布式观测器[g.zhao,q.liu,c.hua,prescribed-time containment control ofhigh-order nonlinear multi-agent systems based on distributed observer[j],journal ofthe franklin institute,vol.360,pp.6736-6756,2023.]。上述提到的指定时间控制器具有时变且无界的控制增益。显然,对于无穷大的控制增益,这种控制策略是不可接受的,且在实际应用中难以实现。因此,如何设计一些简单而有效的有限增益控制协议,以解决异构非线性多智能体指定时间包容控制,是一个既有意义又具有挑战性的问题。
技术实现思路
1、本发明的目的在于提供异构非线性多领导者系统的固定/指定时间神经网络自适应包容一致性方法,针对多智能体系统(机器人编队、交通车辆管理、无人机驾驶、水下航行器领域)包容一致性问题,为此,提出了基于自适应控制的固定\指定时间异构非线性包容一致性方法,将复杂的单个智能体动态进行训练,以更好的逼近独立个体的动态,从而实现跟随者进入领导者的凸包里面。
2、为实现上述目的,本发明的技术方案是:一种异构非线性多领导者系统的固定/指定时间神经网络自适应包容一致性方法,以智能体系统为研究对象,建立针对固定时间和指定时间包容一致性问题,其中智能体的动力学行为是异构的;具体的,首先,提出径向基函数神经网络来逼近未知的非线性动力学,此外,提出一种新的固定时间自适应分布式策略,解决具有未知外部扰动的异构非线性多智能体包容一致性问题,最后通过设计具有有界控制增益的指定时间自适应控制方法,探索指定时间包容一致性,其中收敛时间能够根据任务需要任意预定义。
3、在本发明一实施例中,对多智能体系统进行数学建模,用χr(t)表示第r个智能体的状态。
4、在本发明一实施例中,基于自适应分布式控制策略和代数图理论,建立径向基函数神经网络来逼近未知的非线性动力学。
5、在本发明一实施例中,该方法具体包括如下步骤:
6、步骤一、异构非线性多领导者系统的构建;
7、步骤二、异构非线性多领导者系统的固定时间包容一致性问题的建立;
8、步骤三、异构非线性多领导者系统的指定时间包容一致性问题的建立。
9、在本发明一实施例中,步骤一具体实现如下:
10、考虑具有q个跟随者和r个领导者的多智能体模型:
11、
12、其中θ={1,2,…,q,q+1,…,q+r},χr(t)表示第r个智能体的状态,是异构动力学行为(表示维欧几里德空间的集合,表示实数集),κr(t)是未知外部扰动,ωr(t)是第r个智能体的控制输入;
13、假设1:对于未知外部扰动|κr(t)|≤κ*,其中κ*是常数;
14、假设2:对于存在常数h>ζ>0,使得下列等式成立
15、
16、基于神经网络的近似,对未知非线性函数进行近似,记为
17、
18、其中表示最优权向量,是神经元的数量,为高斯基函数,其中
19、
20、其中τr=[τr1,τr2,…,τrq]表示领域中心,且p,q是常数,表示高斯函数的宽度,表示以常数φ*为界的近似误差。
21、在本发明一实施例中,步骤二具体实现如下:
22、自适应分布式定时控制器构造如下:
23、
24、其中dr(t),αr(t)表示自适应控制增益,θ>1,ξ>0,
25、sign(t)表示符号函数,控制器参数的更新率为:
26、
27、其中ρ1、ρ2、d*、α*、δ1、δ2表示大于0的常数;
28、将式(5)带入式(1)得
29、
30、得到式(8)的紧向量形式:
31、
32、eq和er表示单位矩阵,表示领导者集合且表示跟随者集合且表示领导者控制器,表示跟随着控制器;
33、定义计算出:
34、
35、其中en表示n维单位矩阵,表示q×q维欧几里得空间,表示q×r维欧几里得空间;
36、误差系统:
37、
38、其中
39、定理一:基于假设1和分布式协议下的固定时间包容控制控制器(5)下,如果存在α>0,d>0,满足
40、
41、收敛时间t1估计为
42、
43、其中α*,d*是最优控制增益,κ*>0表示扰动的边界,csc(x)表示余割,λr表示的特征值;
44、证明:构造如下lyapunov函数
45、
46、其中d>0,α>0是常数;令表示不包含零点,0nq表示具有所有零元素的n×q维列向量)有:
47、对求导
48、
49、对求导
50、
51、对求导
52、
53、结合(13)-(16),存在一个正交矩阵使得定义有
54、
55、因此,总是存在d,α,使得at+a-2d*λren≤0,因此可得
56、
57、因为
58、
59、其中λmin表示最小特征值;
60、可得
61、
62、由(19)式可得
63、
64、因此,
65、
66、由(18)-(22)式可得
67、
68、其中
69、
70、异构非线性多智能体模型(1)是固定时间包容收敛的,且沉降时间满足
71、
72、在本发明一实施例中,步骤三具体实现如下:
73、自适应指定时间控制器:
74、
75、控制器参数自适应更新率:
76、
77、其中其中表示最小特征值;
78、定理二:基于假设1和分布式协议下的指定时间包容控制控制器(5)下,如果存在α>0,d>0,满足
79、
80、在指定时间内达成包容一致性;
81、证明:
82、
83、其中
84、
85、相较于现有技术,本发明具有以下有益效果:本发明以机器人编队为研究对象,确保不同时刻每个智能体的信息传输是一致的,这对于智能体的编队非常重要,为了确保各个设备之间的协调性。提出了基于自适应分布式控制的固定时间和指定时间多智能体系统包容一致性方法,分布式固定时间控制器摆脱了对初始值的依赖,克服了原始系统对初始值的依赖,将停息时间进行优化,获得最优控制成本。分布式指定时间控制器是针对解决在分布式系统中,由于不同设备和节点之间的通信可能存在延迟和不确定性,因此需要一种机制来确保各个节点之间的某一时刻一致性,以便协同操作和数据交换,进而提高了任务完成效果,提高了信息的传输效率。
1.一种异构非线性多领导者系统的固定/指定时间神经网络自适应包容一致性方法,其特征在于,以智能体系统为研究对象,建立针对固定时间和指定时间包容一致性问题,其中智能体的动力学行为是异构的;具体的,首先,提出径向基函数神经网络来逼近未知的非线性动力学,此外,提出一种新的固定时间自适应分布式策略,解决具有未知外部扰动的异构非线性多智能体包容一致性问题,最后通过设计具有有界控制增益的指定时间自适应控制方法,探索指定时间包容一致性,其中收敛时间能够根据任务需要任意预定义。
2.根据权利要求1所述的异构非线性多领导者系统的固定/指定时间神经网络自适应包容一致性方法,其特征在于,对多智能体系统进行数学建模,用χr(t)表示第r个智能体的状态。
3.根据权利要求1所述的异构非线性多领导者系统的固定/指定时间神经网络自适应包容一致性方法,其特征在于,基于自适应分布式控制策略和代数图理论,建立径向基函数神经网络来逼近未知的非线性动力学。
4.根据权利要求1所述的异构非线性多领导者系统的固定/指定时间神经网络自适应包容一致性方法,其特征在于,该方法具体包括如下步骤:
5.根据权利要求4所述的异构非线性多领导者系统的固定/指定时间神经网络自适应包容一致性方法,其特征在于,步骤一具体实现如下:
6.根据权利要求5所述的异构非线性多领导者系统的固定/指定时间神经网络自适应包容一致性方法,其特征在于,步骤二具体实现如下:
7.根据权利要求6所述的异构非线性多领导者系统的固定/指定时间神经网络自适应包容一致性方法,其特征在于,步骤三具体实现如下: