多UAV协同轨迹规划方法及系统、设备、存储介质与流程

专利检索2022-05-10 42

多uav协同轨迹规划方法及系统、设备、存储介质
技术领域
1.本发明涉及uav控制技术领域，特别地，涉及一种多uav协同轨迹规划方法及系统、设备、计算机可读取的存储介质。

背景技术：

2.多架无人飞机(unmanned aerial vehicle,uav)协同执行对地打击任务时，为了提高作战效率，实现预定效果，常常需要对多uav的作战过程进行规划，生成详细的协同作战计划。其中，协同轨迹规划是多uav协同规划的关键过程。在对地攻击阶段，为了使成功完成任务的概率最大，要求所有uav分别在同一时刻从相同或不同的起点出发，同时或按照一定的时间顺序到达特定攻击阵位执行任务，这样即使一部分uav损毁，其它uav还可以完成任务。协同轨迹规划的目标是得到一组可行、可飞、连接起点和目标点的近似最优轨迹，在规划过程中不仅要综合考虑敌方威胁、地形、气象等环境因素影响，以及平台机动性能的限制，还要考虑多uav之间的空间和时间协同，是一个复杂的、非线性、带有较强约束的协同轨迹优化问题，具有较大的挑战性。
3.针对此问题，目前国内外开展了较为广泛的研究，主要分为多机协同规划和轨迹优化两个层面。在协同层规划中主要研究多机之间的时空协同问题，为了描述多uav间的信息交换，brigham young university的mclain和beard等学者在文章《"cooperative control of uav rendezvous,"presented at the proceedings of the american control conference,arlington,2001》、《"cooperative path planning for timing
‑
critical missions,"in proceedings of the american control conference,denver,colorado 2003,pp.296
‑
301.》、《"coordination variables,coordination functions,and cooperative timing missions,"journal of guidance,control,and dynamics,vol.28,pp.150
‑
161,2005.》中给出了协调变量(coordination variables,cv)和协调函数(coordination function,cf)的定义，将要交换的信息定义为协调变量，各uav在规划时只需要保证协调变量的一致性即可保证多uav协同并将其应用于协同航线规划问题研究中。其中，文章《"coordination variables,coordination functions,and cooperative timing missions,"journal of guidance,control,and dynamics,vol.28,pp.150
‑
161,2005.》将协调变量方法应用于具有时间约束的uav编队轨迹规划问题研究中，以到达时间作为协同航迹规划的协调变量，针对同时到达、严格时序和松散时序三种时间约束关系，分别提出了相应的协同策略。为了充分发挥uav的自治性，降低对通信的依赖性，提高系统的鲁棒性和容错性，文献《袁利平，陈宗基，周锐，孔繁峨,"多无人机同时到达的分散化控制方法,"航空学报,vol.31,pp.797
‑
805,2010.》建立了基于“协调变量”和“协调函数”的分布式求解框架，提出了一种多uav同时到达任务区集结问题的分布式协同控制方法。
4.但是，以上这些文献主要解决航迹层面的协同问题，例如整体协调多个uav的到达时间，或者协调多uav到达同一目标，其均没有考虑轨迹层面的协同问题。而在轨迹协同层面，由于每个轨迹点包括位置和时间信息，在时间协同方面，不能简单地协调到达时间，而
需要协调每个轨迹点的时间，在空间协同方面，也不能只涉及协同到达同一目标，而需要协调每个轨迹点的位置，防止多uav在轨迹飞行过程中发生相撞。

技术实现要素：

5.本发明提供了一种多uav协同轨迹规划方法及系统、设备、计算机可读取的存储介质，以解决现有技术的上述缺陷。
6.根据本发明的一个方面，提供一种多uav协同轨迹规划方法，包括以下内容：
7.步骤s1：对每个uav在协同轨迹规划中的约束条件和代价函数进行建模；
8.步骤s2：采用b样条曲线表示每个uav的轨迹；
9.步骤s3：采用进化算法对多uav协同轨迹规划问题进行求解，得到满足空间协同要求和时间协同要求的协同轨迹。
10.进一步地，所述步骤s1中的约束条件包括飞机机动性能约束、敌方威胁约束、飞行禁飞区约束、地形约束、终端位置约束、空间协同约束和时间协同约束；
11.其中，飞机机动性能约束表示为：h(t)为飞行高度，v(t)为真空速，γ(t)为俯仰角，ψ(t)为航向角，μ(t)滚转角；
12.敌方威胁约束表示为：||
·
||2表示两点之间的距离，和分别为第i个威胁的中心坐标及作用半径，(x(t)，y(t),h(t))为uav在t时刻的位置坐标；
13.飞行禁飞区约束表示为：飞行禁飞区约束表示为：和分别为第i个飞行禁飞区的中心坐标及半径，n
nfz
为飞行禁飞区的数量；
14.地形约束表示为：h(t)
‑
h
ij
(t)≥δh，h(t)为飞机的飞行高度，h
ij
(t)为点(i,j)的地形高度，δh为最小安全高度阈值；
15.终端位置约束表示为：(x
f
,y
f
,h
f
)表示武器投放点位置，(δx,δy,δh)表示给定的允许偏差，(x
aar
，y
aar
,h
aar
)为武器可投放区的中心点坐标；
16.空间协同约束表示为：||vp
i
(k)
‑
vp
j
(k)||2≥d
safe
,i,j＝1,2,
…
,n
v
,i≠j，vp
i
(k)为第i个uav的k时刻轨迹点，d
safe
为uav间的最小安全间隔距离，n
v
为uav数量；
17.时间协同约束表示为：t
s
δ
i
≤t
i
≤t
s
δ
i
τ
i
,i＝1,
…
,n，t
s
为第一个uav的到达时间，t
i
为第i个uav的到达时间，δ
i
表示第i个uav与第一个uav之间的时间窗，δ1＝0，τ
i
表示第i个uav的飞行持续时间。
18.进一步地，所述步骤s1中的代价函数包括uav的飞行距离代价函数、飞行高度代价函数、威胁代价函数、协同代价函数和综合代价函数；
19.其中，飞行距离代价函数表示为：plr
i
为第i个uav的飞行距离代价，为第i个uav的第j个坐标点，n为轨迹点数量，l
min
为最小飞行距离，用第i个uav的起点到终点的直线距离表示；
20.飞行高度代价函数表示为：mfd
i
为第i个uav的飞行高度代价，为第i个uav的第j个坐标点，为该点的地形高度，h
safe
表示飞行的最小安全高度，n为轨迹点数量；
21.威胁代价函数用雷达探测概率表示：威胁代价函数用雷达探测概率表示：prd
i
为组网雷达系统对第i个uav的探测概率，p
d
(r)为第r个雷达对目标的探测概率，r
pr
为第i个uav的轨迹点p到雷达r的距离，p
f
表示雷达系统的虚警概率，为雷达r的最大探测距离，k表示与雷达威力相关的归整化因子，σ为rcs值，los(p,r)为点p到点r的通视性判断方法，当两点间能够通视时为正，否则为负；
22.协同代价函数表示为：
[0023][0024]
ac
i
为第i个uav与其它uav的协同代价，为第i个uav的第k个轨迹点，为第j个uav的第l个轨迹点，d
safe
为uav间的最小安全间隔距离，为第i个uav达到第k个轨迹点的时间，为第j个uav达到第l个轨迹点的时间，t
min
为两架uav到达同一个轨迹点的最小安全间隔时间，n
i
和n
j
分别为第i个uav及第j个uav的轨迹点数量；
[0025]
综合代价函数表示为：j
i
为第i个uav的综合代价，为权系数，
[0026]
进一步地，所述步骤s2中采用3次4阶b样条曲线表示每个uav的轨迹，3次4阶b样条曲线的表达式为：
[0027][0028]
z
j
(u)为uav的第j段轨迹，b
i,4
(u)为对于4次输出z
j
的第i个b样条基函数，u∈(0,1)，为b样条曲线的节点，为控制点序列，每个控制点表示为(x
i
，y
i
,h
i
)，i＝0,1,2,3。
[0029]
进一步地，所述步骤s3包括以下内容：
[0030]
步骤s31：初始化协进化算法的种群p0，将每个uav作为一个子种群p
0i
，令n
v
表示uav数量，2m表示每个子种群的规模，则初始化后的种群p
n
的规模为n＝2n
v
*m，采用进化算法对b样条曲线的控制点序列进行编码；
[0031]
步骤s32：对初始化后的种群p
n
执行进化操作，产生下一代种群q
n
，种群规模为n，合并初始化后的种群p
n
和产生的下一代种群q
n
，产生新种群r
n
，新种群的规模为2n；
[0032]
步骤s33：对新种群r
n
的每个子种群进行并行搜索，并结合3次4阶b样条曲线生成每个uav的多条轨迹；
[0033]
步骤s34：基于每个uav的约束条件并结合综合代价函数对每个uav的每条轨迹进行评价，得到每条轨迹的综合评价值；
[0034]
步骤s35：采用同时到达的时间作为协调变量，并基于集中协调
‑
分布式求解的方式进行时间协同，得到协同到达时间满足要求且综合评价值满足要求的3m组轨迹，后执行步骤s36，否则，从新种群r
n
中选择2m组综合评价值满足要求的个体再次组成新的种群p
n 1
，再返回执行步骤s32；
[0035]
步骤s36：对每组轨迹的多uav协同轨迹规划问题进行综合评价，筛选出综合评价值满足要求的2m组轨迹；
[0036]
步骤s37：将筛选出的2m组轨迹构成新的种群p
n 1
，重复执行步骤s32～步骤s37，不断迭代，满足算法终止条件后停止迭代，从最终筛选出的综合评价值满足要求的2m组轨迹中选择综合评价值最小的一组轨迹作为协同轨迹输出。
[0037]
进一步地，所述步骤s36中采用以下公式对每组轨迹的多uav协同轨迹规划问题进行综合评价：
[0038][0039]
j为多uav协同轨迹规划的综合评价值，d为uav的个数。
[0040]
进一步地，所述步骤s35中采用同时到达的时间作为协调变量，第i个uav的到达时间的取值范围根据uav的速度范围[v
min
,v
max
]确定：
[0041][0042]
其中，表示第i个uav的第q段轨迹长度，q为第i个uav的轨迹段数量，t0为同时出发时刻，为了使各个uav的飞行时间尽量小，取协同到达时间集合中的最小值作为多uav的协同到达时间：
[0043][0044]
另外，本发明还提供一种多uav协同轨迹规划系统，采用如上所述的规划方法，包括：
[0045]
建模模块，用于对每个uav在协同轨迹规划中的约束条件和代价函数进行建模；
[0046]
轨迹表征模块，用于采用b样条曲线表示每个uav的轨迹；
[0047]
分析模块，用于采用同时到达的时间作为协调变量并基于集中协调
‑
分布式求解的架构进行多uav协同轨迹规划问题求解，得到满足空间协同要求和时间协同要求的协同轨迹。
[0048]
另外，本发明还提供一种设备，包括处理器和存储器，所述存储器中存储有计算机程序，所述处理器通过调用所述存储器中存储的所述计算机程序，用于执行如上所述的方法的步骤。
[0049]
另外，本发明还提供一种计算机可读取的存储介质，用于存储进行多uav协同轨迹规划的计算机程序，所述计算机程序在计算机上运行时执行如上所述的方法的步骤。
[0050]
本发明具有以下效果：
[0051]
本发明的多uav协同轨迹规划方法，先建立协同轨迹优化的约束模型和目标函数，将协同轨迹规划问题描述为参数最优化问题，然后，结合飞行器性能模型，采用b样条曲线参数化表示uav轨迹，最后采用进化方法对参数最优化问题进行求解，得到满足空间协同要求和时间协同要求的协同轨迹，实现了多uav轨迹间的时空协同。
[0052]
另外，本发明的多uav协同轨迹规划系统、设备、计算机可读取的存储介质同样具有上述优点。
[0053]
除了上面所描述的目的、特征和优点之外，本发明还有其它的目的、特征和优点。下面将参照图，对本发明作进一步详细的说明。
附图说明
[0054]
构成本技术的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：
[0055]
图1是本发明优选实施例的多uav协同轨迹规划方法的流程示意图。
[0056]
图2是本发明优选实施例中的武器可投放区的示意图。
[0057]
图3是本发明优选实施例中的3次b样条曲线的示意图。
[0058]
图4是本发明优选实施例中的多uav协同打击多目标的轨迹规划求解框架的示意图。
[0059]
图5是图1中步骤s3的子流程示意图。
[0060]
图6是本发明优选实施例中的多uav协同轨迹规划方法在实际场景仿真中两架uav协同攻击的对地攻击轨迹示意图。
[0061]
图7是本发明优选实施例中的多uav协同轨迹规划方法在实际场景仿真中两架uav的估计到达时间随时间变化的曲线的示意图。
[0062]
图8是本发明另一实施例的多uav协同轨迹规划系统的模块结构示意图。
具体实施方式
[0063]
以下结合附图对本发明的实施例进行详细说明，但是本发明可以由下述所限定和覆盖的多种不同方式实施。
[0064]
如图1所示，本发明的优选实施例提供一种多uav协同轨迹规划方法，包括以下内容：
[0065]
步骤s1：对每个uav在协同轨迹规划中的约束条件和代价函数进行建模；
[0066]
步骤s2：采用b样条曲线表示每个uav的轨迹；
[0067]
步骤s3：采用进化算法对多uav协同轨迹规划问题进行求解，得到满足空间协同要求和时间协同要求的协同轨迹。
[0068]
可以理解，本实施例的多uav协同轨迹规划方法，先建立协同轨迹优化的约束模型和目标函数，将协同轨迹规划问题描述为参数最优化问题，然后，结合飞行器性能模型，采用b样条曲线参数化表示uav轨迹，最后采用进化方法对参数最优化问题进行求解，得到满足空间协同要求和时间协同要求的协同轨迹，实现了多uav轨迹间的时空协同。
[0069]
可以理解，所述步骤s1中的约束条件包括飞机机动性能约束、敌方威胁约束、飞行禁飞区约束、地形约束、终端位置约束、空间协同约束和时间协同约束。
[0070]
其中，飞机机动性能影响每一个阶段的任务执行，必须严格满足，否则生成的计划将不可执行，根据飞机的机动性能限制，建立约束式c1如下：
[0071][0072]
在公式(1)中，h(t)为飞行高度，v(t)为真空速，γ(t)为俯仰角，ψ(t)为航向角，μ(t)滚转角。
[0073]
敌方威胁的作用范围可近似为半球，故敌方威胁约束表示为约束式c2：
[0074][0075]
其中，||
·
||2表示两点之间的距离，和分别为第i个威胁的中心坐标及作用半径，(x(t)，y(t),h(t))为uav在t时刻的位置坐标。
[0076]
另外，飞行禁飞区包括气象禁飞区、危险高度禁飞区、未知区域，本发明采用无限长圆柱体模型表示，所规划的轨迹与该圆柱不能相交，故飞行禁飞区约束的约束式c3表示为：
[0077][0078]
其中，和分别为第i个飞行禁飞区的中心坐标及半径，n
nfz
为飞行禁飞区的数量。
[0079]
另外，地形因素对规划的影响主要体现在飞机的生存概率上，地形约束的约束式c4表示为：
[0080]
h(t)
‑
h
ij
(t)≥δh
ꢀꢀꢀꢀꢀꢀ
(4)
[0081]
其中，h(t)为飞机的飞行高度，h
ij
(t)为点(i,j)的地形高度，δh为最小安全高度阈值。
[0082]
可以理解，为了完成攻击任务，uav需要到达指定的攻击阵位，即满足终端位置约束。因此，需要计算攻击某一地面目标的武器可投放区(aar)，如图2所示，在投放点处按设定的投放条件投放制导炸弹，其所有可能的落点组成了可达区，通过在水平面内平移这些落点及其对应的弹道至与目标点重合，这时弹道的起点就组成了可投放区。另外，指定投放点获得可达区与指定目标点获得可投放区本质上是一致的。
[0083]
设(x
aar
，y
aar
,h
aar
)为武器可投放区的中心点坐标，则终端位置约束表示为：
[0084][0085]
其中，(x
f
,y
f
,h
f
)表示武器投放点位置，(δx,δy,δh)表示给定的允许偏差。
[0086]
另外，多uav间的空间协同约束主要是指uav间的相撞约束，即在飞行过程中，多uav间要时刻保持一定的安全距离，则空间协同约束表示为：
[0087]
||vp
i
(k)
‑
vp
j
(k)||2≥d
safe
,i,j＝1,2,
…
,n
v
,i≠j
ꢀꢀꢀꢀ
(6)
[0088]
其中，vp
i
(k)为第i个uav的k时刻轨迹点，d
safe
为uav间的最小安全间隔距离，n
v
为uav数量。
[0089]
另外，时间协同约束包括同时到达时间约束和时序约束，为了完成有效攻击，多uav必须按照指定时间或指定时序到达攻击阵位。时间协同约束表示为：
[0090]
t
s
δ
i
≤t
i
≤t
s
δ
i
τ
i
,i＝1,
…
,n
ꢀꢀꢀꢀ
(7)
[0091]
其中，t
s
为第一个uav的到达时间，t
i
为第i个uav的到达时间，δ
i
表示第i个uav与第一个uav之间的时间窗，δ1＝0，τ
i
表示第i个uav的飞行持续时间。对于同时到达时间约束问题，δ
i
＝τ
i
＝0；对于时序约束，δ
i
和τ
i
为正的恒定值，当τ
i
＝0，该时序约束退化为严格时序约束(即各uav的到达时间间隔相同)，上式(7)可进一步分解为：
[0092][0093]
可以理解，在多uav协同飞行到达指定攻击阵位过程中，需要期望每架uav能够以最小的代价到达目标点，同时还要使多uav的整体代价最小。具体地，所述步骤s1中的代价函数包括uav的飞行距离代价函数、飞行高度代价函数、威胁代价函数、协同代价函数和综
合代价函数。
[0094]
其中，为了减少燃油消耗，降低飞行风险，减少飞机在敌防空区域内的滞留时间，应最小化uav的飞行轨迹长度。为使目标函数标准化和可接纳，本发明采用实际飞行距离和最小飞行距离的比值描述uav的飞行距离代价，则飞行距离代价函数表示为：
[0095][0096]
其中，plr
i
为第i个uav的飞行距离代价，为第i个uav的第j个坐标点，n为轨迹点数量，l
min
为最小飞行距离，用第i个uav的起点到终点的直线距离表示。
[0097]
另外，uav的飞行高度越低，地形遮蔽的效果越好，越有助于规避未知雷达的探测，但飞行高度较低时，uav的撞地概率会较大。因此，飞行高度代价函数表示为：
[0098][0099]
其中，mfd
i
为第i个uav的飞行高度代价，为第i个uav的第j个坐标点，为该点的地形高度，h
safe
表示飞行的最小安全高度，n为轨迹点数量。
[0100]
另外，当uav不被敌防空雷达探测到时，敌防空威胁就无法对uav造成毁伤，而且雷达探测概率越小，uav越安全，因此uav的威胁代价可用雷达探测概率表示。
[0101][0102]
其中，p
d
为雷达r对目标的探测概率，r
pr
为第i个uav的轨迹点p到雷达r的距离，为雷达r的最大探测距离，p
f
表示雷达系统的虚警概率，k表示与雷达威力相关的归整化因子，包含了反映雷达目标探测威力的内在因素，σ为rcs值，即雷达r的散射截面积，los(p,r)为点p到点r的通视性判断方法，当两点间能够通视时为正，否则为负。
[0103]
从而，由n个雷达构成的组网雷达系统对第i个uav的探测概率表示为：
[0104][0105]
其中，prd
i
为组网雷达系统对第i个uav的探测概率，p
d
(r)为第r个雷达对目标的探测概率。
[0106]
可以理解，多uav协同任务计划的评价函数除了包含单个uav自身的代价外，还应包含各uav间的协同代价。当多uav间不满足协同约束时，协同任务将难以执行，因此在进行协同轨迹规划时，可将多uav对协同约束的满足程度通过uav的协同代价进行描述。本技术
主要考虑空间协同问题，即多uav避碰代价。假设在给定uav
i
和uav
j
的轨迹情况下，将每条轨迹的逐个轨迹点进行比较，如果轨迹点对的距离小于最小安全距离，检查到达该点的时间，如果到达时间间隔小于最小安全时间间隔，则该轨迹点对相撞。故结合公式(6)～(8)，协同代价函数表示为：
[0107][0108][0109]
其中，ac
i
为第i个uav与其它uav的协同代价，为第i个uav的第k个轨迹点，为第j个uav的第l个轨迹点，d
safe
为uav间的最小安全间隔距离，为第i个uav达到第k个轨迹点的时间，为第j个uav达到第l个轨迹点的时间，t
min
为两架uav到达同一个轨迹点的最小安全间隔时间，n
i
和n
j
分别为第i个uav及第j个uav的轨迹点数量。
[0110]
因此，第i个uav的综合代价函数表示为：
[0111][0112]
其中，j
i
为第i个uav的综合代价，为权系数，可根据偏好进行设置。
[0113]
进一步地，多uav协同轨迹规划问题的综合代价函数则可表示为：
[0114][0115]
其中，j为多uav协同轨迹规划的综合评价值，d为uav的个数。
[0116]
至此，所述步骤s1中已经将协同轨迹规划问题转化为参数最优化问题，待后续步骤进行参数最优化求解即可得到满足时空协同要求的协同轨迹。
[0117]
可以理解，b样条曲线是一种参数曲线，一段b样条曲线是由多段bezier曲线构成的，并且在其交点处保持一定的连续性。曲线相交点被称为断点，是严格递增的实数序列。k阶b样条曲线的表达式为：
[0118][0119]
其中，c
i
为控制点，作为曲线的基函数的系数，b
i,k
为第i个k次b样条基函数，可用考克斯—德布尔递推公式(cox de boor recursion)给出如下：
[0120][0121]
式中，b
i,k
(u)的下标i表示序号，k表示阶数。该递推公式表明，若要确定第i个k次b样条基函数b
i,k
(u)，需要用到u
i
,u
i 1
,
…
,u
i k 1
共k 2个节点，并称区间[u
i
,u
i k 1
]为b
i,k
(u)的支撑区间，在此区间之外，对应的基函数值为0。
[0122]
可以理解，b样条曲线采用控制点表示，其形状完全由控制点的位置决定，确定了每个控制点就相当于确定了b样条曲线，移动控制点就可灵活地调整曲线的形状。而采用b样条理论求解轨迹优化问题的思路是将轨迹表示成b样条曲线的控制点序列，从而将轨迹优化问题转换成参数优化问题，并采用数值优化方法进行求解。其中，将轨迹优化问题转换成参数优化问题的关键步骤如下：
[0123]
首先，提出伪时间概念，将时间要素t引入到b样条理论中，可表达为
[0124][0125]
其中，t0和t
f
分别是初始时刻和结束时刻，u∈(0,1)作为b样条曲线的节点。则uav的轨迹可用时间节点分段的形式表示为：
[0126]
对应节点序列u1；
[0127]
对应节点序列u2；
[0128]
…
；
[0129]
对应节点序列u
q
。
[0130]
其中，是对于k
j
次输出z
j
的第i个b样条基函数，是控制点，也是b样条基函数的系数，p
j
＝l
j
·
(k
j
‑
m
j
) m
j
表示控制点数量，其中l
j
是节点插值的数量，m
j
是在节点处的平滑条件。
[0131]
为了减少计算量，期望b样条曲线的次数越少越好，但二次曲线是一条抛物线，不能反映曲线的拐点，所以本发明选用3次b样条曲线进行参数化，曲线的阶k＝4。从空间n 1个点p
i
(i＝0,1,
…
,n)中每次取相邻的四个点作为控制点，即可得到一段3次b样条曲线。b样条曲线基函数可表示为：
[0132][0133]
故第i段3次b样条曲线可表示为：
[0134]
b
i,4
(u)＝b
1,4
(u)c
i
‑1 b
2,4
(u)c
i
b
3,4
(u)c
i 1
b
4,4
(u)c
i 2
ꢀꢀꢀ
(20)
[0135]
相应的矩阵表示形式为：
[0136][0137]
由于本发明研究的是三维空间中的轨迹规划问题，因此将普通的b样条曲线扩展到三维空间，则每个控制点c
i
可表示为(x
i
,y
i
,h
i
)。
[0138]
因此，第j段的uav轨迹用3次4阶b样条曲线表示为：
[0139][0140]
其中，z
j
(u)为uav的第j段轨迹，b
i,4
(u)为对于4次输出z
j
的第i个b样条基函数，u∈(0,1)，为b样条曲线的节点，为控制点序列，每个控制点表示为(x
i
，y
i
,h
i
)，i＝0,1,2,3。其中，3次b样条曲线的示意图如图3所示。
[0141]
由公式(22)可知，由于3次b样条基函数b
i,4
(u)已知，只要确定控制点序列便可由公式(22)生成第j段的uav轨迹，因此，通过3次b样条曲线将uav的轨迹映射为控制点序列，从而将轨迹规划问题形式化为参数优化问题，便于采用数值优化方法进行求解。
[0142]
可以理解，针对多uav协同轨迹规划的特点，本发明采用集中协调
‑
分布求解的思路，引入协调变量(cv)和协调函数(cf)的思想，构建基于协调变量的协同规划框架，多uav协同打击多目标的轨迹规划求解框架如图4所示。这种分解方法的优点在于：通过协调变量和协调函数把一个高维的优化问题分解成一个低维、计算量小的问题，集中协调单元只需知道协调变量的取值区间和每架飞机对应的协调函数即可，减少信息和数据传输量，提高了协同的效率。
[0143]
协同轨迹规划主要包括两个方面，单个uav轨迹的规划和多个uav轨迹间的时空协同。本发明采用协调变量和b样条理论进行协同轨迹规划的思路，是在单个uav轨迹规划中，选用b样条方法表示轨迹，使用群体智能优化算法生成多组满足空间协同要求的轨迹，并利用基于协调变量的方法进行时间协同。而在群体智能优化算法中，协进化算法(coevolutionary algorithm)是一种基于群体进化的算法，源于生物界中协同进化的思
想：两个或多个物种群体通过相互间的作用，促使双方向前进化。该算法通过种群内个体间的合作与竞争来实现对优化问题的求解，各个物种群体都采用进化算法(evolutionary algorithm,ea)实现进化过程，其原理简单，易于实现，得到广泛应用，因此本发明选用该算法进行问题求解。
[0144]
具体地，如图5所示，所述步骤s3包括以下内容：
[0145]
步骤s31：初始化协进化算法的种群，将每个uav作为一个子种群，并采用进化算法对b样条曲线的控制点序列进行编码；
[0146]
步骤s32：对初始化后的种群执行进化操作，产生下一代种群，合并初始化后的种群和产生的下一代种群，以产生新种群；
[0147]
步骤s33：对新种群的每个子种群进行并行搜索，并结合3次4阶b样条曲线生成每个uav的多条轨迹；
[0148]
步骤s34：基于每个uav的约束条件并结合综合代价函数对每个uav的每条轨迹进行评价，得到每条轨迹的综合评价值；
[0149]
步骤s35：采用同时到达的时间作为协调变量，并基于集中协调
‑
分布式求解的方式进行时间协同，得到协同到达时间满足要求且综合评价值满足要求的3m组轨迹，后执行步骤s36，否则，从新种群中选择2m组综合评价值满足要求的个体再次组成新的种群，再返回执行步骤s32；
[0150]
步骤s36：对每组轨迹的多uav协同轨迹规划问题进行综合评价，筛选出综合评价值满足要求的2m组轨迹；
[0151]
步骤s37：将筛选出的2m组轨迹构成新的种群，重复执行步骤s32～步骤s37，不断迭代，满足进化算法终止条件后停止迭代，从最终筛选出的综合评价值满足要求的2m组轨迹中选择综合评价值最小的一组轨迹作为协同轨迹输出。
[0152]
具体地，首先，初始化协进化算法的种群p0，将每个uav作为一个子种群p
0i
，令n
v
表示uav数量，2m表示每个子种群的规模，则初始化后的种群p
n
的规模为n＝2n
v
*m，采用进化算法对b样条曲线的控制点序列进行编码。其中，进化算法的编码原理属于现有技术，故在此不再赘述。
[0153]
然后，对初始化后的种群p
n
执行交叉、变异等进化操作，产生下一代种群q
n
，种群规模为n，合并初始化后的种群p
n
和产生的下一代种群q
n
，产生新种群r
n
，则新种群r
n
的规模为2n＝4n
v
×
m。
[0154]
接着，对新种群r
n
的每个子种群进行并行搜索，并结合公式(22)生成每个uav的多条轨迹。
[0155]
再基于公式(1)至(5)，并结合综合代价函数，即基于公式(9)至(14)，对每个uav的每条轨迹进行评价，得到每条轨迹的综合评价值。至此，可以对每个uav的每条轨迹进行综合评价，综合评价值越小，空间协同越好。
[0156]
再采用同时到达的时间作为协调变量，并基于集中协调
‑
分布式求解的方式进行时间协同，得到协同到达时间满足要求且综合评价值满足要求的3m组轨迹，即采用协同到达时间较小和综合评级值较低的3m组轨迹，然后执行后续步骤，否则，从新种群r
n
中选择2m组综合评价值较小的个体再次组成新的种群p
n 1
，再返回执行上述内容。
[0157]
然后，采用公式(15)对3m组轨迹中的每组轨迹进行综合评价，筛选出综合评价值
较小的2m组轨迹，此2m组轨迹是第一次迭代优化得到的空间协同和时间协同较好的多组轨迹。
[0158]
最后，继续迭代优化，将筛选出的2m组轨迹构成新的种群p
n 1
，重复执行上述内容，不断迭代，当满足算法终止条件后停止迭代，例如达到最大迭代次数后停止迭代，或者模型收敛后停止迭代，从最终筛选出的综合评价值较小的2m组轨迹中选择综合评价值最小的一组轨迹作为协同轨迹输出，该组协同轨迹具有最佳的空间协同和时间协同效果。
[0159]
可以理解，所述步骤s35中，为了描述环境的主要元素，定义χ
i
为uav
i
的状态空间，x
i
∈χ
i
为uav
i
的状态变量，定义u
i
(x
i
)为状态x
i
的可行决策变量集，u
i
∈u
i
(x
i
)为uav
i
的决策变量。则可定义f
i
:χ
i
×
u
i
→
c
r，其中r
c
表示协同空间。
[0160]
在状态x
i
下，uav
i
的可行协调变量集为：
[0161][0162]
在时间协同问题中，f
i
是轨迹点与可能到达时间集合的一种简单映射，θ
i
(x
i
)并不一定是连续集。但是，对于特定的轨迹和速度选择，协调变量能够取得唯一值θ
i
＝f
i
(x
i
,u
i
)∈θ
i
(x
i
)。
[0163]
同时到达时间约束可表述为：
[0164][0165]
时序约束可表达为：
[0166][0167]
设f
j
是可逆的，其逆函数为f
i
‑1:χ
i
×
θ
i
→
u
i
，u
i
＝f
i
‑1(x
i
,θ)，决策量u
i
是状态变量x
i
和协调变量θ
i
的函数。对于特定状态x
i
，一个确定的协调变量θ
i
对应唯一的决策量u
i
。如果所有uav得到了一致的协调变量，即θ1＝
…
＝θ
n
＝θ
*
，则在u
i
＝f
i
‑1(x
i
,θ
*
)的控制下，多uav必能完成协同任务。
[0168]
因此，本发明仅考虑同时到达情况，将同时到达的时间作为协调变量，第i个uav的到达时间的取值范围可根据飞行器的速度范围[v
min
,v
max
]确定：
[0169][0170]
其中，表示第i个uav的第q段轨迹长度，q为第i个uav的轨迹段数量，t0为同时出发时刻，为了使各个uav的飞行时间尽量小，取协同到达时间集合中的最小值作为多uav的协同到达时间：
[0171]
[0172]
在公式(28)中，若则需要对各uav的轨迹重新进行计算。
[0173]
可以理解，如图6和图7所示，本发明的多uav协同轨迹规划方法在实际场景仿真中实现了两架飞机协同攻击两个静态的地面目标，同时满足飞机动力学约束、状态量和控制量约束，特别是同时到达时间约束。
[0174]
另外，如图8所示，本发明的另一实施例还提供一种多uav协同轨迹规划系统，优选采用如上所述的规划方法，所述规划系统包括：
[0175]
建模模块，用于对每个uav在协同轨迹规划中的约束条件和代价函数进行建模；
[0176]
轨迹表征模块，用于采用b样条曲线表示每个uav的轨迹；
[0177]
分析模块，用于采用同时到达的时间作为协调变量并基于集中协调
‑
分布式求解的架构进行多uav协同轨迹规划问题求解，得到满足空间协同要求和时间协同要求的协同轨迹。
[0178]
可以理解，本实施例的多uav协同轨迹规划系统，先建立协同轨迹优化的约束模型和目标函数，将协同轨迹规划问题描述为参数最优化问题，然后，结合飞行器性能模型，采用b样条曲线参数化表示uav轨迹，最后采用进化方法对参数最优化问题进行求解，得到满足空间协同要求和时间协同要求的协同轨迹，实现了多uav轨迹间的时空协同。
[0179]
可以理解，本实施例的系统中的各个模块分别与上述方法实施例中的各个步骤相对应，故每个模块的工作原理在此不再赘述，参考上述方法实施例即可。
[0180]
另外，本发明的另一实施例还提供一种设备，包括处理器和存储器，所述存储器中存储有计算机程序，所述处理器通过调用所述存储器中存储的所述计算机程序，用于执行如上所述的方法的步骤。
[0181]
另外，本发明的另一实施例还提供一种计算机可读取的存储介质，用于存储进行多uav协同轨迹规划的计算机程序，所述计算机程序在计算机上运行时执行如上所述的方法的步骤。
[0182]
一般计算机可读取存储介质的形式包括：软盘(floppy disk)、可挠性盘片(flexible disk)、硬盘、磁带、任何其与的磁性介质、cd
‑
rom、任何其余的光学介质、打孔卡片(punch cards)、纸带(paper tape)、任何其余的带有洞的图案的物理介质、随机存取存储器(ram)、可编程只读存储器(prom)、可抹除可编程只读存储器(eprom)、快闪可抹除可编程只读存储器(flash
‑
eprom)、其余任何存储器芯片或卡匣、或任何其余可让计算机读取的介质。指令可进一步被一传输介质所传送或接收。传输介质这一术语可包含任何有形或无形的介质，其可用来存储、编码或承载用来给机器执行的指令，并且包含数字或模拟通信信号或其与促进上述指令的通信的无形介质。传输介质包含同轴电缆、铜线以及光纤，其包含了用来传输一计算机数据信号的总线的导线。
[0183]
以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

转载请注明原文地址:https://win.8miu.com/read-250165.html

专利

最新回复(0)