一种基于信息时效价值的多主体协作感知方法

专利检索2025-06-18  17


本发明属于无线传感网络合作感知,具体涉及一种基于信息时效价值的多主体协作感知方法。


背景技术:

1、得益于海量的连接和自动化技术,自动驾驶近些年广受关注,成为最能展现机器通信特点的应用。实时和可靠的感知是自动驾驶安全高效的基础。雷达感知技术被广泛用来感知车辆、行人的位置以及追踪运动状态,用于附近车辆的自动规划路线和规避碰撞。由于道路状态的复杂性和时变特性,单独感知在跟踪过程中容易出现感知视野盲区,对于实时跟踪来说是一个大挑战。得益于v2x(vehicle-to-everything)技术的发展,使合作感知成为可能,分布式智能感知单元共同完成追踪任务,通过通信提升感知视野和感知质量。

2、目前,合作感知根据信息和融合阶段的不同主要有三类合作感知方法,分别为结果融合、特征融合和原始数据融合。在结果融合方法中,这些信息的体量相对较小如目标检测结果融合中的前方碰撞警告、变道等场景改变信息,但传感器数据中细节的丢失会导致合并来自多个来源的噪声和差异结果的困难。特征融合通过使用神经网络提取关键特征,在通信负载方面在上述原始数据融合和结果融合之间取得平衡。在原始数据融合方法中,原始传感数据如雷达点云数据和图像数据直接传给其他合作者,这样充分保护了信息的完整性,具有保留所有信息的优点,可以更好地发挥附加信息的全部潜力,但是,高清视频或激光雷达点云的实时流在单个链路上每秒需要几兆字节,不适用带宽限制场景。因此,利用目标检测方法来进行待追踪物体的原始数据传输,可以大大减少数据传输量。

3、在合作感知中传感器的合作调度方案中,由于车联网中高实时性的要求和带宽资源的限制,广播方式的传播合作信息的方式会带来很高的时延和干扰,会有较大的缺陷。在单播方式下,如何进行传感器的合作调度(与谁合作)就是当前的一大挑战和亟需解决的重要问题。由于观测终端功率限制,追踪距离,观测角度和车辆速度的因素,即便观测同一辆车,观测质量在不尽相同,而且随着时间变化,解决这个问题的关键就是评价信息的实时价值,寻找信息实时价值高的终端进行信息合作。当有多个合作候选可用时,由于不清楚的遮挡关系、异构传感器质量,准确确定视点的感知增益是具有挑战性的。文献[y.jia,r.mao,y.sun,s.zhou,and z.niu,“online v2x scheduling for raw-level cooperati veperception,”in icc 2022-ieee international conference on communications,seoul,korea,april 2022,pp.309–314.]中考虑了相邻车辆的波动性、v2x通道的异质性以及时变的交通环境,提出了一种具有对数性能损失的基于在线学习的算法。文献[y.jia,r.mao,y.sun,s.zhou,and z.niu,“mass:mobility-aware senso r schedulingofcooperative perception for connected automated driving,”ieee trans actionson vehicular technology,2023.]利用过去的观测值来预测感知增益,利用感知增益的时间连续性提出了一种新的方法,在调度中学习。在合作感知中传感器的合作调度方案中,许多体系结构依赖额外的元数据消息来收集有关额外传感器感知增益的线索,例如轨迹和空间置信图,但是随着车辆的快速运动和传感功率以及信道条件的变化,这些信息很快就变得陈旧。在本身的终端难以知道其他候选终端的实时观测质量,只能依据合作时刻的观测质量来大致估计目前的观测质量,这就涉及到依据信息年龄进行估计的精度的相关研究。

4、在无线传感网络合作感知场景中,车辆跟踪已成为无线传感器网络在救援、监视、交通监控等领域的关键应用之一。文献[j.li,q.-s.jia,x.guan,and x.c hen,“trackinga moving object via a sensornetwork with apartial information broad castingscheme,”information sciences,vol.181,no.20,pp.4733–4753,2011.]中考虑了相邻车辆的波动性、v2x通道的异质性以及时变的交通环境,提出了一种具有对数性能损失的基于在线学习的算法。另外,该文献中还针对运动目标跟踪问题,提出了一种部分信息广播方案(pibs)。在pibs下,所有节点进行单独测量,只有部分节点广播数据,量化了通信容量与跟踪精度之间的关系。传统的集中式传感器调度框架由于资源消耗和通信带宽有限导致任务过载的,无法满足wsn中车辆跟踪的实时性要求。为了解决这一问题,文献[t.liang,y.lin,l.shi,j.li,y.zhang,andy.qian,“distributed vehicle tracking inwireless sen sornetwork:a fully decentralized multiagent reinforcement learning approach,”ieee sensors letters,vol.5,no.1,pp.1–4,2020.]提出了一种多智能体分布式传感器调度框架。

5、在能耗约束下的合作感知方案中,雷达波束功率和感知质量息息相关,同时通信增强感知的过程也需要消耗能量,因此无法避免的一个考虑就是系统的能耗问题。因为合作感知任务是动态的,而且传感器终端的能量存储和负载状态也是异构的。合作算法使问题更加复杂,合作可以提升观测质量从而减少下一时隙的功率分配,本地功率分配同时影响到合作者选择的问题,如何权衡能量和观测质量,使系统整体的跟踪性能最优,实现节能的环境感知,成为非常棘手的问题。文献[s.leng and a.yener,“minimizing ageofinformation for an en ergy harvesting cognitive radio,”in 2019ieee wirelesscommunications andnetwo rking conference(wcnc),marrakesh,morocco,april 2019,pp.1–6.]中研究了认知无线电能量采集通信中的平均信息年龄最小化问题。辅助用户的目标是通过基于其能量可用性和主频谱可用性自适应地进行感知和更新决策来最小化平均aoi,给出了将序列决策问题表述为部分可观察马尔可夫决策过程,并采用动态规划方法求解。能耗约束下的合作感知方案仅仅考虑优化单一目标,未能将能耗和观测质量联合优化,对于无线传感网络合作感知场景下,能耗和跟踪质量都是关键指标。


技术实现思路

1、针对现有技术存在的不足,本发明提供一种基于信息时效价值的多主体协作感知方法。本发明从以下几个方面解决了现有技术存在的缺陷:第一,本发明在能量异构的分布式智能传感网络中,提出原始级的信息合作来进行通信增强感知框架,使得整个系统的长期观测质量和能耗达到最优。第二,本发明根据卡尔曼滤波器追踪误差矩阵和信息年龄的关系,基于信息增益和mab理论的传感器调度的算法,使得合作效率提高,同时不增加整个系统的通信和能量开销。第三,本发明提出了一种基于实时增益的合作卡尔曼滤波算法,解决了信息融合问题,同时根据过去的观察和合作端信息年龄,来调整信息融合的比重,使得观测置信度高的信息发挥更大作用。本发明提高了wsn网络整体的鲁棒性和性能表现,可在能耗限制下实现更加精确的全方位的实时追踪。

2、本发明为解决技术问题所采用的技术方案如下:

3、本发明提供的一种基于信息时效价值的多主体协作感知方法,包括以下步骤:

4、步骤一、构建系统模型;

5、设定特定的自我传感器i,并通过自我传感器i更新感知状态并预测下一个时间槽的目标车辆位置;

6、步骤二、构建感知模型;

7、对于移动目标,时间槽t的运动状态向量表示为(xt,yt)和分别表示笛卡尔坐标系中的位置和速度分量;跟踪任务是通过测量和状态预测来确定目标运动状态,因此将目标运动过程表示为:

8、st=fst-1+wt  (1)

9、其中f表示状态转移矩阵:

10、

11、其中st-1表示时间槽t-1的运动状态向量;i2表示2×2的单位矩阵;wt表示运动噪声,假设其为零均值的高斯分布,其协方差φ为已知的:

12、

13、其中表示噪声强度,ts表示采样间隔;

14、基于感知回波信号的测量在los通道假设下表示为:

15、

16、其中λ表示波长,g表示天线增益,fc表示多普勒频移,d表示传感器与目标之间的距离,j表示虚数单位,u(t)表示发射信号;

17、雷达估计参数为yt=[dt,vt,θt]t,dt、vt、θt分别表示测量目标距离、速度和到达角;

18、因此,非线性测量模型描述为:

19、

20、其中h(st)表示非线性函数;表示测量噪声,假设其为零均值的高斯白噪声,其测量协方差矩阵为:

21、

22、其中和分别表示对于距离、速度和到达角估计的克拉默-拉奥界;

23、在一个时间槽t内,感知所需的能量为:

24、

25、其中pt表示分配的感知功率;

26、步骤三、构建通信模型;

27、根据有限码长n的信道容量限制理论,通信延迟为:

28、

29、其中n0表示噪声功率谱密度,q(ε)表示标准正态分布的右尾函数,ε表示系统允许误码率,b表示信道的带宽,p表示传输功率,h(t)和v分别表示时间槽t内邻近传感器和自我传感器i之间的信道状态和信道散度;因此通信所需的能量为:

30、

31、步骤四、合作感知中的信息年龄度量;

32、对于任意时间槽t,自我传感器i合作的候选集为vi,t,|vi,t|=m(t)-1,m(t)为时间槽t中跟踪车辆的传感器节点数量;假设j是时间槽t中的最佳合作传感器节点,对于自我传感器i,合作传感器k∈vi,t的信息年龄表示为:

33、

34、其中表示自我传感器i与合作传感器k上次合作的时间;合作感知中的aoi的演变表示为:

35、

36、其中表示上一时刻的合作信息年龄;

37、步骤五、实时增益建模;

38、对于自我传感器i,在时间槽t评估其本地跟踪质量的指标通过pcrb来衡量;费舍尔信息用于衡量收集到的状态信息对预测当前位置的帮助程度,其表示为:

39、

40、其中j(st)表示费舍尔信息,表示对st,yt求期望,p(st)表示st的概率分布,状态使用了上一时刻扩展卡尔曼滤波器预测的状态pcrb定义如下:

41、ρ=trace(j-1(st))  (17)

42、其中ρ表示后验克拉默-拉奥界;

43、使用ρi,t=trace(j-1(st,pi,bi))来衡量自我传感器i在时间槽t的跟踪qos,pi表示自我传感器i分配的感知功率,bi表示分配的感知带宽;

44、利用跟踪qos和合作感知中的aoi的时间连续性来联合推断其他车辆的当前实时增益;合作传感器k对自我传感器i的实时增益定义为:

45、

46、其中表示开发,表示有关信息年龄的探索函数,α表示权衡参数,表示探索;

47、步骤六、优化问题建模;

48、假设协作通信过程中各传感器在每个时间槽内的信道状态h(t)、通信功率p和带宽b是一致且固定的,卡尔曼滤波器计算的能量消耗忽略不计,感知带宽b是固定的,感知信号彼此正交互不干扰;那么,自我传感器i在时间槽t的能耗为表示在一个时间槽t内自我传感器i感知所需的能量;因此,优化问题如下:

49、

50、其中πp表示功率分配策略,πa表示调度策略,w表示跟踪性能和能耗之间的权衡参数,ρi,t表示自我传感器i在时间槽t的跟踪qos,表示自我传感器i允许最小感知功率,表示自我传感器i允许最小感知功率,τ表示系统最大通信时延,限制条件1满足传感器功率限制限制条件2满足通信中的延迟约束限制;

51、其中,所述功率分配策略πp通过求解子问题来更新,所述调度策略通过求解子问题来更新;所述子问题为功率分配问题,所述子问题为传感器调度问题;

52、步骤七、采用梯度下降功率分配-合作感知传感器调度算法实现功率分配和传感器调度问题的优化;

53、步骤八、设计并执行基于实时增益的合作扩展卡尔曼滤波算法。

54、进一步的,所述系统模型中,通过部署在路边单元中的多个传感器节点共同估计单辆车辆的状态,当目标车辆出现在无线传感器网络的监测区域时,无线传感器网络保持跟踪和合作感知;时间槽由t=1,2,...,t表示,目标车辆在时间槽t=1进入无线传感器网络的监测区域,并在t=t离开。

55、进一步的,步骤四中,所述合作感知包括独立感知和信息融合两个阶段,所述独立感知阶段中,采用扩展卡尔曼滤波方法的跟踪过程分为预测阶段和补偿阶段,对于离散时间系统,自我传感器i在时间槽t的aoi表示为:

56、δ(i)(t)=(1-b(t))δ(i)(t-1)+1  (11)

57、其中δ(i)(t-1)表示自我传感器i在时间槽t-1的信息年龄,b(t)∈{0,1}表示自我传感器i在时间槽t是否进行感知,b(t)=1表示自我传感器i在时间槽t进行感知,b(t)=0表示自我传感器i在时间槽t不进行感知;状态跟踪和mse矩阵mt更新为:

58、

59、

60、其中kt表示kalman增益,ot表示时间槽t处的测量值,表示使用t-δ(i)(t)时刻的信息估计当前的状态量,非线性函数通过从笛卡尔坐标系到极坐标系的坐标变换得到,表示h函数关于状态量的雅可比矩阵,表示使用t-δ(i)(t)时刻的信息估计当前的状态量的误差矩阵。

61、进一步的,步骤五中,探索目标是在平衡探索和开发的情况下学习和调度最优传感器;根据卡尔曼滤波跟踪误差分布与时间的关系,选择最优的探索函数

62、进一步的,步骤六中,所述子问题和子问题具体为:

63、

64、

65、其中表示合作传感器at对自我传感器i在时间槽t的实时增益。

66、进一步的,步骤七中,所述梯度下降功率分配-合作感知传感器调度算法的具体流程如下:

67、输入:初始传感器位置l,噪声强度采样间隔ts,车辆初始状态s0,参数集

68、输出:感知功率p和合作传感器调度策略πa;

69、1for t=1,2,...,t do;

70、2根据传感器位置和车辆位置决定参与追踪的传感器集合vt;

71、3 for i∈vt do;

72、4计算测量噪声矩阵ψt;

73、5得到感知

74、6计算最佳功率分配

75、7 if任何传感器k∈vt尚未被调度then调度传感器k,即at=k;

76、8 else计算其他传感器的实时增益gi,k;

77、9调度实时增益最大的传感器作为合作者

78、10发送一个请求给传感器at以获取传感器数据,压缩以满足时延条件;

79、11接收传感器数据,运行基于实时增益的合作卡尔曼滤波器评估感知增益

80、12更新传感器at的最近一次观测到的感知qos:

81、13更新传感器at的最近一次观测时间:

82、14 returnp,πa。

83、进一步的,步骤八中,所述基于实时增益的合作扩展卡尔曼滤波算法的具体流程如下:

84、1)状态预测:

85、

86、其中,表示使用时间槽t-1的信息估计时间槽t的自我传感器i状态量,si,t-1表示自我传感器i在时间槽t-1的运动状态向量;

87、2)误差矩阵预测:

88、mi,t|t-1=fmi,t-1fh+φ  (25)

89、其中,mi,t|t-1表示使用时间槽t-1的信息估计时间槽t的自我传感器i状态量的误差矩阵,mi,t-1表示时间槽t-1自我传感器i状态量的误差矩阵,fh表示f矩阵的共轭转置;

90、3)资源分配:通过解决具有跟踪qos的凸优化问题来分配资源(pi,pk)。

91、4)分别计算两个传感器观测的卡尔曼增益:

92、

93、

94、其中,表示矩阵的转置,表示自我传感器i在时间槽t处的测量协方差矩阵,表示h函数关于自我传感器i在时间槽t处状态量的雅可比矩阵,表示矩阵的转置,表示合作传感器k在时间槽t处的测量协方差矩阵,表示h函数关于合作传感器k在时间槽t处状态量的雅可比矩阵;

95、5)状态追踪:

96、

97、其中,gi表示自我传感器i的实时增益,gk表示合作传感器k的实时增益,yi,t表示自我传感器i在时间槽t的雷达估计参数,yk,t表示合作传感器k在时间槽t的雷达估计参数,表示时间槽t的自我传感器i状态量,表示使用时间槽t-1的信息估计时间槽t的合作传感器k状态量;

98、6)误差矩阵更新:

99、

100、所述自我传感器i通过使用基于实时增益的合作扩展卡尔曼滤波算法进行迭代预测和跟踪来提供跟踪服务。

101、本发明的有益效果是:

102、无线传感网络合作感知场景中,目标往往是以最小的通信资源换取最高的感知性能,但是因为通信不可避免的给系统带来延迟,造成信息新鲜度下降,对于自动驾驶这类对实时性要求更高的场景下,需要将实时增益纳入通信方案的设计中。本发明利用机动性并根据其他传感器终端数据的历史感知增益做出调度决策,与现有方法相比,调度开销明显减少,这导致了多臂武装强盗(mab)问题,这需要权衡探索环境和开发经验最优的行动。得益于卡尔曼滤波跟踪的可解释性,本发明首次对卡尔曼滤波器预测误差和信息年龄进行链接,同时根据本地误差矩阵和信息年龄的关系,扩展到合作端实时增益,解决了mab问题中探索函数的选择问题。同时根据实时增益改进了信息如何融合的问题,利用“能者多劳”的思想,提出了实时增益合作卡尔曼滤波算法,解决了合作感知中信息融合的问题。

103、本发明通过设计实时增益驱动的传感器数据交互策略,提升智能网联驾驶应用与智能交通应用中传感器网络的感知精度,在决定衡量追踪精度的后验克拉美罗界上,相较于随机交互策略在不提升能耗的前提下提升33%的追踪精度,有助于满足可靠的精度保障、较低的传输时延,以及复杂场景的可用性、安全冗余、鲁棒性等要求,从而保障云控系统各类应用服务中感知与时空定位的可靠性、准确性和可用性。支持的智能网联驾驶应用与智能交通应用区域内获取实时数字映射信息及车辆接受云控系统指令并进行快速响应的能力。


技术特征:

1.一种基于信息时效价值的多主体协作感知方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于信息时效价值的多主体协作感知方法,其特征在于,所述系统模型中,通过部署在路边单元中的多个传感器节点共同估计单辆车辆的状态,当目标车辆出现在无线传感器网络的监测区域时,无线传感器网络保持跟踪和合作感知;时间槽由t=1,2,...,t表示,目标车辆在时间槽t=1进入无线传感器网络的监测区域,并在t=t离开。

3.根据权利要求1所述的一种基于信息时效价值的多主体协作感知方法,其特征在于,步骤四中,所述合作感知包括独立感知和信息融合两个阶段,所述独立感知阶段中,采用扩展卡尔曼滤波方法的跟踪过程分为预测阶段和补偿阶段,对于离散时间系统,自我传感器i在时间槽t的aoi表示为:

4.根据权利要求1所述的一种基于信息时效价值的多主体协作感知方法,其特征在于,步骤五中,探索目标是在平衡探索和开发的情况下学习和调度最优传感器;根据卡尔曼滤波跟踪误差分布与时间的关系,选择最优的探索函数

5.根据权利要求1所述的一种基于信息时效价值的多主体协作感知方法,其特征在于,步骤六中,所述子问题和子问题具体为:

6.根据权利要求1所述的一种基于信息时效价值的多主体协作感知方法,其特征在于,步骤七中,所述梯度下降功率分配-合作感知传感器调度算法的具体流程如下:

7.根据权利要求1所述的一种基于信息时效价值的多主体协作感知方法,其特征在于,步骤八中,所述基于实时增益的合作扩展卡尔曼滤波算法的具体流程如下:


技术总结
一种基于信息时效价值的多主体协作感知方法,属于无线传感网络合作感知领域,包括:构建系统模型;构建感知模型;构建通信模型;合作感知中的信息年龄度量;实时增益建模;优化问题建模;采用梯度下降功率分配‑合作感知传感器调度算法实现功率分配和传感器调度问题的优化;设计并执行基于实时增益的合作扩展卡尔曼滤波算法。本发明用原始级的信息合作来进行通信增强感知框架,使整个系统长期观测质量和能耗达到最优;根据卡尔曼滤波器追踪误差矩阵和信息年龄的关系,基于信息增益和MAB理论的传感器调度算法提高合作效率;基于实时增益的合作卡尔曼滤波算法解决信息融合问题。本发明提高了感知精度、可靠性和鲁棒性,降低了传输时延。

技术研发人员:秦晓琦,高健,马楠,丁川,于滨
受保护的技术使用者:北京邮电大学
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1155320.html

最新回复(0)