一种综合双重联系的多视角信息瓶颈聚类算法

专利检索2022-05-11  7



1.本发明属于模式识别中的聚类分析领域,尤其涉及一种综合双重联系的多视角信息瓶颈聚类算法。


背景技术:

2.多视角聚类旨在挖掘并利用多个视角数据之间的互补信息以得到有效的具有视角一致性的聚类结果。近年,已有大量的多视角聚类算法被相继提出,并且成功应用到了诸多实际领域,如交通、教育、医疗、金融等。然而,当前大量多视角聚类算法仅考虑了视角之间的特征或者数据簇的关联关系,未能挖掘并充分利用两者的优势来进行数据划分。这给当前算法的实际应用性带来了极大的挑战,亟需一种可以兼顾两种信息的多视角算法来得到更为有效的聚类结果。
3.信息瓶颈是一种典型的模式识别方法,旨在尽可能地将输入变量压缩至压缩变量,同时最大程度地保留与相关变量之间的信息。针对多视角数据,诸多多视角信息瓶颈算法被提出,并且取得了较好的效果。然而,这些算法大多采用特征加权或者数据簇协同的方式来挖掘视角间的互补或者一致性信息,均不能充分利用视角间特征或者数据簇之间丰富的关联关系。因此,如何改进信息瓶颈方法以有效挖掘两者信息,提高数据聚类性能,是目前亟需解决的问题。


技术实现要素:

4.本发明实施例提供了一种综合双重联系的多视角信息瓶颈聚类算法,主要解决现有多视角聚类算法未能充分考虑多视角数据特征和数据簇两方面联系导致聚类性能下降的问题。
5.为达到该目的,本发明实施例提供了一种综合双重联系的多视角信息瓶颈聚类算法,包括以下步骤:
6.s1、获取多视角文本、图像或视频数据x={x1,x2,...,xn},n表示输入数据的数量;
7.s2、对多视角数据进行预处理,得到每个视角的联合概率分布表示其中,di表示第i个视角的特征维度,m表示视角的数量;
8.s3、采用信息瓶颈方法发现每个视角内部的个性化特征信息
9.s4、通过一种凝聚式方法学习一个多视角共享特征子空间来发现视角间的共性化特征信息ys;
10.s5、整合各视角的个性化特征和视角间共性化特征信息ys得到每个视角的局部聚类结果
11.s6、使用互信息度量各个局部聚类结果挖掘视角之间的密切的数据簇联系以得到最终的具有一致性的全局数据聚类结果t
*

12.本发明的特点还在于,
13.s1中,获取各种多视角数据集是指通过各种软硬件设备捕捉到丰富多样的多视角数据,比如使用摄像机获得不同角度下同一种人体行为动作的多视角视频数据。
14.s2中数据预处理,具体是指使用经典的词袋模型将所有输入的多视角数据标准化到联合概率分布其中,表示每个视角的特征,di表示第i个视角中数据样本的维度,m表示视角的数量。
15.s3中具体为:采用信息瓶颈方法,目标函数表示为以发现每个视角内部的个性化特征信息其中,参数β用来平衡数据的压缩与保留。
16.s4中的凝聚式方法具体为:首先将各个视角的特征表示层叠为ya,并将其初始化为共享子空间特征表示ys,即ys←
ya,进而,计算各特征元素对之间的融合代价,表示为:
[0017][0018]
其中,kl代表kullback-liebler距离,接着,挑选代价最小的特征对进行融合,进而不断迭代以上过程,直到所融合后的特征维度达到预先设定的共享特征子空间的大小。
[0019]
s5具体为:引入一个调整参数γ以平衡各个视角内部的个性化特征与视角之间的共性化特征ys对于局部聚类结果的贡献程度,具体表达为:
[0020][0021]
s6具体为:采用标准化的互信息度量局部聚类结果中数据簇之间的密切联系,定义为:
[0022][0023]
其中,h(a)代表变量a的熵。依据该定义,输入局部聚类结果可以求得最终的全局聚类结果t
*

[0024]
本发明的有益效果为:
[0025]
一种综合双重联系的多视角信息瓶颈聚类算法,首先,针对当前多视角聚类算法仅考虑视角间部分特征信息的问题,即各个视角的个性化信息或者共有信息,所提出的算法可以综合两者的优势,充分发挥视角间特征关联信息的优势来得到有效的局部聚类结果。另外,针对当前协同聚类方法需要引入额外均衡参数的问题,所提算法采用无参数的互信息度量并发现多个局部聚类结果之间密切簇联系,从而提高整体的聚类性能。总体来讲,与现有算法比较,综合双重联系的多视角信息瓶颈聚类算法在多视角数据聚类问题上,本发明具有更好的聚类结果,体现了算法的可用性。
附图说明
[0026]
图1是本发明实施例提供的一种综合双重联系的多视角信息瓶颈聚类算法框架图;
具体实施方式
[0027]
为使本技术实施例的目的、技术方案及优点更加清楚,下面结合附图和具体实施方式对本发明进一步详细说明,应理解这些实例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本技术所附权利要求所限定的范围。
[0028]
本发明一种综合双重联系的多视角信息瓶颈聚类算法,其整体框架如图1所示,具体按照以下步骤实施:
[0029]
s1、获取多视角文本、图像或视频数据x={x1,x2,...,xn},n表示输入数据的数量;其中,各种多视角数据集是通过各种软硬件设备捕捉到丰富多样的多视角数据,比如使用摄像机获得不同角度下同一种人体行为动作的多视角视频数据。
[0030]
s2、使用经典的词袋模型对多视角数据进行预处理,得到每个视角的标准化联合概率分布表示其中,di表示第i个视角的特征维度,m表示视角的数量;
[0031]
s3、采用信息瓶颈方法发现每个视角内部的个性化特征信息其中,参数β用来平衡数据的压缩与保留;
[0032]
s4、通过一种凝聚式方法学习一个多视角共享特征子空间来发现视角间的共性化特征信息ys;具体来讲,首先将各个视角的特征表示层叠为ya,并将其初始化为共享子空间特征表示ys,即ys←
ya,进而,计算各特征元素对之间的融合代价,表示为:
[0033][0034]
其中,kl代表kullback-liebler距离,接着,挑选代价最小的特征对进行融合,进而不断迭代以上过程,直到所融合后的特征维度达到预先设定的共享特征子空间的大小。
[0035]
s5、整合各视角的个性化特征和视角间共性化特征信息ys得到每个视角的局部聚类结果具体来讲,引入一个调整参数γ以平衡各个视角内部的个性化特征与视角之间的共性化特征ys对于局部聚类结果的贡献程度,表示为:
[0036]
s6、使用标准化的互信息度量各个局部聚类结果挖掘视角之间的密切的数据簇联系以得到最终的具有一致性的全局数据聚类结果t
*
。其中,标准化的互信息可定义为:
[0037][0038]
其中,h(a)代表变量a的熵。依据该定义,输入局部聚类结果可以求得最终的全局聚类结果t
*

转载请注明原文地址:https://win.8miu.com/read-950301.html

最新回复(0)