本申请涉及数据分析,特别是涉及基于类别预测模型的特征分桶方法、设备及存储介质。
背景技术:
1、随着海量数据的产生,单纯依靠人力对这些数据进行处理,效率低下且代价高昂,因此如何从这些海量数据中挖掘出重要的有效信息是亟待解决的关键问题。
2、目前通常使用聚类系统对海量数据进行处理以对海量数据进行挖掘,如何对数据进行有效切分是影响聚类效率和性能的关键因素。
技术实现思路
1、本申请主要解决的技术问题是提供基于类别预测模型的特征分桶方法、计算机设备及存储介质,能够基于类别对特征进行合理的分桶,从而实现对海量的特征数据进行有效分类。
2、为解决上述技术问题,本申请采用的第一个技术方案是:提供一种基于类别预测模型的特征分桶方法,该方法包括:获取多张图像的特征;利用类别预测模型预测每个特征的类别;将属于类别及其关联的亲密类别的特征放入同一个桶中,以对多张图像的特征进行分桶;其中,类别预测模型是基于图像集中的至少部分图像的特征及其标签对初始模型训练得到的,一类别关联的亲密类别包括类别预测模型对输入特征进行预测而得到的除一类别以外的其他类别。
3、为解决上述技术问题,本申请采用的第二个技术方案是:提供一种计算机设备,该计算机设备包括处理器、存储器和通信电路,存储器和通信电路耦接处理器,存储器存储有计算机程序,该处理器用于执行计算机程序以实现如上述本申请第一个技术方案提供的方法。
4、为解决上述技术问题,本申请采用的第三个技术方案是:提供一种计算机可读的存储介质,该计算机可读的存储介质存储计算机程序,该计算机程序能够被处理器执行以实现如上述本申请第一个和第二个技术方案提供的方法。
5、本申请的有益效果是:区别于现有技术的情况,通过获得多张图像的特征,利用类别预测模型预测每个特征的类别,将属于类别的特征放入类别对应的桶中,从而可以将相似的特征放入一个桶,实现对特征的切分,并且将与该类别相关联的亲密类别的特征也放入类别对应的桶中,从而将相似的特征放入同一个桶,提高特征分桶的准确率,从而实现对海量的特征的有效分类。
1.一种基于类别预测模型的特征分桶方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求2所述的方法,其特征在于,
4.根据权利要求3所述的方法,其特征在于,
5.根据权利要求1所述的方法,其特征在于,所述图像集包括训练集和验证集;
6.根据权利要求5所述的方法,其特征在于,
7.根据权利要求6所述的方法,其特征在于,
8.根据权利要求1所述的方法,其特征在于,
9.一种计算机设备,其特征在于,包括:处理器、存储器和通信电路;所述通信电路和所述存储器分别耦接所述处理器,所述存储器用于存储计算机程序,所述处理器用于读取并执行所述计算机程序,以实现如权利要求1-8任一项所述方法。
10.一种计算机可读的存储介质,其特征在于,存储有计算机程序,所述计算机程序能够被处理器读取并执行,以实现如权利要求1-8任一项所述的方法。