本发明涉及数据处理的,尤其是涉及一种数据关联规则的挖掘方法、装置及电子设备。
背景技术:
1、高空台飞行环境模拟系统在航空发动机试验过程中将产生大量的试验数据,这些试验数据包括不同点位的温度压力、阀门开度、空气流量等,其种类数往往超过一百种,它们产生的背后是高空台控制系统的运行规律与设备特性,不同参数之间的动态联系反映着整个系统内部的耦合关系,如何通过相应手段将这些耦合关系尽可能全面的挖掘出来是高空台飞行环境模拟系统建模与控制系统设计工作的关键技术之一。
2、目前,相关技术提出,可以依赖于机理分析,通过数学推导分析不同参数之间的影响关系,通过数学推导和数学建模,虽然可以基于力学原理来计算出不同参数之间的影响机理和变化规律,但该方案极其依赖研究人员对物理模型的理解,若存在忽略的影响因素,则会导致分析结果和实际情况存在偏差,从而影响数据关联规则的分析精确度,若全面细致的对物理模型进行机理建模分析,则需要大量的时间和精力来进行不断的优化,对于大型复杂的物理模型(比如高空台飞行环境模拟系统),其时间周期往往需要数年之久。
技术实现思路
1、有鉴于此,本发明的目的在于提供一种数据关联规则的挖掘方法、装置及电子设备,可以显著提升数据关联规则的分析精确度和分析效率。
2、第一方面,本发明实施例提供了一种数据关联规则的挖掘方法,方法应用于高空台试验数据关联规则计算平台,方法包括:获取样本数据集合,并针对样本数据集合进行无效数据剔除处理,确定有效样本数据;利用有效样本数据的动态特性,对有效样本数据进行数据转换处理,确定有效样本数据对应的布尔表;响应针对于用户端对有效样本数据的选择信息,确定目标控制指令和目标样本数据,其中,目标控制指令包括:k阶频繁项集参数组生成指令和置信系数生成指令;通过预设关联规则挖掘算法,基于布尔表和目标控制指令,对目标样本数据进行关联分析处理,确定目标数据关联规则。
3、在一种实施方式中,针对样本数据集合进行无效数据剔除处理,确定有效样本数据的步骤,包括:基于样本数据集合中各项样本数据的单调性和数据范围,确定图像窗集合;通过预设样本数据动态特征识别算法,基于图像窗集合和各项图像窗对应的目标数据点,确定各项样本数据对应的动态特性曲线;利用动态特性曲线对样本数据集合进行无效数据剔除处理,确定有效样本数据。
4、在一种实施方式中,基于样本数据集合中各项样本数据的单调性和数据范围,确定图像窗集合的步骤,包括:基于样本数据集合中各项样本数据的单调性和数据范围,将样本数据进行分段处理,确定数据段集合,其中,任一数据段内包含多个数据点;分别根据数据段设置图像窗,确定图像窗集合,并将各项图像窗的中心位置的数据点确定为目标数据点。
5、在一种实施方式中,通过预设样本数据动态特征识别算法,基于图像窗集合和各项图像窗对应的目标数据点,确定各项样本数据对应的动态特性曲线的步骤,包括:通过预设样本数据动态特征识别算法,将图像窗集合中的数据曲线转化为带宽度的矩形线段;将图像窗的总面积与矩形线段的总面积的商,确定为图像窗的目标数据点对应的动态系数,其中,动态系数与数据曲线变化的剧烈程度正相关;根据各项样本数据中包含的目标数据点,以及各项目标数据点对应的动态系数,确定各项样本数据对应的动态特性曲线。
6、在一种实施方式中,利用动态特性曲线对样本数据集合进行无效数据剔除处理,确定有效样本数据的步骤,包括:若样本数据对应的动态特性曲线中的动态系数,均小于获取预设临界值,则将样本数据确定为无效数据;将样本数据集合中的无效数据剔除,确定有效样本数据。
7、在一种实施方式中,利用有效样本数据的动态特性,对有效样本数据进行数据转换处理,确定有效样本数据对应的布尔表的步骤,包括:获取有效样本数据对应的动态特性曲线中,各时间段内的动态特性曲线线段,并确定动态特征曲线线段与水平面的倾角;将倾角与预设角度阈值进行对比,确定各时刻的动态特征,并基于各时刻的动态特征,建立动态系数变化趋势表;根据动态系数变化趋势表,确定各项动态特征对应的布尔表,并将各项布尔表叠加,确定有效样本数据对应的目标布尔表。
8、在一种实施方式中,将倾角与预设角度阈值进行对比,确定各时刻的动态特征的步骤,包括:当倾角大于预设角度阈值时,确定在该时刻,有效样本数据对应的动态特性曲线为动态增;当倾角小于预设角度阈值的负数值时,确定在该时刻,动态特性曲线为动态减;当倾角处于预设角度阈值的负数值与预设角度阈值的范围内时,确定在该时刻,动态特性曲线为稳态。
9、第二方面,本发明实施例还提供一种数据关联规则的挖掘装置,装置应用于高空台试验数据关联规则计算平台,装置包括:数据预处理模块,获取样本数据集合,并针对样本数据集合进行无效数据剔除处理,确定有效样本数据;数据转换模块,利用有效样本数据的动态特性,对有效样本数据进行数据转换处理,确定有效样本数据对应的布尔表;交互控制模块,响应针对于用户端对有效样本数据的选择信息,确定目标控制指令和目标样本数据,其中,目标控制指令包括:k阶频繁项集参数组生成指令和置信系数生成指令;关联规则分析模块,通过预设关联规则挖掘算法,基于布尔表和目标控制指令,对目标样本数据进行关联分析处理,确定目标数据关联规则。
10、第三方面,本发明实施例还提供一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现第一方面提供的任一项的方法。
11、第四方面,本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现第一方面提供的任一项的方法。
12、本发明实施例带来了以下有益效果:
13、本发明实施例提供的一种数据关联规则的挖掘方法、装置及电子设备,该方法在获取样本数据集合后,针对样本数据集合进行无效数据剔除处理,确定有效样本数据,之后利用有效样本数据的动态特性,对有效样本数据进行数据转换处理,确定有效样本数据对应的布尔表,并响应针对于用户端对有效样本数据的选择信息,确定目标控制指令和目标样本数据,最后通过预设关联规则挖掘算法,基于布尔表和目标控制指令,对目标样本数据进行关联分析处理,确定目标数据关联规则,本发明实施例可以显著提升数据关联规则的分析精确度和分析效率。
14、本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
15、为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
1.一种数据关联规则的挖掘方法,其特征在于,所述方法应用于高空台试验数据关联规则计算平台,所述方法包括:
2.根据权利要求1所述的数据关联规则的挖掘方法,其特征在于,针对所述样本数据集合进行无效数据剔除处理,确定有效样本数据的步骤,包括:
3.根据权利要求2所述的数据关联规则的挖掘方法,其特征在于,所述基于所述样本数据集合中各项样本数据的单调性和数据范围,确定图像窗集合的步骤,包括:
4.根据权利要求2所述的数据关联规则的挖掘方法,其特征在于,所述通过预设样本数据动态特征识别算法,基于所述图像窗集合和各项所述图像窗对应的目标数据点,确定各项所述样本数据对应的动态特性曲线的步骤,包括:
5.根据权利要求2所述的数据关联规则的挖掘方法,其特征在于,所述利用所述动态特性曲线对所述样本数据集合进行无效数据剔除处理,确定所述有效样本数据的步骤,包括:
6.根据权利要求1所述的数据关联规则的挖掘方法,其特征在于,所述利用所述有效样本数据的动态特性,对所述有效样本数据进行数据转换处理,确定所述有效样本数据对应的布尔表的步骤,包括:
7.根据权利要求6所述的数据关联规则的挖掘方法,其特征在于,所述将所述倾角与预设角度阈值进行对比,确定各时刻的动态特征的步骤,包括:
8.一种数据关联规则的挖掘装置,其特征在于,所述装置应用于高空台试验数据关联规则计算平台,所述装置包括:
9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现权利要求1至7任一项所述的方法。