本技术实施例涉及服务器领域,具体而言,涉及一种设备的故障类型的确定方法、装置、存储介质及电子设备。
背景技术:
1、目前,现有对服务器故障进行诊断的方法一般通过分类预测算法来实现,实现过程包括选取特征集对训练模型进行训练,但是现有技术中在选取特征集的时存在一个词向量特征对应多种故障类型的情况,从而导致特征集中的无效特征过多,不能有效区分特征和故障类型之间的关联度,因此容易导致选取的特征集存在泛化不足或泛化过度的问题,进而无法通过训练出的故障诊断模型准确的对设备故障进行诊断。
2、因此,相关技术中存在基于设备的日志信息对设备进行故障诊断时,如何提高故障诊断准确率的问题。
3、针对相关技术中,在基于设备的日志信息对设备进行故障诊断时,如何提高故障诊断准确率的问题,尚未提出有效的解决方案。
技术实现思路
1、本技术实施例提供了一种设备的故障类型的确定方法、装置、存储介质及电子设备,以至少解决相关技术中在基于设备的日志信息对设备进行故障诊断时,如何提高故障诊断准确率的问题。
2、根据本技术的一个实施例,提供了一种设备的故障类型的确定方法,包括:对目标设备的历史运行日志中的历史字词进行编码,得到所述历史字词对应的历史词向量,并根据所有历史词向量生成初始词向量特征集合,其中,所述历史运行日志至少包括所述目标设备发生故障之前的运行日志;从所述初始词向量特征集合中确定出有效词向量特征集合,其中,初始词向量特征集合中的初始词向量分别对应不同故障类型,所述有效词向量特征集合中的有效词向量对应的不同故障类型的数量小于第一预设值;对所述有效词向量特征集合进行特征泛化处理,得到训练词向量特征集合,以所述训练词向量特征集合为输入样本,以所述历史运行日志对应的所述目标设备的历史故障类型为输出样本训练得到故障诊断模型;将当前运行日志输入到所述故障诊断模型,得到所述故障诊断模型输出的所述目标设备的当前故障类型。
3、在一个示例性实施例中,从所述初始词向量特征集合中确定出有效词向量特征集合之前,所述方法还包括:从所述历史运行日志中确定出目标子日志,其中,所述目标子日志表示在所述目标设备发生预设故障类型之前所生成的日志;从所述目标子日志的所有字词中确定出现次数大于第二预设值的第一字词;从所述初始词向量中确定出所述第一字词所对应的第一词向量;在确定所述预设故障类型包括多种故障类型的情况下,将所述多种故障类型的数量确定为所述第一词向量对应的不同故障类型的数量。
4、在一个示例性实施例中,对所述有效词向量特征集合进行特征泛化处理,得到训练词向量特征集合,包括:针对所述有效词向量特征集合中的任一个词向量,计算所述任一个词向量与语料库中每一个词向量之间的余弦相似度;从所述语料库中确定出与所述任一个词向量之间的余弦相似度大于预设阈值的第二词向量,根据多个第二词向量生成所述任一个词向量的相似词向量组;将所述相似词向量组中的任一个相似词向量确定为当前相似词向量;在确定所述当前相似词向量属于所述有效词向量特征集合的情况下,获取所述当前相似词向量的下一个相似词向量,并将所述当前相似词向量更新为所述下一个相似词向量;在确定所述当前相似词向量不属于所述有效词向量特征集合的情况下,将所述当前相似词向量确定为所述任一个词向量的泛化词向量;将所述有效词向量特征集合中的每一个词向量以及所述每一个词向量对应的泛化词向量确定为所述训练词向量特征集合。
5、在一个示例性实施例中,对所述有效词向量特征集合进行特征泛化处理,得到训练词向量特征集合,包括:针对所述有效词向量特征集合中的有效词向量,从所述历史字词中确定出所述有效词向量对应的第三字词,为所述第三字词添加派生词得到拓展字词;对所述拓展字词进行编码以得到拓展词向量,将所述拓展词向量确定为所述有效词向量对应的泛化词向量;根据所述有效词向量特征集合中的词向量以及所述有效词向量对应的泛化词向量生成所述训练词向量特征集合。
6、在一个示例性实施例中,对目标设备的历史运行日志中的历史字词进行编码,得到所述历史字词对应的历史词向量,并根据所有历史词向量生成初始词向量特征集合,包括:使用分词模型对所述历史运行日志进行分词处理,得到所述历史运行日志的所有字词;确定每个字词的出现次数,并将具有大于第三预设值的出现次数的第四字词确定为候选字词;使用词向量模型对所述候选字词进行编码,得到多个词向量,将所述多个词向量确定为所述初始词向量特征集合。
7、在一个示例性实施例中,对目标设备的历史运行日志中的历史字词进行编码之前,所述方法还包括:基于预设对应关系确定出与所述目标设备发生的故障类型对应的预设时间段;在确定所述目标设备发生故障的情况下,确定出所述目标设备在发生故障之前的第一时间段,从第一时间段中确定出与所述预设时间段一致的第二时间段,其中,所述目标设备在所述第一时间段内为正常工作状态;从日志文件中确定出所述目标设备在所述第二时间段内产生的运行日志,并将在所述第二时间段内产生的运行日志确定为所述历史运行日志。
8、在一个示例性实施例中,将当前运行日志输入到所述故障诊断模型之前,所述方法还包括:将不同的测试样本输入所述故障诊断模型,得到所述故障诊断模型输出的不同测试结果,其中,所述不同测试结果至少包括测试成功的第一测试结果和测试失败的第二测试结果;在确定所述第一测试结果的出现次数与所述不同测试结果的总次数的比值大于等于第四预设值的情况下,确定所述故障诊断模型通过测试;在确定所述第二测试结果的出现次数与所述不同测试结果的总次数的比值小于第三预设值的情况下,确定所述故障诊断模型未通过测试。
9、根据本技术的另一个实施例,一种设备的故障类型的确定装置,包括:编码模块,用于对目标设备的历史运行日志中的历史字词进行编码,得到所述历史字词对应的历史词向量,并根据所有历史词向量生成初始词向量特征集合,其中,所述历史运行日志至少包括所述目标设备发生故障之前的运行日志;确定模块,用于从所述初始词向量特征集合中确定出有效词向量特征集合,其中,初始词向量特征集合中的初始词向量分别对应不同故障类型,所述有效词向量特征集合中的有效词向量对应的不同故障类型的数量小于第一预设值;处理模块,用于对所述有效词向量特征集合进行特征泛化处理,得到训练词向量特征集合,以所述训练词向量特征集合为输入样本,以所述历史运行日志对应的所述目标设备的历史故障类型为输出样本训|练得到故障诊断模型;诊断模块,用于将当前运行日志输入到所述故障诊断模型,得到所述故障诊断模型输出的所述目标设备的当前故障类型。
10、根据本技术的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
11、根据本技术的又一个实施例,还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
12、通过本技术,将设备发生故障之前的历史运行日志中的字词进行编码得到初始词向量特征集合,然后从初始词向量特征集合中筛选出与故障类型具备对应关系的词向量得到有效词向量特征集合,进而对有效词向量特征集合进行泛化处理得到训练词向量特征集合后进行模型训练,将运行日志输入到训练出的故障诊断模型后确定目标设备的故障类型。因此,可以解决相关技术中,在基于设备的日志信息对设备进行故障诊断时,如何提高故障诊断准确率的问题。
1.一种设备的故障类型的确定方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,从所述初始词向量特征集合中确定出有效词向量特征集合之前,所述方法还包括:
3.根据权利要求1所述的方法,其特征在于,对所述有效词向量特征集合进行特征泛化处理,得到训练词向量特征集合,包括:
4.根据权利要求1所述的方法,其特征在于,对所述有效词向量特征集合进行特征泛化处理,得到训练词向量特征集合,包括:
5.根据权利要求1所述的方法,其特征在于,对目标设备的历史运行日志中的历史字词进行编码,得到所述历史字词对应的历史词向量,并根据所有历史词向量生成初始词向量特征集合,包括:
6.根据权利要求1所述的方法,其特征在于,对目标设备的历史运行日志中的历史字词进行编码之前,所述方法还包括:
7.根据权利要求1所述的方法,其特征在于,将当前运行日志输入到所述故障诊断模型之前,所述方法还包括:
8.一种设备的故障类型的确定装置,其特征在于,包括:
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述权利要求1至7任一项中所述的方法的步骤。
10.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述权利要求1至7任一项中所述的方法的步骤。