本技术属于信息处理,尤其涉及一种预测模型的训练方法、装置、电子设备及可读存储介质。
背景技术:
1、随着网络技术的快速更新迭代,为了用户在使用预设业务时能得到更好的使用体验,通常需要对用户使用预设业务时的满意度进行采集,满意度也就是用户对预设业务的正反馈程度。通过对用户对预设业务的正反馈程度进行分析,便于业务方提升业务能力,从而为用户提供更好的服务。
2、目前可以通过问卷调查和模型预测两种方式,获取满意度对应的数据,但是,目前能够采集的样本数量有限,无法对满意度进行准确预测。
技术实现思路
1、本技术实施例提供一种预测模型的训练方法、装置、设备及可读存储介质,能够解决目前无法对满意度进行准确预测的问题。
2、第一方面,本技术实施例提供一种预测模型的训练方法,该方法包括:
3、获取多个样本用户在使用预设业务时分别产生的样本数据,其中,每个样本数据包括:多个目标指标和每个目标指标对应的目标指标数据,目标指标对应的信息价值参数值大于预设阈值;多个样本数据包括:多个第一样本数据、多个第二样本数据以及与每个第二样本数据对应的预设值;
4、根据指标权重值,对第一样本数据中的目标指标数据进行加权处理,得到第一目标值,其中,指标权重值根据第一样本数据确定,第一目标值用于描述样本用户对预设业务的正反馈程度;
5、根据多个样本数据、第一目标值和预设值训练预设模型,直至预设模型满足预设训练条件,得到预测模型。
6、在一种可能的实现方式中,在所述获取多个样本用户在使用预设业务时分别产生的样本数据之前,所述方法还包括:
7、获取多个所述样本用户在使用所述预设业务时分别产生的初始样本数据,所述初始样本数据包括:多个候选指标和每个所述候选指标对应的候选指标数据;
8、根据所述候选指标数据,计算每个所述候选指标对应的信息价值参数值;
9、根据所述信息价值参数值,从所述候选指标中确定所述目标指标;
10、根据所述目标指标,从所述初始样本数据中确定所述样本数据。
11、在一种可能的实现方式中,根据所述候选指标数据,计算每个所述候选指标对应的信息价值参数值,包括:
12、根据所述候选指标数据,对所述候选指标进行特征分箱,得到每个所述候选指标分别对应的分箱特征数据;
13、根据所述分箱特征数据,计算每个所述候选指标对应的信息价值参数值。
14、在一种可能的实现方式中,在所述根据指标权重值,对所述第一样本数据中的目标指标数据进行加权处理,得到第一目标值之前,所述方法还包括:
15、计算所述第一样本数据中的每个所述目标指标对应的信息熵;
16、根据所述信息熵,确定所述第一样本数据中的每个所述目标指标对应的所述指标权重值。
17、在一种可能的实现方式中,在所述根据所述多个样本数据、所述第一目标值和所述预设值训练预设模型,直至所述预设模型满足预设训练条件,得到预测模型之前,所述方法还包括:
18、从所述第一目标值中确定第二目标值和第三目标值,所述第二目标值小于第一阈值,所述第三目标值大于第二阈值;
19、从所述第一样本数据中确定所述第二目标值对应的第三样本数据和所述第三目标值对应的第四样本数据;
20、所述根据所述多个样本数据、所述第一目标值和所述预设值训练预设模型,直至所述预设模型满足预设训练条件,得到预测模型,包括:
21、根据所述第二目标值、所述第三样本数据、所述第三目标值、所述第四样本数据、所述预设值和所述第二样本数据,训练所述预设模型,直至所述预设模型满足所述预设训练条件,得到所述预测模型。
22、在一种可能的实现方式中,从所述第一目标值中确定第二目标值和第三目标值,包括:
23、根据所述第一阈值和所述第二阈值,从所述第一目标值中确定第四目标值和第五目标值;所述第四目标值小于所述第一阈值,所述第五目标值大于所述第二阈值;
24、对所述第四目标值进行随机采样,确定所述第二目标值;
25、对所述第五目标值进行随机采样,确定所述第三目标值,其中,所述第二目标值的数量和所述第三目标值的数量满足预设比例条件。
26、在一种可能的实现方式中,在所述根据所述多个样本数据、所述第一目标值和所述预设值训练预设模型,直至所述预设模型满足预设训练条件,得到预测模型之后,所述方法还包括:
27、获取目标用户的待检测数据;
28、将所述待检测数据输入至所述预测模型,输出预测结果,所述预测结果用于描述所述目标用户对所述预设业务的正反馈程度。
29、第二方面,本技术实施例提供一种预测模型的训练装置,该装置包括:
30、获取模块,用于获取多个样本用户在使用预设业务时分别产生的样本数据,其中,每个样本数据包括:多个目标指标和每个目标指标对应的目标指标数据,目标指标对应的信息价值参数值大于预设阈值;多个样本数据包括:多个第一样本数据、多个第二样本数据以及与每个第二样本数据对应的预设值;
31、加权模块,用于根据指标权重值,对第一样本数据中的目标指标数据进行加权处理,得到第一目标值,其中,指标权重值根据第一样本数据确定,第一目标值用于描述样本用户对预设业务的正反馈程度;
32、训练模块,用于根据多个样本数据、第一目标值和预设值训练预设模型,直至预设模型满足预设训练条件,得到预测模型。
33、第三方面,本技术实施例提供了一种电子设备,该设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时,实现如第一方面或者第一方面的任一可能实现方式中的方法。
34、第四方面,本技术实施例提供了一种可读存储介质,该计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面或者第一方面的任一可能实现方式中的方法。
35、本技术实施例中,通过获取多个样本用户在使用预设业务时分别产生的样本数据,其中,每个样本数据包括:多个目标指标和每个目标指标对应的目标指标数据,由于目标指标对应的信息价值参数值大于预设阈值,所以参与模型训练的样本数据都是信息价值较强的目标指标和对应的目标指标数据,能够提升模型预测能力。其中,多个样本数据包括:多个第一样本数据、多个第二样本数据以及与每个第二样本数据对应的预设值,即第一样本数据是无标签的样本数据,第二样本数据是有标签的样本数据,这里,通过使用无标签的样本数据和有标签的样本数据进行训练,能够减小所需的样本数据量,减小数据采集和处理工作量。然后,根据基于第一样本数据确定的指标权重值,对第一样本数据中的目标指标数据进行加权处理,得到用于描述样本用户对预设业务的正反馈程度的第一目标值,这里,基于指标权重值对无标签的第一样本数据进行无监督训练,能够有效预测样本用户对预设业务的正反馈程度。最后,根据多个样本数据、第一目标值和预设值训练预设模型,直至预设模型满足预设训练条件,得到预测模型,相当于使用无标签的样本数据和有标签的样本数据进行半监督模型训练,能够结合无监督模型训练和有监督模型训练的优点,保证模型的预测准确率,可解释性和易固化性。
1.一种预测模型的训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,在所述获取多个样本用户在使用预设业务时分别产生的样本数据之前,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述候选指标数据,计算每个所述候选指标对应的信息价值参数值,包括:
4.根据权利要求1所述的方法,其特征在于,在所述根据指标权重值,对所述第一样本数据中的目标指标数据进行加权处理,得到第一目标值之前,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,在所述根据所述多个样本数据、所述第一目标值和所述预设值训练预设模型,直至所述预设模型满足预设训练条件,得到预测模型之前,所述方法还包括:
6.根据权利要求5所述的方法,其特征在于,所述从所述第一目标值中确定第二目标值和第三目标值,包括:
7.根据权利要求1所述的方法,其特征在于,在所述根据所述多个样本数据、所述第一目标值和所述预设值训练预设模型,直至所述预设模型满足预设训练条件,得到预测模型之后,所述方法还包括:
8.一种预测模型的训练装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;所述处理器执行所述计算机程序指令时实现如权利要求1-7任意一项所述的预测模型的训练方法。
10.一种可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-7任意一项所述的预测模型的训练方法。
