本技术涉及互联网,尤其涉及一种模型训练方法、装置、电子设备及存储介质。
背景技术:
1、随着效果广告行业的发展,越来越多的广告主向媒体平台表达优化后端效果的诉求。其中,后端效果包括次留率、付费率、roi(return on investment,投资回报率)等这些深层转化类型。一般的深层转化类型,只需要广告主设定深层转化出价,广告主为每个深层转化支付广告费用。
2、但是roi比较特殊,广告主需要按照收到的用户付费金额(即广告主的广告收入)以及广告主设定的目标roi(例如目标首日roi),向媒体平台支付广告费用。
3、这种情况下,广告主不再对一次用户付费金额,向媒体平台支付广告费用,而是对一天内的用户付费总金额,向媒体平台支付广告费用。故需要媒体平台预估一次广告曝光带来的用户付费金额,而不是预估一次广告曝光用户发生付费行为的概率。为此需要提供一种解决方案,可以预估一次广告曝光带来的用户付费金额。
技术实现思路
1、为了解决上述需要媒体平台预估一次广告曝光带来的用户付费金额,而不是预估一次广告曝光用户发生付费行为的概率。为此需要提供一种解决方案,可以预估一次广告曝光带来的用户付费金额的技术问题,本技术提供了一种模型训练方法、装置、电子设备及存储介质。具体技术方案如下:
2、第一方面,本技术提供了一种模型训练方法,所述方法包括:
3、获取样本用户特征,所述样本用户特征为将样本广告曝光给样本用户,所述样本用户的用户特征;
4、确定所述样本用户的付费行为的发生情况,并根据所述样本用户的付费行为的发生情况,确定所述样本用户的付费金额;
5、根据所述样本用户的付费行为的发生情况,设置所述样本用户特征的样本标签;
6、根据经过样本标签设置的所述样本用户特征以及所述样本用户的付费金额,对用户付费行为预估模型进行有监督训练,得到预训练的用户付费行为预估模型;
7、对所述预训练的用户付费行为预估模型进行变换处理,得到预训练的用户付费金额预估模型。
8、在一个可选的实施方式中,所述根据所述样本用户的付费行为的发生情况,确定所述样本用户的付费金额,包括:
9、在所述样本用户的付费行为发生的情况下,将所述样本用户的实际付费金额确定为所述样本用户的付费金额;
10、在所述样本用户的付费行为未发生的情况下,将预设付费金额确定为所述样本用户的付费金额。
11、在一个可选的实施方式中,所述根据所述样本用户的付费行为的发生情况,设置所述样本用户特征的样本标签,包括:
12、在所述样本用户的付费行为发生的情况下,获取预设第一初始样本标签;
13、将所述样本用户特征的样本标签设置为所述预设第一初始样本标签;
14、在所述样本用户的付费行为未发生的情况下,获取预设第二初始样本标签;
15、将所述样本用户特征的样本标签设置为所述预设第二初始样本标签。
16、在一个可选的实施方式中,所述根据经过样本标签设置的所述样本用户特征以及所述样本用户的付费金额,对用户付费行为预估模型进行有监督训练,得到预训练的用户付费行为预估模型,包括:
17、将经过样本标签设置的所述样本用户特征,输入至用户付费行为预估模型,得到用户付费行为预估概率;
18、根据所述用户付费行为预估概率与所述样本标签,确定损失值,根据所述损失值与所述样本用户的付费金额之间的乘积,对用户付费行为预估模型进行有监督训练;
19、在用户付费行为预估模型的训练次数达到预设次数阈值的情况下,停止模型训练,得到预训练的用户付费行为预估模型。
20、在一个可选的实施方式中,所述根据经过样本标签设置的所述样本用户特征以及所述样本用户的付费金额,对用户付费行为预估模型进行有监督训练,得到预训练的用户付费行为预估模型,包括:
21、按照所述样本用户的付费金额,对经过样本标签设置的所述样本用户特征进行重采样;
22、将经过样本标签设置的所述样本用户特征,输入至用户付费行为预估模型,得到用户付费行为预估概率;
23、根据所述用户付费行为预估概率与所述样本标签,确定损失值,根据所述损失值,对用户付费行为预估模型进行有监督训练;
24、在用户付费行为预估模型的训练次数达到预设次数阈值的情况下,停止模型训练,得到预训练的用户付费行为预估模型。
25、在一个可选的实施方式中,所述方法还包括:
26、获取目标用户特征,所述目标用户特征为将目标广告曝光给目标用户,所述目标用户的用户特征;
27、将所述目标用户特征输入至所述预训练的用户付费金额预估模型,得到目标用户付费金额。
28、在一个可选的实施方式中,所述预训练的用户付费金额预估模型,包括:
29、
30、所述r为所述目标用户付费金额,所述x为所述目标用户特征。
31、第二方面,本技术提供了一种模型训练装置,所述装置包括:
32、特征获取模块,用于获取样本用户特征,所述样本用户特征为将样本广告曝光给样本用户,所述样本用户的用户特征;
33、情况确定模块,用于确定所述样本用户的付费行为的发生情况;
34、金额确定模块,用于根据所述样本用户的付费行为的发生情况,确定所述样本用户的付费金额;
35、标签设置模块,用于根据所述样本用户的付费行为的发生情况,设置所述样本用户特征的样本标签;
36、模型训练模块,用于根据经过样本标签设置的所述样本用户特征以及所述样本用户的付费金额,对用户付费行为预估模型进行有监督训练,得到预训练的用户付费行为预估模型;
37、模型变换模块,用于对所述预训练的用户付费行为预估模型进行变换处理,得到预训练的用户付费金额预估模型。
38、第三方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
39、存储器,用于存放计算机程序;
40、处理器,用于执行存储器上所存放的程序时,实现上述第一方面中任一所述的模型训练方法。
41、第四方面,还提供了一种存储介质,所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面中任一所述的模型训练方法。
42、第五方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的模型训练方法。
43、本技术实施例提供的上述技术方案与现有技术相比具有如下优点:本技术实施例提供的该方法,获取样本用户特征,样本用户特征为将样本广告曝光给样本用户,样本用户的用户特征,确定样本用户的付费行为的发生情况,并根据样本用户的付费行为的发生情况,确定样本用户的付费金额,根据样本用户的付费行为的发生情况,设置样本用户特征的样本标签,根据经过样本标签设置的样本用户特征以及样本用户的付费金额,对用户付费行为预估模型进行有监督训练,得到预训练的用户付费行为预估模型,对预训练的用户付费行为预估模型进行变换处理,得到预训练的用户付费金额预估模型。
44、通过确定样本用户的付费行为的发生情况,根据样本用户的付费行为的发生情况,确定样本用户的付费金额,根据样本用户的付费行为的发生情况,设置样本用户的样本用户特征的样本标签,根据经过样本标签设置的样本用户特征以及样本用户的付费金额,对用户付费行为预估模型进行有监督训练,得到预训练的用户付费行为预估模型,对预训练的用户付费行为预估模型进行变换处理,得到预训练的用户付费金额预估模型,如此使用付费金额对样本用户特征进行加权,参与用户付费行为预估模型的有监督训练,并进行变换可以得到预训练的用户付费金额预估模型,后续可以使用预训练的用户付费金额预估模型,预估一次广告曝光带来的用户付费金额。
1.一种模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述样本用户的付费行为的发生情况,确定所述样本用户的付费金额,包括:
3.根据权利要求1所述的方法,其特征在于,所述根据所述样本用户的付费行为的发生情况,设置所述样本用户特征的样本标签,包括:
4.根据权利要求1所述的方法,其特征在于,所述根据经过样本标签设置的所述样本用户特征以及所述样本用户的付费金额,对用户付费行为预估模型进行有监督训练,得到预训练的用户付费行为预估模型,包括:
5.根据权利要求1所述的方法,其特征在于,所述根据经过样本标签设置的所述样本用户特征以及所述样本用户的付费金额,对用户付费行为预估模型进行有监督训练,得到预训练的用户付费行为预估模型,包括:
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
7.根据权利要求6所述的方法,其特征在于,所述预训练的用户付费金额预估模型,包括:
8.一种模型训练装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。