反作弊判别器的训练方法、装置、设备和存储介质与流程

专利检索2025-04-06  11


本技术涉及互联网,尤其涉及一种反作弊判别器的训练方法、装置、设备和存储介质。


背景技术:

1、广告流量作弊一般是媒体方通过作弊手段获取广告主的利益。作弊手段多种多样,例如:设计程序来模拟真人用户点击广告,雇佣或者诱导用户点击广告,生成大量的无用广告点击操作,通过模拟器模拟广告主指定的下载行为或者安装行为等等。无论作弊手段如何,目的都是希望从广告主处取得广告费用。

2、由于广告流量作弊现象的盛行,广告主经常要面临无效流量、恶意点击和虚假安装等问题,这些问题给广告主带来了巨大的损失。但是,目前只能通过人工的方式或者简单的规则在大量曝光流量中识别出作弊流量,识别结果的准确率较低。因此,如何在众多流量中准确识别出作弊流量,提高广告主的广告转化率,降低流量作弊带来的损失,已经成为本领域亟待解决的问题。


技术实现思路

1、本技术提供了一种反作弊判别器的训练方法、装置、设备和存储介质,以解决作弊流量的识别准确率低的问题。

2、针对上述技术问题,本技术技术方案是通过如下实施例来解决的:

3、本技术实施例提供了一种反作弊判别器的训练方法,包括:采集多个曝光流量样本并且标注每个所述曝光流量样本的类型;在已经标注类型的多个所述曝光流量样本中,获取目标类型的所述曝光流量样本分别训练多个反作弊判别器;其中,多个所述反作弊判别器都用于识别作弊流量;针对每个训练完成的所述反作弊判别器,基于已经标注类型的多个所述曝光流量样本以及所述反作弊判别器针对所述目标类型的曝光流量样本的识别结果,确定所述反作弊判别器的模型判别指标;根据多个所述反作弊判别器分别对应的模型判别指标,在多个所述反作弊判别器中选择其中一个所述反作弊判别器作为目标反作弊判别器,以便使用所述目标反作弊判别器执行作弊流量识别任务。

4、其中,所述采集多个曝光流量样本并且标注每个所述曝光流量样本的类型,包括:采集多个曝光流量数据作为曝光流量样本;其中,在每个所述曝光流量样本中包括:用户数据和行为数据;在多个所述曝光流量样本中,将用户数据命中预设黑名单的曝光流量样本标注为作弊流量;在多个所述曝光流量样本中,将行为数据包括转化行为数据的曝光流量样本标注为正常流量;其中,所述转化行为数据包括:针对流量投入平台的消费行为数据和/或针对预设数据对象的行为数据;在多个所述曝光流量样本中,将未标注为作弊流量或者正常流量的曝光流量样本标注为灰样本。

5、其中,所述目标类型包括:作弊流量和正常流量;所述在已经标注类型的多个所述曝光流量样本中,获取目标类型的所述曝光流量样本分别训练多个反作弊判别器,包括:在已经标注类型并且流量来源平台相同的多个所述曝光流量样本中,获取作弊流量类型和正常流量类型的曝光流量样本;使用作弊流量类型和正常流量类型的曝光流量样本,分别训练多个所述反作弊判别器,直到多个所述反作弊判别器收敛为止,得到所述流量来源平台对应的多个所述反作弊判别器。

6、其中,所述模型判别指标包括:过滤比和成本率;所述基于已经标注类型的多个所述曝光流量样本以及所述反作弊判别器针对所述目标类型的曝光流量样本的识别结果,确定所述反作弊判别器的模型判别指标,包括:针对每个所述流量来源平台,在已经标注类型的多个所述曝光流量样本中,确定所述流量来源平台对应的曝光流量样本的数量;根据所述流量来源平台对应的所述反作弊判别器的识别结果,确定被识别为作弊流量的曝光流量样本的数量;根据所述流量来源平台对应的曝光流量样本的数量以及被所述反作弊判别器识别为作弊流量的曝光流量样本的数量,确定所述反作弊判别器在所述流量来源平台的过滤比;根据所述流量来源平台对应的曝光流量样本,从流量投入平台获取对应的收益数据;根据被所述反作弊判别器识别为作弊流量的曝光流量样本的数量以及所述流量投入平台对应的收益数据,确定所述反作弊判别器在所述流量来源平台的成本率。

7、其中,所述根据多个所述反作弊判别器分别对应的模型判别指标,在多个所述反作弊判别器中选择其中一个所述反作弊判别器作为目标反作弊判别器,包括:针对每个流量来源平台,在所述流量来源平台对应的多个所述反作弊判别器中,确定过滤比小于预设过滤比阈值的反作弊判别器;在过滤比小于所述过滤比阈值的反作弊判别器中,确定成本率最大的反作弊判别器作为所述目标反作弊判别器。

8、其中,所述使用所述目标反作弊判别器执行作弊流量识别任务,包括:接收来自于目标流量来源平台的目标流量数据;利用所述目标反作弊判别器识别所述目标流量数据的类型;其中,如果所述目标流量数据被识别为作弊流量,则根据所述目标流量数据中的用户数据,在流量投入平台的历史用户数据中,查询是否存在与所述用户数据相匹配的历史用户数据;如果存在与所述用户数据相匹配的历史用户数据,则将所述目标流量数据的类型变更为正常流量。

9、其中,在所述查询是否存在与所述用户数据相匹配的历史用户数据之后,还包括:如果不存在与所述用户数据相匹配的历史用户数据,则在预设黑名单中查询所述用户数据;如果在所述黑名单中未查询到所述用户数据,则将所述用户数据添加到预设黑名单中。

10、本技术实施例还提供了一种反作弊判别器的训练装置,包括:采集和标注模块,用于采集多个曝光流量样本并且标注每个所述曝光流量样本的类型;获取和训练模块,用于在已经标注类型的多个所述曝光流量样本中,获取目标类型的所述曝光流量样本分别训练多个反作弊判别器;其中,多个所述反作弊判别器都用于识别作弊流量;确定模块,用于针对每个训练完成的所述反作弊判别器,基于已经标注类型的多个所述曝光流量样本以及所述反作弊判别器针对所述目标类型的曝光流量样本的识别结果,确定所述反作弊判别器的模型判别指标;选择模块,用于根据多个所述反作弊判别器分别对应的模型判别指标,在多个所述反作弊判别器中选择其中一个所述反作弊判别器作为目标反作弊判别器,以便使用所述目标反作弊判别器执行作弊流量识别任务。

11、本技术实施例还提供了一种反作弊判别器的训练设备,包括:至少一个通信接口;与所述至少一个通信接口相连接的至少一个总线;与所述至少一个总线相连接的至少一个处理器;与所述至少一个总线相连接的至少一个存储器,其中,所述处理器被配置为:执行所述存储器中存储的反作弊判别器的训练程序,以实现上述任一项所述的反作弊判别器的训练方法。

12、本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令被执行,以实现上述任一项所述的反作弊判别器的训练方法。

13、本技术实施例提供的上述技术方案与现有技术相比具有如下优点:本技术实施例提供的方法可以采集多个曝光流量样本并且标注每个所述曝光流量样本的类型;在已经标注类型的多个所述曝光流量样本中,获取目标类型的所述曝光流量样本分别训练多个反作弊判别器;其中,多个所述反作弊判别器都用于识别作弊流量;针对每个训练完成的所述反作弊判别器,基于已经标注类型的多个所述曝光流量样本以及所述反作弊判别器针对所述目标类型的曝光流量样本的识别结果,确定所述反作弊判别器的模型判别指标;根据多个所述反作弊判别器分别对应的模型判别指标,在多个所述反作弊判别器中选择其中一个所述反作弊判别器作为目标反作弊判别器,以便使用所述目标反作弊判别器执行作弊流量识别任务。通过本技术实施例可以训练多个反作弊判别器,并且选出最优的反作弊判别器进行应用,相较于通过人工或者简单规则在众多流量中识别作弊流量的方式,提升了识别效率并且提高了识别的准确率。


技术特征:

1.一种反作弊判别器的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述采集多个曝光流量样本并且标注每个所述曝光流量样本的类型,包括:

3.根据权利要求1所述的方法,其特征在于,

4.根据权利要求3所述的方法,其特征在于,

5.根据权利要求4所述的方法,其特征在于,所述根据多个所述反作弊判别器分别对应的模型判别指标,在多个所述反作弊判别器中选择其中一个所述反作弊判别器作为目标反作弊判别器,包括:

6.根据权利要求1所述的方法,其特征在于,所述使用所述目标反作弊判别器执行作弊流量识别任务,包括:

7.根据权利要求1所述的方法,其特征在于,在所述查询是否存在与所述用户数据相匹配的历史用户数据之后,还包括:

8.一种反作弊判别器的训练装置,其特征在于,包括:

9.一种反作弊判别器的训练设备,其特征在于,包括:至少一个通信接口;与所述至少一个通信接口相连接的至少一个总线;与所述至少一个总线相连接的至少一个处理器;与所述至少一个总线相连接的至少一个存储器,其中,所述处理器被配置为:执行所述存储器中存储的反作弊判别器的训练程序,以实现权利要求1-7中任一项所述的反作弊判别器的训练方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令被执行,以实现权利要求1-7中任一项所述的反作弊判别器的训练方法。


技术总结
本申请涉及一种反作弊判别器的训练方法、装置、设备和存储介质。该方法包括:采集标注每个曝光流量样本的类型;在已经标注类型的多个曝光流量样本中,获取目标类型的曝光流量样本分别训练多个反作弊判别器;针对每个训练完成的反作弊判别器,基于已经标注类型的多个曝光流量样本以及反作弊判别器的识别结果,确定反作弊判别器的模型判别指标;根据多个反作弊判别器分别对应的模型判别指标,在多个反作弊判别器中选择其中一个反作弊判别器作为目标反作弊判别器,以便使用目标反作弊判别器执行作弊流量识别任务。本申请相较于通过人工或者简单规则在众多流量中识别作弊流量的方式,提升了识别效率并且提高了识别的准确率。

技术研发人员:郑慧梅
受保护的技术使用者:北京奇艺世纪科技有限公司
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1152025.html

最新回复(0)