1.本发明涉及新兴信息技术、人工智能领域,特别涉及一种基于动态注意力图网络的营销套利黑产的识别方法。
背景技术:
2.营销套利是一种新型的互联网欺诈手段,套利黑产通过各种不法方式来大量套取电商平台或支付平台推出的代金券、折扣、满减、立返立减等营销活动的权益,极大的伤害了正常消费者的切身利益,也使得平台方投入的营销成本没有发挥其应有价值。并且随着当今互联网产业的飞速发展,营销套利黑产也更加趋于团伙化,手段方式也变得更加隐蔽和复杂。
3.传统的解决方案通常依靠专家经验在风控系统中设置一些风险策略,用以捕获被风险策略命中的套利黑产人员,但随着黑产手段更具团伙化、复杂化、隐蔽化,此类方法往往受限于专家自身经验无法更全面的识别一些特征潜藏的或手段新型的套利黑产群体。
4.也有提出通过构建图网络并在图网络上定义一些风险算子,从而通过计算风险算子来判断图上各节点的套利风险,但这类方法通常存在如下一些不足:1)本质上该类方法是将专家经验策略以一种更复杂的形式定义在图网络上,同样也会受限于算子本身,而并非是一种机器学习的算法。2)该类方法往往仅利用了图网络空间上的拓扑信息,并未利用网络节点本身蕴藏的特征信息。3)通常只利用了低邻接关系中的信息,而没有充分利用高邻接关系中蕴藏的潜在信息。
5.随着科技的发展进步,有提出通过图神经网络来更好的解决该场景的问题。图神经网络是一种基于历史样本可自学习的算法能避免专家经验的局限性,同时也都引入了节点自身的特征信息,并且可进行多层邻接的信息聚合使得能更全面的识别潜在的套利风险节点。
6.但是当前基于图神经网络的方法大多只是使用了静态图而非动态图,即只是某一时刻的图网络结构,并没有考虑图网络在时间轴上的演变。静态图的方法只考虑图网络空间结构上的信息,却忽略了时间轴上传递的信息
技术实现要素:
7.本发明要解决的技术问题是克服现有技术的缺陷,提供一种基于动态注意力图网络的营销套利黑产的识别方法,能很大程度提升风控系统识别套利黑产的全面性和准确性,从而能更好的解决此场景问题。
8.为了解决上述技术问题,本发明提供了如下的技术方案:
9.本发明提供一种基于动态注意力图网络的营销套利黑产的识别方法,包括以下步骤:
10.一、定义一种动态图网络结构,它由两类节点,四种关系边,和t个时刻组成:
11.1)两类节点:图网络中含有用户节点vc,和商户节点vb两类节点
12.2)四种关系边分别是:
13.a)用户与用户的设备关系边ed:
14.根据访问日志中过去某段时间内,不同用户访问设备ip存在相同性,生成用户节点和用户节点之间的设备关系边;
15.b)用户与用户的支付关系边e
p
:
16.根据业务系统中过去某段时间内,用户和用户之间存在转账支付行为,生成用户节点和用户节点之间的支付关系边;
17.c)用户与用户的社交关系边es:
18.根据业务系统中过去某段时间内,用户和用户之间存在一方分享营销活动信息并成功邀请另一方参加该营销活动的行为,生成用户节点和用户节点之间的社交关系边;
19.d)用户与商户的交易关系边e
t
:
20.根据业务系统中过去某段时间内,用户在商户里发生了交易支付的行为,生成用户节点和商户节点之间的交易关系边;
21.3)t个时刻是指:
22.在时间轴上以t0时刻为初始,ω为间隔,选取连贯的t个时刻点;在每个时刻点上都生成一张由上述2类节点和4种关系边的关系图网络;这样即反映出了图网络随着时间的t个时刻的演变;
23.二、在图数据库中为t个时刻生成t张网络图,分别为
[0024][0025][0026]
把每个时刻点的用户集vc分别从图数据库模块中导入至分布式数据库模块,并为每个时刻点的每个用户生成代表其属性的m维特征向量,特征向量的特征域可以选取常见的自然人属性特征予以构建,也可以引入基于专家经验提炼的统计类特征,例如:过去某段时间访问某活动的次数等等,以获取更好的识别效果;这样就为每个时刻点的用户集vc生成了属性特征矩阵以表的形式存入分布式数据库模块中;下标中n0,n1,...分别表示每个时刻点用户集的数量;
[0027]
同理,把每个时刻点的商户集vb分别从图数据库模块中导入至分布式数据库模块,并为每个时刻点的每个商户生成代表其属性的k维特征向量;这样就为每个时刻点的商户集vb生成了属性特征矩阵以表的形式存入分布式数据库模块中;下标中l0,l1,...分别表示每个时刻点商户集的数量;
[0028]
三、基于历史的套利用户正负样本,分别为每个时刻点的用户集vc打上标签,并以表的形式存入分布式数据库模块中;打完标签后,用户集vc变成有标签(v
labeled
)和无标签
(v
unlabeled
)两种样本,v
labeled
样本被分为已知套利用户样本v
labeled
=1和已知非套利用户样本v
labeled
=0,图网络上所有的商户节点都设置为无标签样本;
[0029]
四、设计一种新型图注意力机制,其特点是1)分别为用户节点和商户节点都定义了独立的映射矩阵,通过映射矩阵把这两类不同维度特征向量映射成同一维度,实现了用户节点和商户点在信息聚合时的统一;2)基于图上定义的四种关系边,定义了一种多边注意力的机制,即为每个关系边都引入了一套独立的注意力的学习参数,从而实现了多种关系边在信息聚合时的统一;
[0030]
具体操作如下:
[0031]
1)首先根据四种关系边定义4套独立的注意力学习参数并初始化学习参数:
[0032]
a)用户与用户设备关系ed:定义共享线性映射矩阵和注意力共享向量ad∈r
2f
;
[0033]
b)用户与用户支付关系e
p
:定义共享线性映射矩阵和注意力共享向量a
p
∈r
2f
;
[0034]
c)用户与用户的社交关系边es:定义共享线性映射矩阵和注意力共享向量as∈r
2f
;
[0035]
d)用户与商户的交易关系边e
t
:为用户节点和商户节点定义独立的共享的线性映射矩阵和用于把用户特征向量空间和商户特征向量空间从m维和1维映射到统一的f维向量空间;定义共享注意力向量a
t
∈r
2f
;
[0036]
2)再以如下公式进行图中各边的注意力系数计算:
[0037]
a)基于ed关系边的注意力系数:
[0038][0039][0040]
b)基于e
p
关系的注意力系数:
[0041][0042][0043]
c)基于es关系的注意力系数:
[0044]
[0045][0046]
d)基于e
t
关系的注意力系数:
[0047][0048][0049]
上面表达式中,符号||代表向量的拼接,下标i,j分别表示图中基于某种关系边相邻的两个节点,hi或hj都表示该节点所对应的特征向量取自之前生成的用户特征矩阵,在计算e
t
关系注意力系数时hi和hj特征向量一个取自用户特征矩阵,另一个取自商户特征矩阵;
[0050]
3)最后通过如下公式进行信息聚合计算:
[0051][0052]
上述公式中,nd(i)、n
p
(i)、ns(i)、n
t
(i)符号分别表示节点i通过设备关系边、支付关系边、社交关系边、交易关系边连接的一阶邻居;
[0053]
上述步骤四中这一系列处理称为:多边注意力单元(multiedgegat);
[0054]
五、上述步骤四只是完成了在某个时刻上图网络在空间层面的信息聚合,因为要考虑图网络的时间维上的动态性,就必须完成网络信息在时间维上的传递,本专利创新提出了一种使用多路gru的方式在时间维上传递注意力参数的机制(称为:多路gru单元-multigru),结合空间层面的图注意力信息聚合机制(多边注意力单元-multiedgegat),形成了一个全新的处理单元,称之为动态注意力单元,具体操作如下:
[0055]
1)因为图注意力机制会产生9个需要学习的参数,即5个共享线性映射矩阵和4个共享注意力向量,这里需要定9个独立的gru单元负责在时间维上进行对于参数信息的传递,其分别是:
[0056]
用来传递线性映射矩阵,和
[0057]
用来传递注意力向量;对这些gru单元的参数进行初始化;
[0058]
2)这里的gru传播公式如下:
[0059]
因为gru单元内部结构是一样的为了便于阐述举为例进行公式说明:
[0060][0061]
[0062][0063][0064]
上述公式即完成了t-1时刻的注意力参数通过传递生成t时刻的注意力参数同理也可以以相同的结构,通过其他gru从t-1时刻传递生成t时刻的其他8个注意力参数w
pt
、w
st
、上述公式中
⊙
表示哈达玛积,为自身要学习的参数,同理其他gru也有相类似的参数要学习;把上述9个gru单元汇总在一起,称为多路gru单元-multigru;
[0065]
3)把多边注意力单元和多路gru单元合并,生成一个全新的处理单元,称之为动态注意力单元(dynamicgat),合并公式如下:
[0066]
为了使公式简化,更易于表达,把wd、w
p
、ws、w
tc
、w
tb
这5个参数合并成w,把ad、a
p
、as、a
t
这4个参数合并成a;
[0067]wt
,a
t
=multigru(h
t
,w
t-1
,a
t-1
)
[0068]h′
t’=multiedgegat(h
t
,w
t
,a
t
);
[0069]
六、上述步骤五阐述在时间轴上一个动态注意力单元的信息传递和信息聚合,这里可以很自然在每个时间点上进行空间上的多层聚合,则上述动态注意力单元的表达式可以表示成:
[0070][0071][0072]
上式中上标l表示空间聚合的层级,这里每增加一层聚合意味着把图中节点再下一层邻接信息“压”向该节点,因此就很好的利用了多层邻接关系所蕴藏的信息,至此构建完成了一个既包含时间维度的信息传递,又包含空间维度多层聚合的动态可学习的图网络;
[0073]
七、把上述动态注意力图网络最后一层最后一个时刻的输出表征通过softmax进行激活映射成预测节点套利风险的概率p;
[0074]
八、把上述所有步骤称为一次完整的学习迭代;进行学习迭代时,要把所需的信息从分布式数据库模块中同步入服务器内存并初始化所需学习的参数,然后进行多轮次的完整学习迭代;每次完整的学习迭代后仅针对有标签的节点v
labeled
,通过交叉熵损失函数,进行损失计算,以及adam优化算法进行梯度更新,最后经过n次完整的学习迭代学习出动态注意力图网络所需的参数;完成动态注意力图网络的学习;
[0075]
九、把学习好的动态注意力网络部署进风控决策模块中,进行在线的营销套利风险概率预测,设置概率决策阈值p=σ,当预测的风险概率大于σ时,判断为营销套利风险人群,并进行后续拦截等处理操作。
[0076]
与现有技术相比,本发明的有益效果如下:
[0077]
本专利提出了一种基于动态注意力图网络来识别套利黑产的方法,其创新的具有以下优点:1)定义了一种由用户节点、商户节点、多维关系和多个时刻组成的一种新型的动态图网络结构;2)设计了一种新型的多边注意力单元,能更有效的实现用户节点、商户节点、多维关系的统一,从而更好的实现节点空间层面的信息聚合;3)在图网络时间动态性上,创新的设计了一种通过多路gru单元传递注意力信息的动态模式,使得图网络在时间轴上的演变信息也得到了有效的传递;4)有效把多边注意力单元和多路gru单元进行了合并,提出了动态注意力单元这种新型处理单元,使用此单元搭建的动态注意力图网络能既完成时间维的有效信息传递,又能实现空间维的多层邻接信息的高效聚合。
[0078]
本专利提出的方法,能很大程度提升风控系统识别套利黑产的全面性和准确性,从而能更好的解决此场景问题。
附图说明
[0079]
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
[0080]
图1是本发明的图网络组成示例图;
[0081]
图2是多路gru单元结构图;
[0082]
图3是动态注意力单元结构图;
[0083]
图4是动态注意力图网络整体结构图;
[0084]
图5是本发明的实施流程图。
具体实施方式
[0085]
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
[0086]
实施例1
[0087]
本发明如图1-5所示,本发明提供一种基于动态注意力图网络的营销套利黑产的识别方法,包括以下步骤:
[0088]
一、定义一种动态图网络结构,它由两类节点,四种关系边,和t个时刻组成:
[0089]
1)两类节点:图网络中含有用户节点vc,和商户节点vb两类节点
[0090]
2)四种关系边分别是:
[0091]
a)用户与用户的设备关系边ed:
[0092]
根据访问日志中过去某段时间内,不同用户访问设备ip存在相同性,生成用户节点和用户节点之间的设备关系边;
[0093]
b)用户与用户的支付关系边e
p
:
[0094]
根据业务系统中过去某段时间内,用户和用户之间存在转账支付行为,生成用户节点和用户节点之间的支付关系边;
[0095]
c)用户与用户的社交关系边es:
[0096]
根据业务系统中过去某段时间内,用户和用户之间存在一方分享营销活动信息并成功邀请另一方参加该营销活动的行为,生成用户节点和用户节点之间的社交关系边;
[0097]
d)用户与商户的交易关系边e
t
:
[0098]
根据业务系统中过去某段时间内,用户在商户里发生了交易支付的行为,生成用户节点和商户节点之间的交易关系边;
[0099]
3)t个时刻是指:
[0100]
在时间轴上以t0时刻为初始,ω为间隔,选取连贯的t个时刻点;在每个时刻点上都生成一张由上述2类节点和4种关系边的关系图网络;这样即反映出了图网络随着时间的t个时刻的演变;图例见于图1;
[0101]
二、在图数据库中为t个时刻生成t张网络图,分别为
[0102][0103][0104]
把每个时刻点的用户集vc分别从图数据库模块中导入至分布式数据库模块,并为每个时刻点的每个用户生成代表其属性的m维特征向量,特征向量的特征域可以选取常见的自然人属性特征予以构建,也可以引入基于专家经验提炼的统计类特征,例如:过去某段时间访问某活动的次数等等,以获取更好的识别效果;这样就为每个时刻点的用户集vc生成了属性特征矩阵以表的形式存入分布式数据库模块中;下标中n0,n1,...分别表示每个时刻点用户集的数量;
[0105]
同理,把每个时刻点的商户集vb分别从图数据库模块中导入至分布式数据库模块,并为每个时刻点的每个商户生成代表其属性的k维特征向量;这样就为每个时刻点的商户集vb生成了属性特征矩阵以表的形式存入分布式数据库模块中;下标中l0,l1,...分别表示每个时刻点商户集的数量;
[0106]
三、基于历史的套利用户正负样本,分别为每个时刻点的用户集vc打上标签,并以表的形式存入分布式数据库模块中;打完标签后,用户集vc变成有标签(v
labeled
)和无标签(v
unlabeled
)两种样本,v
labeled
样本被分为已知套利用户样本v
labeled
=1和已知非套利用户样本v
labeled
=0,图网络上所有的商户节点都设置为无标签样本;
[0107]
四、设计一种新型图注意力机制,其特点是1)分别为用户节点和商户节点都定义了独立的映射矩阵,通过映射矩阵把这两类不同维度特征向量映射成同一维度,实现了用户节点和商户点在信息聚合时的统一;2)基于图上定义的四种关系边,定义了一种多边注意力的机制,即为每个关系边都引入了一套独立的注意力的学习参数,从而实现了多种关系边在信息聚合时的统一;
[0108]
具体操作如下:
[0109]
1)首先根据四种关系边定义4套独立的注意力学习参数并初始化学习参数:
[0110]
a)用户与用户设备关系ed:定义共享线性映射矩阵和注意力共享向量ad∈r2f
;
[0111]
b)用户与用户支付关系e
p
:定义共享线性映射矩阵和注意力共享向量a
p
∈r
2f
;
[0112]
c)用户与用户的社交关系边es:定义共享线性映射矩阵和注意力共享向量a
t
∈r
2f
;
[0113]
d)用户与商户的交易关系边e
t
:为用户节点和商户节点定义独立的共享的线性映射矩阵和用于把用户特征向量空间和商户特征向量空间从m维和l维映射到统一的f维向量空间。定义共享注意力向量a
t
∈r
2f
;
[0114]
2)再以如下公式进行图中各边的注意力系数计算:
[0115]
a)基于ed关系边的注意力系数:
[0116][0117][0118]
b)基于e
p
关系的注意力系数:
[0119][0120][0121]
c)基于es关系的注意力系数:
[0122][0123][0124]
d)基于e
t
关系的注意力系数:
[0125][0126][0127]
上面表达式中,符号||代表向量的拼接,下标i,j分别表示图中基于某种关系边相邻的两个节点,hi或hj都表示该节点所对应的特征向量取自之前生成的用户特征矩阵,在计算e
t
关系注意力系数时hi和hj特征向量一个取自用户特征矩阵,另一个取自商户特征矩阵;
[0128]
3)最后通过如下公式进行信息聚合计算:
[0129][0130]
上述公式中,nd(i)、n
p
(i)、ns(i)、n
t
(i)符号分别表示节点i通过设备关系边、支付关系边、社交关系边、交易关系边连接的一阶邻居;
[0131]
上述步骤四中这一系列处理称为:多边注意力单元(multiedgegat);
[0132]
五、上述步骤四只是完成了在某个时刻上图网络在空间层面的信息聚合,因为要考虑图网络的时间维上的动态性,就必须完成网络信息在时间维上的传递,本专利创新提出了一种使用多路gru的方式在时间维上传递注意力参数的机制(称为:多路gru单元-multigru),结合空间层面的图注意力信息聚合机制(多边注意力单元-multiedgegat),形成了一个全新的处理单元,称之为动态注意力单元,具体操作如下:
[0133]
1)因为图注意力机制会产生9个需要学习的参数,即5个共享线性映射矩阵和4个共享注意力向量,这里需要定9个独立的gru单元负责在时间维上进行对于参数信息的传递,其分别是:
[0134]
用来传递线性映射矩阵,和用来传递注意力向量。对这些gru单元的参数进行初始化;
[0135]
2)这里的gru传播公式如下:
[0136]
因为gru单元内部结构是一样的为了便于阐述举为例进行公式说明:
[0137][0138][0139][0140][0141]
上述公式即完成了t-1时刻的注意力参数通过传递生成t时刻的注意力参数同理也可以以相同的结构,通过其他gru从t-1时刻传递生成t时刻的其他8个注意力参数w
pt
、w
st
、上述公式中
⊙
表示哈达玛积,为自身要学习的参数,同理其他gru也有相类似的参数要学习;把上述9个gru单元汇总在一起,称为多路gru单元-multigru;见图2所示结构;
[0142]
3)把多边注意力单元和多路gru单元合并,生成一个全新的处理单元,称之为动态注意力单元(dynamicgat),合并公式如下:
[0143]
为了使公式简化,更易于表达,把wd、w
p
、ws、w
tc
、w
tb
这5个参数合并成w,把ad、a
p
、as、a
t
这4个参数合并成a;
[0144]wt
,a
t
=multigru(h
t
,w
t-1
,a
t-1
)
[0145]h′
t’=multiedgegat(h
t
,w
t
,a
t
)
[0146]
见图3所示动态注意力单元结构;
[0147]
六、上述步骤五阐述在时间轴上一个动态注意力单元的信息传递和信息聚合,这里可以很自然在每个时间点上进行空间上的多层聚合,则上述动态注意力单元的表达式可以表示成:
[0148][0149][0150]
上式中上标l表示空间聚合的层级,这里每增加一层聚合意味着把图中节点再下一层邻接信息“压”向该节点,因此就很好的利用了多层邻接关系所蕴藏的信息,至此构建完成了一个既包含时间维度的信息传递,又包含空间维度多层聚合的动态可学习的图网络;见图4所示动态注意力图网络整体结构;
[0151]
七、把上述动态注意力图网络最后一层最后一个时刻的输出表征通过softmax进行激活映射成预测节点套利风险的概率p;
[0152]
八、把上述所有步骤称为一次完整的学习迭代。进行学习迭代时,要把所需的信息从分布式数据库模块中同步入服务器内存并初始化所需学习的参数,然后进行多轮次的完整学习迭代。每次完整的学习迭代后仅针对有标签的节点v
labeled
,通过交叉熵损失函数,进行损失计算,以及adam优化算法进行梯度更新,最后经过n次完整的学习迭代学习出动态注意力图网络所需的参数。完成动态注意力图网络的学习;
[0153]
九、把学习好的动态注意力网络部署进风控决策模块中,进行在线的营销套利风险概率预测,设置概率决策阈值p=σ,当预测的风险概率大于σ时,判断为营销套利风险人群,并进行后续拦截等处理操作。
[0154]
具体的,示例如下:
[0155]
1.用户节点属性特征向量,经验取值m=256
[0156]
2.商户节点属性特征向量,经验取值l=128
[0157]
3.t个时刻,t取值t=10
[0158]
3.有标签(v
labeled
)和无标签(v
unlabeled
)两类样本比例:
[0159]
4.空间聚合层级(l),取值范围:{l|2≤l≤3,l∈z}
[0160]
5.预测识别时决策阈值σ取值:σ=0.5。
[0161]
本发明技术点如下:
[0162]
1.定义了一种由两类节点:用户节点、商户节点,由四种关系边:用户与用户设备关系边ed、用户与用户支付关系边e
p
、用户与用户社交关系边es、用户与商户交易关系边e
t
,
和由多个时刻组成的一种新型的动态图网络结构;
[0163]
2.设计了一种新型的多边注意力单元,能更有效的实现用户节点、商户节点、多维关系的统一,从而更好的实现节点空间层面的信息聚合;
[0164]
3.创新的设计了一种通过多路gru单元传递注意力信息的动态模式,使得图网络在时间轴上的演变信息也得到了有效的传递。
[0165]
4.有效把多边注意力单元和多路gru单元进行了合并,提出了动态注意力单元这种新型处理单元,使用此单元搭建的动态注意力图网络能既完成时间维的有效信息传递,又能实现空间维的多层邻接信息的高效聚合。
[0166]
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
转载请注明原文地址:https://win.8miu.com/read-1058794.html