本发明属于网络空间,尤其涉及指定情感社交评论生成方法、系统、介质、设备及终端。
背景技术:
1、现有文本生成算法主要应用场景是写诗词对联新闻小数、根据属性生成商品描述以及生成吸睛标题,目前没有针对指定情感社交评论生成的应用。同时,现有社交评论指定情感数据集存在缺失问题;模型生成效果不可控,训练好的模型更像是一个“黑盒”,也无法干预模型的生成效果。因此,为了解决指定情感社交评论的新应用,亟需设计一种新的指定情感社交评论生成方法。
2、通过上述分析,现有技术存在的问题及缺陷为:
3、(1)目前没有针对指定情感社交评论生成的应用。
4、(2)现有的社交评论指定情感数据集存在缺失的问题。
5、(3)现有的指定情感社交评论模型生成效果不可控,训练好的模型更像是“黑盒”,也无法干预模型的生成效果。
技术实现思路
1、为克服相关技术中存在的问题,本发明公开实施例提供了指定情感社交评论生成方法、系统、介质、设备及终端。所述技术方案如下:
2、本发明是这样实现的,指定情感社交评论生成方法,包括:
3、步骤一,对社交主贴与社交评论数据进行七类情感人工标注;
4、步骤二,生成bert模型,利用标注好的数据集训练bert模型,再采用训练好的bert模型生成标签数据集;
5、步骤三,针对社交主贴内容提取核心关键词;
6、步骤四,将提取的核心关键词和生成的标注数据集作为nezha模型输入,智能输出指定情感社交评论。
7、在步骤一中,七类情感包括喜、怒、哀、乐、惧、惊、恶。
8、在步骤三中,针对社交主贴内容提取核心关键词,包括:
9、(1)针对主贴内容词汇,构建词汇语义网络模型图,计算语义相关度r(c1,c2);
10、(2)根据图中词汇在整个语义网络图中的重要度weight(ci),得到词汇在整个主贴内容的地位和贡献度;
11、(3)根据重要度满足的条件,提取主贴内容中的核心关键词。
12、在步骤(1)中,计算语义相关度r(c1,c2),包括:
13、基于词汇相关度计算方法,文本特征词汇集合中的两两词汇间相关度计算公式为:
14、
15、式中,ρ(icn)为两词汇本体概念共同的父节点密度,d(icn)为两词汇本体概念共同的父节点深度,ρmax(s)为义原网状结构中对应父节点所在的树状结构中的最大节点密度值,dmax(s)为义原网状结构中对应父节点所在的树状结构中的树的度;n'=0为两词汇(c1,c2)间无特殊关系,n'>0为两词汇(c1,c2)间有特殊关系,a为由专家给定的特殊关系权重,a∈(0,1)。
16、在步骤(2)中,根据图中词汇在整个语义网络图中的重要度weight(ci),得到词汇在整个主贴内容的地位和贡献度,包括:
17、特征词汇的分支越多,词汇在整个文本中的地位和贡献度越大,通过下式计算词汇在整个语义网络图中的重要度:
18、
19、式中,为特征词汇ci直接子节点个数,nt为整个语义网络图中总节点个数。
20、在步骤(3)中,根据重要度满足的条件,提取主贴内容中的核心关键词,包括:
21、设定合适的阈值ε∈(0,1),提取满足下式关系的特征词汇:
22、weight(ci)>ε
23、式中,weight(ci)为词汇在整个语义网络图中的重要度,ε为阈值。
24、本发明的另一目的在于提供一种应用所述指定情感社交评论生成方法的指定情感社交评论生成系统,所述指定情感社交评论生成系统包括:
25、情感标注模块,用于对社交主贴与社交评论数据进行七类情感人工标注;
26、标签数据集生成模块,用于生成bert模型,利用标注好的数据集训练bert模型,再采用训练好的bert模型生成标签数据集;
27、核心关键词提取模块,用于针对社交主贴内容提取核心关键词;
28、指定情感评论生成模块,用于将提取的核心关键词和生成的标注数据集作为nezha模型输入,智能输出指定情感社交评论。
29、本发明的另一目的在于提供一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述指定情感社交评论生成方法的步骤。
30、本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述指定情感社交评论生成方法的步骤。
31、本发明的另一目的在于提供一种信息数据处理终端,其特征在于,所述信息数据处理终端安装在电子装置上,提供用户输入接口以实施所述指定情感社交评论生成系统。
32、结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明针对现有指定情感社交评论生成缺失以及模型生成效果不可控问题,本发明提供了一种指定情感社交评论生成方法,创新性地实现指定七类情感社交评论生成,利用改进的语义分析技术提取主贴内容关键词,利用主贴内容关键词和七类情感去限定社交评论生成。本发明弥补了现有社交评论指定情感数据集的缺失问题;利用主贴内容核心关键词限定评论生成,解决了模型生成效果不可控的问题。本发明解决了以下几个问题:
33、(1)针对于社交贴文与社交评论数据标注喜、怒、哀、乐、惧、惊、恶七类情感;对于标注好的数据集训练模型,再采用训练好的模型生成标签数据集。
34、(2)针对于现有模型生成效果不可控问题,本发明先对主贴内容提取核心关键词,并利用核心关键词限定社交评论生成。
35、(3)本发明比传统的词频-反文档频率方法得到的核心关键词的准确度更高。
1.一种指定情感社交评论生成方法,其特征在于,该方法包括:
2.根据权利要求1所述指定情感社交评论生成方法,其特征在于,在步骤一中,七类情感包括喜、怒、哀、乐、惧、惊、恶。
3.根据权利要求1所述指定情感社交评论生成方法,其特征在于,在步骤三中,针对社交主贴内容提取核心关键词,包括:
4.根据权利要求3所述指定情感社交评论生成方法,其特征在于,在步骤(1)中,计算语义相关度r(c1,c2),包括:
5.根据权利要求3所述指定情感社交评论生成方法,其特征在于,在步骤(2)中,根据图中词汇在整个语义网络图中的重要度weight(ci),得到词汇在整个主贴内容的地位和贡献度,包括:
6.根据权利要求3所述指定情感社交评论生成方法,其特征在于,在步骤(3)中,根据重要度满足的条件,提取主贴内容中的核心关键词,包括:
7.一种应用如权利要求1~6任意一项所述指定情感社交评论生成方法的指定情感社交评论生成系统,其特征在于,所述指定情感社交评论生成系统包括:
8.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1~6任意一项所述指定情感社交评论生成方法的步骤。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1~6任意一项所述指定情感社交评论生成方法的步骤。
10.一种信息数据处理终端,其特征在于,所述信息数据处理终端安装在电子装置上,提供用户输入接口以实施如权利要求7所述指定情感社交评论生成系统。