一种互联网媒体中信息曝光率的测量方法及装置

专利检索2025-06-08  9


本发明涉及信息曝光率测量,具体涉及一种互联网媒体中信息曝光率的测量方法及装置。


背景技术:

1、当前,互联网媒体已经成为信息传播和公众信息消费的最主要的技术媒介。在传播领域中,信息的曝光率是衡量信息传播效果的一项重要指标,在热点监测、市场营销和社会治理等多个环节发挥着重要的作用。

2、对于广播、电视等传统电子媒体,节目的曝光率,也就是收视率,主要通过自动化或人工的方式对样本用户行为进行采样统计获得。自动化方式是利用预先安装的测量仪记录用户家中广播电视的观看情况,通过测量仪自动回传数据。而人工方式则是样本用户每日自行记录自身的广播电视节目收视情况,而后由调查人员定时回收记录。上述两种方式均属于典型社会调查方法的范畴。

3、随着互联网媒体的发展,基于真实用户的社会调查方法在效率和准确性方面都暴露出了明显的缺陷。大数据方法可以通过全面统计互联网媒体平台后台信息发布和传播数据集,有效确定每条信息在用户客户端的曝光和消费情况,从而准确确定信息在某平台的曝光情况。

4、然而,随着以推荐和排序算法为代表的智能算法在互联网媒体平台中的普及,大数据方法也面临着诸多挑战,包括:(1)智能算法的动态性、随机性和黑箱性,以及真实系统中庞大的信息和用户规模,使利用常见开放数据信息重建信息从发布到特定用户屏幕曝光的过程变得困难;(2)智能推荐和排序的核心特点是个性化,因此,大数据方法可以通过利用用户的日常个人浏览记录计算曝光率,但大规模使用用户个性化私人数据实现商业目的,涉及个人权益和隐私保护等伦理问题;(3)在不依赖用户隐私数据的条件下,大数据方法可以采用浏览、点赞、评论等显性信息消费行为来推理隐形的曝光情况,但精确度难以保证;(4)大数据方法普遍依赖平台内部的授权支持,因此,该方法很难同时一致的处理多平台曝光率的测量问题。

5、因此,需要一种可以全面、及时、客观、高效测量特定信息的实际曝光率的新方法。


技术实现思路

1、为了克服现有技术的不足,本发明提供一种互联网媒体中信息曝光率的测量方法及装置,用于解决现有的信息曝光率测量方法存在不全面、不及时、不客观以及低效的技术问题,从而对特定信息的实际曝光率实现全面、及时、客观以及高效的测量。

2、为解决上述问题,本发明所采用的技术方案如下:

3、一种互联网媒体中信息曝光率的测量方法,包括以下步骤:

4、统计互联网媒体平台中用户群体,并提取相应的属性特征,从而得到用户的特征描述,根据所述特征描述分割提取相似的用户群体,并得到群体属性特征;

5、根据所述群体属性特征,建立和部署针对性的模拟用人工智能体集群;

6、采集由所述人工智能体集群模拟信息消费活动所产生的曝光信息数据;

7、从所述曝光信息数据中识别出符合条件的目标信息集合;

8、基于所述目标信息集合,统计并展示目标信息的曝光率;

9、在识别出符合条件的目标信息集合时,包括:

10、在人工智能体控制器的数据库中获取一个带有待识别目标标识的曝光信息,得到待识别曝光信息,并对所述待识别曝光信息匹配判断是否属于曝光目标信息;

11、其中,所述数据库中包含互联网媒体平台向人工智能体推送的页面信息和曝光评论信息;

12、所述曝光率包括:基于信息数量获取的曝光率和基于人工智能体数量获取的曝光率;

13、所述基于信息数量获取的曝光率为:曝光目标信息的数量与其他信息的数量的比例;

14、所述基于人工智能体数量获取的曝光率为:接收到曝光目标信息的人工智能体的数量与其他人工智能体的数量的比例。

15、作为本发明优选的实施方式,在得到群体属性特征时,包括:

16、获取用户整体的属性分布,所述属性分布包括:地理分布属性、年龄属性、性别属性、活动时间属性、内容偏好属性;

17、在地理、年龄以及性别三个维度进行属性项匹配组合,进行用户群体划分,获得多个用户群体;

18、分析不同用户群体的信息消费内容偏好,在新闻分类和关键词两个维度建立用户群体行为属性特征;

19、在多个地理特征中重复所述多个用户群体,并加入相应地理关键词,构成最终的多个模拟用户群体。

20、作为本发明优选的实施方式,在获取用户整体的属性分布时,包括:

21、选取不同地区的多个代表性城市或县区作为所述地理分布属性;

22、按照年龄段进行划分,得到若干个梯度的年龄属性,年龄梯度粒度包括:未成年、青年、中年和老年;

23、所述性别属性除男性和女性外,以用户群体刻画为目的,加入一个混合项;

24、所述活动时间属性定义为用户使用所述互联网媒体平台的活动时间分布和活动间隔分布;将所述活动时间分布和所述活动间隔分布,依据用户的活动历史,综合刻画用户是否处于活动状态;

25、所述内容偏好属性分为内容分类和关键词两个部分,其中,所述内容分类指遵循约定的分类原则和方法,按照信息的内涵和性质,将所有信息,按一定的结构体系,分门别类加以集合,使得每个信息在相应的分类体系中都有一个或多个对应位置;

26、其中,所述关键词包括:针对内容标识的关键词、地理关键词以及性别关键词。

27、作为本发明优选的实施方式,在建立和部署针对性的模拟用人工智能体集群时,包括:

28、平台账号获取与基本资料设定,包括:所在地区、人口特征和初始兴趣偏好及相关关注;

29、对人工智能体进行设计与实现;

30、设定所述人工智能体的软件参数,绑定账号特征,设定活动时间与内容偏好属性;

31、启动所述人工智能体执行逻辑行为;

32、对所述人工智能体的活动进行控制;

33、其中,通过人工智能体控制器下达启动/重启指令,完成所述人工智能体的启动。

34、作为本发明优选的实施方式,在对人工智能体进行设计与实现时,包括:

35、使用自动化工具操作互联网浏览器或移动应用app,实现所述人工智能体对所述互联网媒体平台的自动化访问,包括:

36、在人工辅助下,登录已初始化完成的账号;

37、访问账号主页页面,按照关键词挑选内容进行点击进入详细浏览;

38、访问热门推荐信息页面,按照关键词和内容分类进行点击进入详细浏览;

39、访问热门分类信息页面,按照内容分类进行点击进入详细浏览;

40、访问搜索页面,按照关键词进行搜索,选择点击搜索结果进入详细浏览;

41、在详细内容页面,进行点赞操作、发布者关注操作;

42、在绑定账号特征时,包括:在人工辅助下,完成所述人工智能体在所述互联网媒体平台的登录,实现所述人工智能体和已注册账号的绑定。

43、作为本发明优选的实施方式,在设定所述人工智能体的软件参数时,包括:

44、以预定义的条件概率选择来源页面中的一个;

45、从所述来源页面中按照浏览操作执行比例,依据信息的分类或是否包含特定关键词,抽取一条随机信息并对其执行浏览操作;如果未能寻找到匹配信息,则放弃本次操作;

46、在浏览所述详细内容页面时,按照设定概率,随机选择是否执行点赞和关注操作;

47、所述人工智能体依据活动时间分布和活动间隔分布,随机休眠一段时间,直到执行下一个操作;

48、其中,所述来源页面包括:所述账号主页页面、所述热门推荐信息页面、所述热门分类信息页面、所述搜索页面以及所述详细内容页面;

49、所述人工智能体能够监听来自人工智能体控制器的控制指令,完成停止、重启、修改配置以及执行额外浏览任务操作;

50、将所述人工智能体的逻辑控制行为过程由java、javascript和python语言描述并转换为可执行程序,并在人工智能体宿主器中执行;

51、将所述人工智能体的逻辑控制行为参数储存储在json格式的配置文件或嵌入可执行程序中,并将所述配置文件和所述嵌入可执行程序放入所述人工智能体宿主器中;

52、在对所述人工智能体的活动进行控制时,包括:

53、对于位于所述人工智能体宿主器中的一个正在执行的人工智能体,通过所述人工智能体控制器控制所述人工智能体的活动,包括:

54、停止、重启所述人工智能体的活动、修改配置文件参数、执行临时浏览活动;

55、其中,所述临时浏览活动由浏览源页面、关键词或分类名、浏览数量、点赞概率以及关注概率共5个参数描述,并由所述人工智能体控制器通过指令通路下发所述人工智能体执行。

56、作为本发明优选的实施方式,在采集曝光信息数据时,包括:

57、所述人工智能体在模拟用户群体访问和操作所述互联网媒体平台时,同时记录所述互联网媒体平台向其推送时,在主页页面、推荐信息页面、分类信息页面和搜索页面中出现的信息,包括所述信息的内容、来源、发布时间、点赞量、评论量、转发量;

58、对于被选择进行详细浏览的信息,同时记录曝光评论信息,包括:所属信息、评论内容、评论作者、评论时间、回复关系、评论点赞量、评论转发量以及评论回复量;

59、将记录数据以预设的格式,通过人工智能体宿主器和人工智能体控制器间的数据上传通路,将记录的信息和评论数据传输给人工智能体控制器;

60、人工智能体控制器接收到数据后,以数据库形式,对数据进行储存,并作为后继查询和统计的基础;

61、其中,所述人工智能体控制器除记录信息和评论数据本身外,还将记录关于所述人工智能体和采集行为本身的相关数据,包括:人工智能体各类属性特征、采集时间、来源页面,另外对于被选择进行详细阅读的信息,还需要记录判别用依据关键词或分类。

62、作为本发明优选的实施方式,在对所述待识别曝光信息匹配判断是否属于曝光目标信息时,包括:

63、基于名称标识和曝光信息的来源属性匹配判断所述待识别曝光信息是否属于曝光目标信息;

64、基于信息名称或链接标识和曝光信息的内容属性匹配判断所述待识别曝光信息是否属于曝光目标信息;

65、将识别结果与曝光信息以及人工智能体的信息数据一起存放在曝光率计算器的缓存中,用于曝光率的获取。

66、作为本发明优选的实施方式,在统计并展示目标信息的曝光率时,包括:

67、对所述目标信息集合进行筛选,筛选条件包括:时间范围、人工智能体地理属性、人工智能体年龄属性、人工智能体性别属性;

68、通过所述筛选条件,确定不同范围的曝光率,包括:某时间段内的曝光率、某地域的曝光率、某年龄段的曝光率、某性别的曝光率;

69、将所述不同范围的曝光率进行自由组合,形成更为精准的子群体曝光率。

70、一种互联网媒体中信息曝光率的测量装置,包括:

71、人工智能体宿主器,用于部署和运行人工智能体及所需互联网访问环境;

72、人工智能体控制器,用于收集来自一个或者多个所述人工智能体宿主器中的多个人工智能体的账号特征和曝光数据的上传,并向所述人工智能体宿主器发布控制指令;

73、曝光率计算器,用于定时或按需查询数据记录与访问器,进行目标信息识别,统计和获取信息曝光率;

74、曝光率呈现器,用于交互式查询和显示实体曝光率获取结果;

75、其中,多个所述人工智能体宿主器能在地理和互联网空间中进行分布式部署,多个所述人工智能体宿主器之间能相互独立;

76、多个所述人工智能体宿主器与多个所述人工智能体控制器之间存在曝光数据上传信号通路和人工智能体控制指令的传递信号通路;

77、所述曝光率计算器和所述人工智能体控制器之间存在查询指令传递信号通路和数据结果反馈信号通路;

78、所述曝光率呈现器和所述曝光率计算器之间存在查询指令传递信号通路和曝光率获取结果反馈信号通路;

79、所述测量装置在运行时,执行权利要求1-9任一项所述的测量方法。

80、相比现有技术,本发明的有益效果在于:

81、(1)采用本发明所提供的测量方法,可以自主高效、实时快速的评估互联网媒体信息在用户中的传播效果;

82、(2)本发明利用人工智能体的模拟替代对真实用户信息的调查采集,获取互联网媒体平台中具有特定属性特征的群体的曝光信息记录;人工智能体旨在模仿互联网媒体中真实用户的行为,以便从人工智能体的行为和交互中收集的曝光数据反映用户在平台上的真实体验。人工智能体的所有动作均由随机模型控制,该模型在执行过程中保持一致,并且在模拟期间保持不变,从而实现曝光率全面、及时、客观以及高效的测量;

83、(3)本发明所应用的互联网媒体平台涉及所有具备通过个性化推荐和排序算法向用户传播信息能力的互联网平台,包括但不限于:新闻、视频、短视频、论坛、社区、电商消费等类型平台,因此本发明具有较宽的适用面。

84、下面结合附图和具体实施方式对本发明作进一步详细说明。


技术特征:

1.一种互联网媒体中信息曝光率的测量方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的互联网媒体中信息曝光率的测量方法,其特征在于,在得到群体属性特征时,包括:

3.根据权利要求2所述的互联网媒体中信息曝光率的测量方法,其特征在于,在获取用户整体的属性分布时,包括:

4.根据权利要求1所述的互联网媒体中信息曝光率的测量方法,其特征在于,在建立和部署针对性的模拟用人工智能体集群时,包括:

5.根据权利要求4所述的互联网媒体中信息曝光率的测量方法,其特征在于,在对人工智能体进行设计与实现时,包括:

6.根据权利要求5所述的互联网媒体中信息曝光率的测量方法,其特征在于,在设定所述人工智能体的软件参数时,包括:

7.根据权利要求1所述的互联网媒体中信息曝光率的测量方法,其特征在于,在采集曝光信息数据时,包括:

8.根据权利要求1所述的互联网媒体中信息曝光率的测量方法,其特征在于,在对所述待识别曝光信息匹配判断是否属于曝光目标信息时,包括:

9.根据权利要求1所述的互联网媒体中信息曝光率的测量方法,其特征在于,在统计并展示目标信息的曝光率时,包括:

10.一种互联网媒体中信息曝光率的测量装置,其特征在于,包括:


技术总结
本发明公开了一种互联网媒体中信息曝光率的测量方法及装置,包括以下步骤:统计互联网媒体平台中用户群体,并提取相应的属性特征,从而得到用户的特征描述,根据特征描述分割提取相似的用户群体,并得到群体属性特征;根据群体属性特征,建立和部署针对性的模拟用人工智能体集群;采集由人工智能体集群模拟信息消费活动所产生的曝光信息数据;从曝光信息数据中识别出符合条件的目标信息集合;基于目标信息集合,统计并展示目标信息的曝光率。本发明用于解决现有的信息曝光率测量方法存在不全面、不及时、不客观以及低效的技术问题,从而对特定信息的实际曝光率实现全面、及时、客观以及高效的测量。

技术研发人员:闵勇
受保护的技术使用者:北京师范大学珠海校区
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1154849.html

最新回复(0)