一种基于彩虹表的匹配方法、装置、存储介质及电子设备与流程

专利检索2022-05-10  20



1.本技术实施例涉及互联网数据分析、人工智能领域,尤其涉及一种基于彩虹表的匹配方法、装置、存储介质及电子设备。


背景技术:

2.随着电子技术的发展,电子设备逐渐普及。电子设备具备的功能也越来越多。在移动应用的流量数据的传输过程中会存在一些危害信息的传输。
3.目前,采用关键词匹配技术对流程数据传输过程中的危害信息进行匹配。针对流量数据的关键词匹配一般停留在明文截取的简单处理和规则处理。
4.在面对网络信息加密逐步普及和技术方案越来越复杂成熟的情况下,现有的关键词匹配技术不能对加密的移动数据进行关键词匹配。


技术实现要素:

5.本技术实施例提供一种基于彩虹表的匹配方法、装置、存储介质及电子设备,能够支持移动应用关键词匹配,并且不需要解密移动应用通信信息内容,保护了用户隐私。且对移动应用匹配具备快速部署的优势。
6.第一方面,本技术实施例提供了一种基于彩虹表的匹配方法,该方法包括:
7.获取移动应用的目标数据;其中,所述目标数据用于表征加密后的移动应用数据;所述目标数据包括文本数据、图片数据、语音数据以及视频数据中的至少一种;所述移动应用用于表征采用端对端通讯方式的应用;
8.利用预先配置的彩虹表,对所述目标数据进行匹配,获得目标关键词;其中,所述彩虹表中包括关键词链表的初始关键词和结束关键词,用于破解加密关键词。
9.第二方面,本技术实施例提供了一种基于彩虹表的匹配装置,该装置包括:
10.目标数据获取模块,用于获取移动应用的目标数据;其中,所述目标数据用于表征加密后的移动应用数据;所述目标数据包括文本数据、图片数据、语音数据以及视频数据中的至少一种;所述移动应用用于表征采用端对端通讯方式的应用;
11.目标关键词获得模块,用于利用预先配置的彩虹表,对所述目标数据进行匹配,获得目标关键词;其中,所述彩虹表中包括关键词链表的初始关键词和结束关键词,用于破解加密关键词。
12.第三方面,本技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本技术实施例所述的基于彩虹表的匹配方法。
13.第四方面,本技术实施例提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本技术实施例所述的基于彩虹表的匹配方法。
14.本技术实施例所提供的技术方案,获取移动应用的目标数据;其中,目标数据用于表征加密后的移动应用数据;目标数据包括文本数据、图片数据、语音数据以及视频数据中
的至少一种;移动应用用于表征采用端对端通讯方式的应用;然后利用预先配置的彩虹表对目标数据进行匹配,获得目标关键词。本技术方案,能够支持移动应用关键词匹配,并且不需要解密移动应用通信信息内容,保护了用户隐私。且对移动应用匹配具备快速部署的优势。
附图说明
15.图1是本技术实施例一提供的基于彩虹表的匹配方法的流程图;
16.图2是本技术实施例一提供的关键词匹配过程的示意图;
17.图3是本技术实施例一提供的彩虹表配置过程的示意图;
18.图4是本技术实施例一提供的关键词综合判断的流程图;
19.图5是本技术实施例二提供的基于彩虹表的匹配过程的示意图;
20.图6是本技术实施例二提供的目标数据的匹配过程的示意图;
21.图7是本技术实施例三提供的基于彩虹表的匹配装置的结构示意图;
22.图8是本技术实施例五提供的一种电子设备的结构示意图。
具体实施方式
23.下面结合附图和实施例对本技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本技术,而非对本技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本技术相关的部分而非全部结构。
24.在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
25.实施例一
26.图1是本技术实施例一提供的基于彩虹表的匹配方法的流程图,本实施例可适用于对移动应用传输的加密数据进行匹配的情况,该方法可以由本技术实施例所提供的基于彩虹表的匹配装置执行,该装置可以由软件和/或硬件的方式来实现,并可集成于用于加密数据匹配的智能终端等设备中。
27.如图1所示,所述基于彩虹表的匹配方法包括:
28.s110、获取移动应用的目标数据;其中,所述目标数据用于表征加密后的移动应用数据;所述目标数据包括文本数据、图片数据、语音数据以及视频数据中的至少一种;所述移动应用用于表征采用端对端通讯方式的应用;
29.在本方案中,基于彩虹表,通过对加密后的目标数据进行匹配,可以在不需要解密的情况下,判断网络流量传输过程中是否存在一些敏感词。
30.其中,文本数据、图片数据、语音数据以及视频数据可以是汉语、粤语、闽南语以及英文等不同语言的数据。
31.在本方案中,可以采用常规数据读取方法获取移动应用的加密的目标数据。其中,目标数据可以是文本形式的数据、图片形式的数据、语音数据或者视频数据等。
32.s120、利用预先配置的彩虹表,对所述目标数据进行匹配,获得目标关键词;其中,所述彩虹表中包括关键词链表的初始关键词和结束关键词,用于破解加密关键词。
33.在本实施例中,彩虹表可以是指加密散列函数逆运算的预先计算好的表,用于破解密码的散列值。彩虹表中包含移动应用通讯的各种敏感关键词。
34.其中,彩虹表的基本思路为:假设有一种密码哈希函数h和一个有限密码集p,目标是预先计算一个数据结构,对于任意的哈希函数输出h,都能很快的在p中定位p,使h(p)=h,或确定在p中没有这么一个p。彩虹表的原理:定义一个还原函数r,将哈希值映射回p中的值。通过交替使用哈希函数和还原函数,则可以形成一个密码和哈希交替出现的链。为了生成表,先随机选取一个初始的密码集合,对每一个密码计算某一固定长度k的关键词链。只保留每条关键词链的第一个和最后一个密码,即初始关键词和结束关键词,形成彩虹表。破解过程:对于一个哈希值h,用还原函数r做一次变化,与彩虹表中的末端密码逐个进行比较,如果匹配,则破解成功;如果匹配失败,则对h进行r、h、r变换,再匹配,以此类推,直到匹配成功。最后,正向重算一遍验证结果的正确性。
35.其中,目标关键词可以是指网络流量传输过程中的一些敏感词。
36.在本方案中,获得目标数据后,将目标数据与预先配置的彩虹表的结束关键词进行匹配,若匹配成功,则将目标数据的内容作为目标关键词。
37.示例性的,图2是本技术实施例一提供的关键词匹配过程的示意图。如图2所示,在输入层输入目标数据,在隐含层中将目标数据与预先配置的彩虹表进行匹配,若匹配成功,则在输出层输出1;若匹配失败,则在输出层输出

1。
38.在本技术方案中,可选的,所述彩虹表的配置过程包括:
39.获取移动应用的关键词;
40.按照预设规则对所述关键词进行至少一次运算,得到特征向量;其中,所述预设规则包括哈希函数和还原函数中的至少一个;
41.将所述关键词和特征向量的匹配关系进行保存,形成彩虹表。
42.其中,还原函数的值域和定义域与哈希函数相反,通过还原函数可以将哈希值约简为一个与原文相同格式的值。
43.在本方案中,关键词可以是指网络流量传输过程中的各个敏感词。
44.在本实施例中,可以采用常规技术手段获取移动应用的关键词,并使用哈希函数或者还原函数对关键词进行处理,形成固定长度的关键词链表,关键词链表的第一个密码为关键词,关键词链表的最后一个密码为特征向量,将关键词链表的第一个密码和最后一个密码进行保存,形成彩虹表。例如,假设关键词是aaaaaa,对关键词进行哈希函数处理、还原函数处理、哈希函数处理以及还原函数处理,则获得的关键词链表可以是aaaaaa

281daf40

sgfnyd

920ecf10

kiebgt。将aaaaaa和kiebgt进行保存,形成彩虹表。其中,使用哈希函数和还原函数对关键词进行处理的次数和顺序都可以预先进行设置。
45.通过对关键词进行处理,获得彩虹表,能够支持移动应用关键词匹配,并且不需要解密移动应用通信信息内容,保护了用户隐私。且对移动应用匹配具备快速部署的优势。
46.在本技术方案中,可选的,将所述关键词和特征向量的匹配关系进行保存,形成彩虹表,包括:
47.利用数据仓库技术对所述关键词和特征向量进行处理,得到处理后彩虹表。
48.其中,数据仓库技术可以是指etl(extract

transform

load)技术,用于对彩虹表的数据进行内容抽取、过滤去重、结构化转换、加载到彩虹表的主题库处理。
49.示例的,图3是本技术实施例一提供的彩虹表配置过程的示意图。如图3所示,通过获取移动应用的文本主题内容数据、图片主题内容数据以及语音主题内容数据,并对该数据进行哈希函数处理以及还原函数处理,得到关键词链表的最后一个密码,即特征向量,将关键词和特征向量进行保存,保存时对关键词和特征向量进行etl技术处理,得到处理后的关键词和特征向量,并生成彩虹表。
50.通过对彩虹表的内容进行内容抽取、过滤去重、结构化转换处理,可以提高彩虹表数据的统一性,能够提高关键词匹配效率。
51.在本技术方案中,可选的,所述彩虹表包括中文关键词转换表、英文关键词转换表、语音信息关键词转换表和图片转换表。
52.其中,中文关键词转换表包括汉语信息转换表、粤语信息转换表以及闽南语信息转换表。
53.在本方案中,彩虹表支持中文关键词转换表、英文关键词转换表、语音信息关键词转换表和图片转换表,可以实现各种类型关键词的处理。
54.通过彩虹表特征向量匹配完成关键词匹配。能够支持移动应用主题内容匹配能力,并且不需要解密移动应用通信信息内容,保护了用户隐私,对移动应用匹配具备快速落地部署的优势。
55.在本技术方案中,可选的,在利用预先配置的彩虹表,对所述目标数据进行匹配,获得目标关键词之后,所述方法还包括:
56.对所述目标关键词进行评估,确定所述目标关键词的危害级别、通信频率以及通信级别。
57.其中,危害级别可以是指应用通讯过程中关键词的危害程度。可以预先设置危害级别,通过查表的方式确定关键词的危害程度。通讯频率可以是指应用通讯过程中关键词的出现的次数。通讯级别可以是指应用通讯过程中关键词的等级。
58.在本实施例中,获得目标关键词后,进一步对目标关键词进行继续执行综合判断程序,包括通信信息含有主题内容的危害级别、通信的频度、通信的强度,配合威胁情报信息综合判断输出评估结果。
59.示例性的,图4是本技术实施例一提供的关键词综合判断的流程图。如图4所示,对移动应用的加密数据进行匹配彩虹表特征,若匹配成功,则对目标关键词进行综合判断,确定通信信息含有主题内容的危害级别、通信的频度、通信的强度,配合威胁情报信息综合判断输出评估结果。
60.通过对目标关键词进行综合评估,可以提高移动应用通讯的安全性。
61.本技术实施例所提供的技术方案,获取移动应用的目标数据;其中,目标数据用于表征加密后的移动应用数据;目标数据包括文本数据、图片数据、语音数据以及视频数据中的至少一种;移动应用用于表征采用端对端通讯方式的应用;然后利用预先配置的彩虹表,对目标数据进行匹配,获得目标关键词;其中,彩虹表中包括关键词链表的初始关键词和结束关键词,用于破解加密关键词。通过执行本技术方案,在移动应用加密流量数据中,通过彩虹表特征向量匹配完成关键词容匹配。能够支持移动应用关键词匹配,并且不需要解密
移动应用通信信息内容,保护了用户隐私。且对移动应用匹配具备快速部署的优势。
62.实施例二
63.图5是本技术实施例二提供的基于彩虹表的匹配过程的示意图,本实施例二在实施例一的基础上进行进一步地优化。具体优化为:利用预先配置的彩虹表,对所述目标数据进行匹配,获得目标关键词,包括:按照预设算法对所述目标数据进行处理,获得待匹配关键词;将所述待匹配关键词与预先配置的彩虹表中的特征向量进行匹配,确定目标关键词;其中,所述特征向量用于表征对关键词进行运算得到的数据。其中,未在本实施例中详尽描述的内容详见实施例一。如图5所示,该方法包括以下步骤:
64.s510、获取移动应用的目标数据;其中,所述目标数据用于表征加密后的移动应用数据;所述目标数据包括文本数据、图片数据、语音数据以及视频数据中的至少一种;所述移动应用用于表征采用端对端通讯方式的应用;
65.s520、按照预设算法对所述目标数据进行处理,获得待匹配关键词;
66.在本实施例中,预设算法可以是哈希函数或者还原函数,按照预先设定的规则对目标数据进行哈希函数处理或者还原函数处理,得到待匹配关键词。例如,目标数据是920ecf10,对目标数据进行处理,获得待匹配关键词是kiebgt。
67.s530、将所述待匹配关键词与预先配置的彩虹表中的特征向量进行匹配,确定目标关键词;其中,所述特征向量用于表征对关键词进行运算得到的数据。
68.在本方案中,可以通过查表的方式从彩虹表的特征向量中查找是否存在待匹配关键词。
69.在本技术方案中,可选的,将所述待匹配关键词与预先配置的彩虹表中的特征向量进行匹配,确定目标关键词,包括:
70.在预先配置的彩虹表中的特征向量目录中查找所述待匹配关键词,若查找成功,则确定与所述待匹配关键词相对应的关键词链表,并基于所述关键词链表确定目标关键词。
71.在本实施例中,假设彩虹表中存在关键词链表1和关键词链表2。其中,关键词链表1可以是aaaaaa

281daf40

sgfnyd

920ecf10

kiebgt。关键词链表2是123456

d2a82c9a

446231

a293bc11。假设待匹配关键词是920ecf10,首先对其进行一次还原函数运算,得到kiebgt,然后发现刚好命中了哈希链集中的(aaaaaa,kiebgt)链条。可以确定其极大概率在关键词链表1的链条中。于是从aaaaaa开始重复哈希链的计算过程,发现sgfnyd的哈希结果刚好是920ecf10,于是破解成功。
72.示例性的,图6是本技术实施例二提供的目标数据的匹配过程的示意图。如图6所示,包括彩虹表训练阶段和移动应用主题匹配阶段。彩虹表训练阶段包括:将获取的关键词生成训练,得到关键词和特征向量,并对关键词和特征向量进行处理建立彩虹表。移动应用主题匹配阶段包括:将获取的移动应用的加密目标数据与彩虹表中的特征向量进行匹配,判断是否匹配成功。
73.通过彩虹表特征值匹配完成关键词匹配。能够支持移动应用主题内容匹配能力,并且不需要解密移动应用通信信息内容,保护了用户隐私,对移动应用匹配具备快速落地部署的优势。
74.本技术实施例所提供的技术方案,获取移动应用的目标数据;其中,目标数据用于
表征加密后的移动应用数据;目标数据包括文本数据、图片数据、语音数据以及视频数据中的至少一种;移动应用用于表征采用端对端通讯方式的应用;按照预设算法对目标数据进行处理,获得待匹配关键词;并将待匹配关键词与预先配置的彩虹表中的特征向量进行匹配,确定目标关键词。通过执行本技术方案,能够支持移动应用关键词匹配,并且不需要解密移动应用通信信息内容,保护了用户隐私,对移动应用匹配具备快速落地部署的优势。
75.实施例三
76.图7是本技术实施例三提供的基于彩虹表的匹配装置的结构示意图,如图7所示,基于彩虹表的匹配装置包括:
77.目标数据获取模块710,用于获取移动应用的目标数据;其中,所述目标数据用于表征加密后的移动应用数据;所述目标数据包括文本数据、图片数据、语音数据以及视频数据中的至少一种;所述移动应用用于表征采用端对端通讯方式的应用;
78.目标关键词获得模块720,用于利用预先配置的彩虹表,对所述目标数据进行匹配,获得目标关键词;其中,所述彩虹表中包括关键词链表的初始关键词和结束关键词,用于破解加密关键词。
79.在本技术方案中,可选的,目标关键词获得模块720,包括:
80.待匹配关键词获得单元,用于按照预设算法对所述目标数据进行处理,获得待匹配关键词;
81.目标关键词确定单元,用于将所述待匹配关键词与预先配置的彩虹表中的特征向量进行匹配,确定目标关键词;其中,所述特征向量用于表征对关键词进行运算得到的数据。
82.在本技术方案中,可选的,目标关键词确定单元,具体用于:
83.在预先配置的彩虹表中的特征向量目录中查找所述待匹配关键词,若查找成功,则确定与所述待匹配关键词相对应的关键词链表,并基于所述关键词链表确定目标关键词。
84.在本技术方案中,可选的,目标关键词获得模块720,还包括:
85.关键词获取单元,用于获取移动应用的关键词;
86.特征向量得到单元,用于按照预设规则对所述关键词进行至少一次运算,得到特征向量;其中,所述预设规则包括哈希函数和还原函数中的至少一个;
87.彩虹表形成单元,用于将所述关键词和特征向量的匹配关系进行保存,形成彩虹表。
88.在本技术方案中,可选的,彩虹表形成单元,具体用于:
89.利用数据仓库技术对所述关键词和特征向量进行处理,得到处理后彩虹表。
90.在本技术方案中,可选的,所述彩虹表包括中文关键词转换表、英文关键词转换表、语音信息关键词转换表和图片转换表。
91.在本技术方案中,可选的,所述装置还包括:
92.目标关键词评估模块,用于对所述目标关键词进行评估,确定所述目标关键词的危害级别、通信频率以及通信级别。
93.上述产品可执行本技术实施例所提供的方法,具备执行方法相应的功能模块和有益效果。
94.实施例四
95.本技术实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种基于彩虹表的匹配方法,该方法包括:
96.获取移动应用的目标数据;其中,所述目标数据用于表征加密后的移动应用数据;所述目标数据包括文本数据、图片数据、语音数据以及视频数据中的至少一种;所述移动应用用于表征采用端对端通讯方式的应用;
97.利用预先配置的彩虹表,对所述目标数据进行匹配,获得目标关键词;其中,所述彩虹表中包括关键词链表的初始关键词和结束关键词,用于破解加密关键词。
98.存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括:安装介质,例如cd

rom、软盘或磁带装置;计算机系统存储器或随机存取存储器,诸如dram、ddr ram、sram、edo ram,兰巴斯(rambus)ram等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的计算机系统中,或者可以位于不同的第二计算机系统中,第二计算机系统通过网络(诸如因特网)连接到计算机系统。第二计算机系统可以提供程序指令给计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。
99.当然,本技术实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的基于彩虹表的匹配操作,还可以执行本技术任意实施例所提供的基于彩虹表的匹配方法中的相关操作。
100.实施例五
101.本技术实施例提供了一种电子设备,该电子设备中可集成本技术实施例提供的基于彩虹表的匹配装置。图8是本技术实施例五提供的一种电子设备的结构示意图。如图8所示,本实施例提供了一种电子设备800,其包括:一个或多个处理器820;存储装置810,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器820执行,使得所述一个或多个处理器820实现本技术实施例所提供的基于彩虹表的匹配方法,该方法包括:
102.获取移动应用的目标数据;其中,所述目标数据用于表征加密后的移动应用数据;所述目标数据包括文本数据、图片数据、语音数据以及视频数据中的至少一种;所述移动应用用于表征采用端对端通讯方式的应用;
103.利用预先配置的彩虹表,对所述目标数据进行匹配,获得目标关键词;其中,所述彩虹表中包括关键词链表的初始关键词和结束关键词,用于破解加密关键词。
104.当然,本领域技术人员可以理解,处理器820还实现本技术任意实施例所提供的基于彩虹表的匹配方法的技术方案。
105.图8显示的电子设备800仅仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
106.如图8所示,该电子设备800包括处理器820、存储装置810、输入装置830和输出装置840;电子设备中处理器820的数量可以是一个或多个,图8中以一个处理器820为例;电子设备中的处理器820、存储装置810、输入装置830和输出装置840可以通过总线或其他方式连接,图8中以通过总线850连接为例。
107.存储装置810作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块单元,如本技术实施例中的基于彩虹表的匹配方法对应的程序指令。
108.存储装置810可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储装置810可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储装置810可进一步包括相对于处理器820远程设置的存储器,这些远程存储器可以通过网络连接。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
109.输入装置830可用于接收输入的数字、字符信息或语音信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置840可包括显示屏、扬声器等电子设备。
110.本技术实施例提供的电子设备,可以达到支持移动应用关键词匹配,并且不需要解密移动应用通信信息内容,保护了用户隐私。且对移动应用匹配具备快速部署的目的。
111.上述实施例中提供的基于彩虹表的匹配装置、存储介质及电子设备可执行本技术任意实施例所提供的基于彩虹表的匹配方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本技术任意实施例所提供的基于彩虹表的匹配方法。
112.注意,上述仅为本技术的较佳实施例及所运用技术原理。本领域技术人员会理解,本技术不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本技术的保护范围。因此,虽然通过以上实施例对本技术进行了较为详细的说明,但是本技术不仅仅限于以上实施例,在不脱离本技术构思的情况下,还可以包括更多其他等效实施例,而本技术的范围由所附的权利要求范围决定。
转载请注明原文地址:https://win.8miu.com/read-50051.html

最新回复(0)