本发明涉及云数据处理,特别涉及基于人工智能的云数据可视化分析系统和方法。
背景技术:
1、随着云计算技术的发展,越来越多的数据被存储在云端。然而,如何有效地管理和访问这些云数据,并从中获取有价值的信息,成为了一个重要的问题。现关于云数据可视化分析,公开号为:cn116821200a的中国专利公开了一种人工智能云数据可视化分析系统及其分析方法,包括人工比对模块、数据处理模块、数据标注模块、数据模型生成模块、可视化生成模块、云数据存储模块、数据分析模块与数据爬虫模块,通过人工智能比对模块对现有的数据模型与截取的数据进行比对,挑选出最相近的数据模型,再将数据与与其相近的数据模型传输至数据模型生成模块内进行新的数据模型的生成,由于其是在相近的数据模型上修改而来,所以大大减小了从截取数据到产出数据模型的时间,进而使得进行数据可视化分析的速度更快,节省了大量的计算力。
2、上述专利虽然可以实现云数据的存储和访问,但在数据管理和分析方面仍存在效率低下、准确性不高的问题,且用户界面不友好,无法实现用户交互功能,影响用户的使用体验和满意度。
技术实现思路
1、本发明的目的在于提供基于人工智能的云数据可视化分析系统和方法,通过自动化地爬取、处理、比对和分析云数据,实现了对数据的全面洞察和高效利用,同时通过直观的可视化展示,使得分析结果更加易于理解和传播,实现了数据的高效管理和访问,以解决上述背景技术中提出的问题。
2、为实现上述目的,本发明提供如下技术方案:
3、基于人工智能的云数据可视化分析系统,包括:
4、数据爬取单元,用于确定需要爬取的云数据的目标范围,基于爬取的云数据的目标范围确定数据爬取规则,使用网络爬虫技术从云数据库中基于爬取规则抓取目标数据;
5、数据处理单元,用于将抓取的目标数据进行数据预处理,从预处理后的目标数据中提取关键特征,基于提取到的关键特征对目标数据进行分类,根据分类结果将目标数据存储至本地缓存数据库;
6、数据比对单元,用于在本地缓存数据库中提取现有数据作为基准数据,基于比对模型将目标数据与基准数据进行比对,基于比对结果确定数据的差异与变化,生成比对报告;
7、智能分析单元,用于将比对报告导入至统计分析模型,对比对数据进行深入分析,确定分析结果;
8、可视化单元,用于根据分析结果的类型和特点匹配对应的可视化类型,将分析结果转化为直观图形,将生成的图表展示给用户,便于用户直观地理解和分析数据。
9、进一步的,数据爬取单元,包括:
10、目标数据识别模块,用于对数据源进行分析,基于分析结果确定需要爬取的目标范围;
11、数据抓取模块,用于基于数据的结构、格式和存储方式匹配对应的爬取规则,基于爬取规则在目标范围内抓取目标数据;
12、数据监控模块,用于获取数据爬取过程中的日志信息,同时,实时监控数据爬取的状态和性能。
13、进一步的,数据抓取模块基于爬取规则抓取数据,具体为:
14、在云数据库中提取本地缓存数据节点的标准网络流,根据所述标准网络流确定本地缓存数据节点的初始数据缓存特征;
15、获取本地缓存数据库的爬取规则,根据所述爬取规则和本地缓存数据节点的初始数据缓存特征生成云数据库与本地缓存数据库之间的数据传输网络协议;
16、在所述本地缓存数据库中调取数据样本,基于所述数据样本运行所述数据传输网络协议,获取运行结果;
17、根据所述运行结果获取本地缓存数据库与本地缓存数据节点的之间的交互记录,根据所述交互记录获取数据传输网络协议的数据传输特征;
18、基于数据传输特征建立云数据库与本地缓存数据库的数据共享机制,基于所述数据共享机制抓取目标数据。
19、进一步的,基于数据传输特征建立云数据库与本地缓存数据库的数据共享机制,基于所述数据共享机制抓取目标数据,包括:
20、调取云数据库与本地缓存数据库之间的数据传输需求,其中,所述数据传输需求包括单次数据传输的最大传输数据量和单位时间内的数据最大传输频率;
21、调取所述云数据库和本地缓存数据库单位时间内产生的数据量,并利用所述云数据库和本地缓存数据库单位时间内产生的数据量获取数据量参变系数,其中,所述数据量参变系数通过如下公式获取:
22、;
23、其中,c表示数据量参变系数;n表示云数据库和本地缓存数据库运行已经历的单位时间的总个数;c01i和c02i分别表示云数据库和本地缓存数据库在第i个单位时间所产生的需要共享的数据量;cz01i和cz02i分别表示云数据库和本地缓存数据库在第i个单位时间所产生的总数据量;c01和c02分别表示第一数据量波动系数和第二数据量波动系数;
24、根据所述云数据库与本地缓存数据库之间的数据传输需求结合数据量参变系数,获取所述云数据库与本地缓存数据库之间的数据共享机制抓取目标数据对应的数据量约束条件;
25、在云数据库中设置数据导出接口,其中,所述云数据库的数据导出接口用于将数据按照预定的格式和协议导出;
26、在本地缓存数据库中设置数据导入接口,其中,所述本地缓存数据库的数据导出接口用于接收云数据库导出的数据,并更新本地缓存;
27、根据所述数据量约束条件设置每次数据共享所需抓取的目标数据的数据量,并按照所述目标数据的数据量进行数据抓取。
28、进一步的,根据所述云数据库与本地缓存数据库之间的数据传输需求结合数据量参变系数,获取所述云数据库与本地缓存数据库之间的数据共享机制抓取目标数据对应的数据量约束条件,包括:
29、调取所述数据传输需求中所包含的单次数据传输的最大传输数据量,并根据所述单次数据传输的最大传输数据量获取第一约束条件参量;其中,所述第一约束条件参量通过如下公式获取:
30、;
31、其中,λ01表示第一约束条件参量;δ01表示第一调节系数;cmax表示单次数据传输的最大传输数据量;
32、调取所述数据传输需求中所包含的单位时间内的数据最大传输频率根据所述单位时间内的数据最大传输频率获取第二约束条件参量;其中,所述第二约束条件参量通过如下公式获取:
33、;
34、其中,λ02表示第二约束条件参量;δ02表示第二调节系数;nc表示单位时间内的数据最大传输频率对应的数据传输次数;n01i和n02i分别表示云数据库和本地缓存数据库在第i个单位时间所产生的需要共享的数据的数据产生次数;
35、根据所述第一约束条件参量和第二约束条件参量结合数据量参变系数获取所述云数据库与本地缓存数据库之间的数据共享机制抓取目标数据对应的数据量约束条件。
36、进一步的,根据所述第一约束条件参量和第二约束条件参量结合数据量参变系数获取所述云数据库与本地缓存数据库之间的数据共享机制抓取目标数据对应的数据量约束条件,包括:
37、调取第一约束条件参量和第二约束条件参量;
38、调取数据量参变系数;
39、利用所述第一约束条件参量结合数据量参变系数获取所述数据量约束条件对应的数据量下限值;其中,所述数据量下限值通过如下公式获取:
40、;
41、其中,cdown表示数据量下限值;cmin01和cmin02表示云数据库和本地缓存数据库在单位时间所产生的需要共享的最小数据量;
42、利用所述第二约束条件参量结合数据量参变系数获取所述数据量约束条件对应的数据量上限值;其中,所述数据量上限值通过如下公式获取:
43、;
44、其中,cup表示数据量上限值。
45、进一步的,数据处理单元,包括:
46、数据读取模块,用于读取从云数据库抓取的目标数据,并验证目标数据的完整性和准确性,确保数据没有损坏或丢失;
47、数据预处理模块,用于对目标数据进行清洗、转换和缺失值处理;
48、特征提取模块,用于根据目标数据的特性和分析需求提取关键特征,并将提取出的关键特征进行转换;
49、数据分类模块,用于根据目标数据的关键特征和分类需求,对预处理后的目标数据通过训练好的分类模型进行分类。
50、进一步的,数据比对单元,包括:
51、数据提取模块,用于从本地缓存数据库中选择需要作为比对基准的数据集,将选定的基准数据提取至数据比对模块;
52、数据比对模块,用于将获取到的目标数据与提取的基准数据输入至比对模型进行比对,确定目标数据与基准数据的差异和变化,确定比对结果;
53、比对报告生成模块,用于根据比对结果填充报告内容,将生成的比对报告输出至智能分析单元。
54、进一步的,智能分析单元,包括:
55、统计分析模块,用于:
56、基于目标数据的分布特征和数据特性,将目标数据分为不同的簇,分别计算任一簇中每一词向量与任一簇对应的标准词向量之间的距离;
57、筛选出距离最小的词向量对应的关键词,作为任一簇中的目标关键词,基于目标关键词确定目标数据中的结构;
58、趋势预测模块,用于:
59、提取目标数据的时间序列数据,基于时间序列数据进行数据平稳性检验,判断时间序列数据是否随时间变化呈现周期性变化;
60、基于目标数据的数据特性匹配预测模型,基于预测模型对目标数据对应的未来的时间序列数据进行预测;
61、异常监测模块,用于:
62、基于数据类型和异常类型在异常检测数据库中匹配异常检测算法,检测与大多数数据点显著不同的异常值,提取出检测异常数据点;
63、对检测到的异常值进行处理,并将检测异常数据点进行整合生成异常数据集,评估异常检测结果的准确性。
64、进一步的,可视化单元,包括:
65、可视化确定模块,用于根据分析结果的类型确定可视化类别,将分析数据映射到可视化类别对应的图形中,确定图形中的视觉元素,基于不同的视觉元素匹配对应的颜色编码方案;
66、图形生成模块,用于使用图形库根据颜色编码方案生成分析数据的可视化图形;
67、图表展示模块,用于确定可视化图形在显示界面的位置和大小,以及可视化图形内各元素的分布,并将生成的可视化图形在用户界面中进行渲染;
68、用户交互模块,用于接收用户的交互输入指令,根据用户的交互输入指令提供反馈。
69、本发明提供另一种技术方案,基于人工智能的云数据可视化分析方法,包括以下步骤:
70、步骤一:确定分析目标和需求:明确需要分析的数据类型和目的,确定需要支持分析目标的数据类型及数据范围;
71、步骤二:数据爬取:基于数据需求确定数据的来源,基于爬虫程序从云数据库中爬取目标数据,并将其存储到本地缓存数据库中;
72、步骤三:数据处理:对爬取的数据进行清洗、预处理和特征提取的操作,从数据中提取出对分析有价值的特征;
73、步骤四:数据比对:利用数据比对模型将现有数据与新获取的目标数据进行比对,找出数据间的差异和相似度;
74、步骤五:智能分析:对比对后的数据进行深入分析,提取有价值的信息;
75、步骤六:可视化展示:将分析结果以直观图形的形式展示出来,便于用户理解和分析,同时提供交互功能。
76、与现有技术相比,本发明的有益效果是:
77、通过结合云计算、人工智能和数据可视化技术,为用户提供了高效、准确的数据分析和管理解决方案,通过自动化地爬取、处理、比对和分析云数据,自动识别和提取数据中的有用信息和模式,实现了对数据的全面洞察和高效利用,同时通过直观的可视化展示,使得分析结果更加易于理解和传播,实现了数据的高效管理和访问。
1.基于人工智能的云数据可视化分析系统,其特征在于:包括:
2.如权利要求1所述的基于人工智能的云数据可视化分析系统,其特征在于:数据爬取单元,包括:
3.如权利要求2所述的基于人工智能的云数据可视化分析系统,其特征在于:数据抓取模块基于爬取规则抓取数据,具体为:
4.如权利要求3所述的基于人工智能的云数据可视化分析系统,其特征在于:基于数据传输特征建立云数据库与本地缓存数据库的数据共享机制,基于所述数据共享机制抓取目标数据,包括:
5.如权利要求4所述的基于人工智能的云数据可视化分析系统,其特征在于:根据所述云数据库与本地缓存数据库之间的数据传输需求结合数据量参变系数,获取所述云数据库与本地缓存数据库之间的数据共享机制抓取目标数据对应的数据量约束条件,包括:
6.如权利要求5所述的基于人工智能的云数据可视化分析系统,其特征在于:根据所述第一约束条件参量和第二约束条件参量结合数据量参变系数获取所述云数据库与本地缓存数据库之间的数据共享机制抓取目标数据对应的数据量约束条件,包括:
7.如权利要求3所述的基于人工智能的云数据可视化分析系统,其特征在于:数据处理单元,包括:
8.如权利要求7所述的基于人工智能的云数据可视化分析系统,其特征在于:数据比对单元,包括:
9.如权利要求8所述的基于人工智能的云数据可视化分析系统,其特征在于:智能分析单元,包括:
10.如权利要求9所述的基于人工智能的云数据可视化分析系统,其特征在于:可视化单元,包括:
11.基于人工智能的云数据可视化分析方法,基于如权利要求7所述的基于人工智能的云数据可视化分析系统实现,其特征在于:包括以下步骤:
