一种基于大数据的采购数据检索方法、系统及存储介质与流程

专利检索2025-05-06  11


本发明属于大数据,具体涉及一种基于大数据的采购数据检索方法、系统及存储介质。


背景技术:

1、随着我国电子化采购应用的大力推广,电子化采购应用已成为企业采购管理的重要手段。随着采购数据的不断沉淀,从大量的采购数据查找所需要的内容是必不可少,电子化采购大数据信息集成与检索可以有效提高采购工作效率。

2、现有很多采购数据检索时,大多数情况下只针对采购项目的部分数据进行检索。使用者很难找到自己想要检索的数据或者需要花费很长时间通过多种方式组合才能找到自己要找的数据。比如中国专利cn107808279b,公开了一种采购信息管理系统,将采购信息保存至数据库内,依次对采购信息进行处理,处理完成后进行分类,最后对采购信息进行核对,并判断其的真实性,再次将处理后的采购信息储存至储存库内,且未处理的采购数据与处理后的采购数据放置在同一文件夹中进行储存。该方法对采购信息分类,分类后存储再同一文件夹中,检索时需要遍历整个文件夹中的文件。再比如中国专利cn111539692a,公开了一种资产采购管理系统,采购负责人可在采购项目管理模块15的新建采购项目模块151中新建采购项目,先创建项目,可对分标进行‘从申请单导入设备、从其他分标导入设备、录入中标信息、录入合同信息、添加付款历史’等操作,我的采购项目模块152用于采购负责人对项目进行查看详情、编辑、删除等操作。该方法需要采购负责人将采购信息录入采购管理系统,自动化程度低,人工操作容易出现错误。

3、因此,提供一种基于大数据的采购数据检索方法、系统及存储介质,以提高数据录入准确率、提高检索效率、保障采购项目数据的安全性,是亟待解决的问题。


技术实现思路

1、针对上述提出的技术问题,本发明提供一种基于大数据的采购数据检索方法、系统及存储介质。

2、第一方面,本发明提供了一种基于大数据的采购数据检索方法,该方法包括如下步骤:

3、步骤1、获取采购完成的项目数据,并将项目数据抽取到大数据平台;

4、步骤2、按照项目数据类别将项目数据存储在不同的数据库中;

5、步骤3、对任一项目数据进行语义分析,提取任一项目数据标题的关键词,将关键词与任一项目数据相对应地存储在任一项目数据对应的数据库中;

6、步骤4、获取用户输入的检索信息,对检索信息提取关键词并进行词义分析,根据分析结果判断检索信息对应的项目数据类别,确定要进行检索的数据库,将要进行检索的数据库定义为检索数据库;

7、步骤5、根据用户权限判断用户的检索范围,基于检索范围和关键词,从检索数据库中检索关键词相似度大于第一预设值的项目数据,其中,用户权限包括用户能够查看的项目数据的机密等级和每个机密等级对应的操作权限;

8、步骤6、将检索结果按照时间进行排序,将排序后的检索结果发送给用户,其中,检索结果包括项目数据的超链接。

9、具体地,项目数据包括图片数据,步骤3中,对任一项目数据进行语义分析,提取任一项目数据标题的关键词包括如下步骤:

10、步骤31、获取图片数据中第i个像素点的像素值(ri,gi,bi),计算第i个像素点的加权值,计算公式为:pii=(α1×ri+α2×gi+α3×bi)/3,其中,pii为第i个像素点的加权值,α1、α2和α3为参数权重系数;

11、步骤32、将第i个像素点的像素值设置为(pii,pii,pii),遍历完图片数据中的每个像素点后,生成第一图片数据;

12、步骤33、识别出第一图片数据中的n个字符区域,提取第n个字符区域每个字符图像的外接矩形,任意获取第n个字符区域中的2个字符图像,将2个字符图像定义为第1个字符图像和第2个字符图像,计算2个字符图像中每个字符图像的像素平均值,若2个字符图像的像素平均值相等,将第1个字符图像的像素平均值定位为基准像素值,其中,n为1~n的正整数;若2个字符图像的像素平均值不相等,则任意获取第n个字符区域中的第3个字符图像,计算第3个字符图像的像素平均值,将第3个字符图像的像素平均值定位为基准像素值;

13、像素平均值的计算公式为:

14、

15、其中,pak为第k个字符图像的像素平均值,pim为第k个字符图像第m个像素点的像素值,m为第k个字符图像的像素点的总数,字符图像为表示文字笔画部分的图像;

16、步骤34、基于基准像素值遍历第n个字符区域的所有字符图像,当任一字符图像中任一像素点的像素值小于基准像素值时,将任一像素点的像素值设置为0;

17、步骤35、遍历完第一图片数据中的所有字符区域后,分别提取每个字符区域的文字信息,对图片数据中的文字信息进行语义分析并提取文字信息的关键词。

18、具体地,步骤35中,分别提取每个字符区域的文字信息包括如下步骤:

19、步骤3511、将第j个字符区域中位于中间部分的任一字符图像定义为基准字符图像,获取基准字符图像的外接矩形信息,计算基准字符图像外接矩形上边线距离位于基准字符图像上方的字符图像外接矩形下边线的第一距离d1,基准字符图像外接矩形左边线距离位于基准字符图像左侧的字符图像外接矩形右边线的第二距离d2,其中,j为1~n的正整数;

20、步骤3512、当d1>d2时,将行作为文字识别单元,获取第j个字符区域第一行每个外接矩形中的字符图像,分别按照从左到右和从右到左的方向输出第一行每个外接矩形中字符图像的识别结果,获取从左到右输出的第一语句和从右到左输出的第二语句,并将第一语句和第二语句输入预先训练的自然语言模型,分别输出第一语句和第二语句的语句通顺率,将语句通顺率高的方向作为第一语句组成方向,按照第一语句组成方向输出第j个字符区域每个外接矩形中字符图像的第一识别结果,基于第一识别结果生成文字信息;

21、步骤3513、当d1<d2时,将列作为文字识别单元,获取第j个字符区域左侧从左到右的第一列与第二列和右侧从右到左的第一列与第二列的每个外接矩形中的字符图像,分别按照从上到下的方向输出左侧第一列与第二列、右侧第一列与第二列每个外接矩形中字符图像的识别结果,将左侧第一列与第二列的识别结果组成第三语句,将右侧第一列与第二列的识别结果组成第四语句,并将第三语句和第四语句输入预先训练的自然语言模型,分别输出第三语句和第四语句的语句通顺率,将语句通顺率高的方向作为第二语句组成方向,按照第二语句组成方向输出第j个字符区域字符图像的第二识别结果,基于第二识别结果生成文字信息。

22、具体地,步骤35中,对图片数据中的文字信息进行语义分析并提取文字信息的关键词包括:

23、步骤3521、当所有字符区域的文字识别单元和语句组成方向都一致时,若所有字符区域的文字识别单元为行,提取每行字符图像的第一外接矩形,若任意两个相邻的第一外接矩形间的距离与其他任意两个相邻的第一外接矩形间的距离相等,则将所有字符区域的文字信息作为整体进行语义分析并提取关键词;

24、步骤3522、若所有字符区域的文字识别单元为列,提取每列字符图像的第二外接矩形,若任意两个相邻的第二外接矩形间的距离与其他任意两个相邻的第二外接矩形间的距离相等,则将所有字符区域的文字信息作为整体进行语义分析并提取关键词;

25、步骤3523、否则,分别对第一图片数据中每个字符区域的文字信息进行语义分析并提取关键词。

26、具体地,步骤5之前包括如下步骤:

27、步骤51、获取用户的用户权限设置请求后,对用户进行身份认证;

28、步骤52、身份认证通过后,基于用户身份信息设置第一用户权限,随后基于第一用户权限生成权限认证信息并发送给用户终端;

29、步骤53、接收到用户的反馈信息后,若反馈信息为接受,则将第一用户权限定义为用户权限,将用户权限与用户的用户标识相对应地存储在权限管理数据库;

30、步骤54、若反馈信息为拒绝,则将用户标识和用户身份信息发送给管理员,并接收管理员设置的第二用户权限,将第二用户权限定义为用户权限,将用户权限与用户的用户标识相对应地存储在权限管理数据库。

31、具体地,步骤2包括:

32、按照任一项目数据类别对应的预设存储格式,将任一项目数据转化为任一项目数据对应的预设存储格式,随后将任一项目数据存储在任一项目数据对应的数据库中,同时设置任一项目数据的机密等级。

33、具体地,在步骤1中,将项目数据抽取到大数据平台后,判断任一项目数据的标题是否与此次抽取项目的项目名称相关,若不相关,则删除任一项目数据。

34、具体地,项目数据类别包括采购项目立项数据、采购公告、采购文件、投标人数据、投标文件、评标专家数据、评标数据、定标数据、采购过程审批资料。

35、第二方面,本发明还提供了一种基于大数据的采购数据检索系统,该系统包括:数据抽取模块、数据存储模块、数据分析模块、数据检索模块和数据展示模块;

36、数据抽取模块,用于获取采购完成的项目数据,并将项目数据抽取到大数据平台;

37、数据存储模块,用于按照项目数据类别将项目数据存储在不同的数据库中;

38、数据分析模块,用于对任一项目数据进行语义分析,提取任一项目数据标题的关键词,将关键词与任一项目数据相对应地存储在任一项目数据对应的数据库中;

39、数据检索模块,用于获取用户输入的检索信息,对检索信息提取关键词并进行词义分析,根据分析结果判断检索信息对应的项目数据类别,确定要进行检索的数据库,将要进行检索的数据库定义为检索数据库,根据用户权限判断用户的检索范围,基于检索范围和关键词,从检索数据库中检索关键词相似度大于第一预设值的项目数据,其中,用户权限包括用户能够查看的项目数据的机密等级和每个机密等级对应的操作权限;

40、数据展示模块,用于将检索结果按照时间进行排序,将排序后的检索结果发送给用户,其中,检索结果包括项目数据的超链接。

41、第三方面,本发明提供了一种计算机存储介质,计算机存储介质存储有程序指令,其中,在程序指令运行时控制计算机存储介质所在设备执行上述任意一项的基于大数据的采购数据检索方法。

42、与现有技术相比,有益效果至少如下所述:

43、1、将项目数据抽取到大数据平台后,自动进行分类存储,提高了数据录入的准确率。

44、2、不同项目数据类别的项目数据存储在不同的数据库中,可以根据用户输入的检索信息快速检索到目标数据,提升了用户检索效率。

45、3、为每个用户设置不同的用户权限,用户进行检索时,只能在用户权限范围内进行项目数据检索,对采购数据的安全性进行了精细化管控。


技术特征:

1.一种基于大数据的采购数据检索方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于大数据的采购数据检索方法,其特征在于,所述项目数据包括图片数据,所述步骤3中,对任一项目数据进行语义分析,提取所述任一项目数据标题的关键词包括如下步骤:

3.根据权利要求2所述的一种基于大数据的采购数据检索方法,其特征在于,所述步骤35中,分别提取每个字符区域的文字信息包括如下步骤:

4.根据权利要求3所述的一种基于大数据的采购数据检索方法,其特征在于,所述步骤35中,所述对所述图片数据中的所述文字信息进行语义分析并提取所述文字信息的关键词包括:

5.根据权利要求1所述的一种基于大数据的采购数据检索方法,其特征在于,所述步骤5之前包括如下步骤:

6.根据权利要求1所述的一种基于大数据的采购数据检索方法,其特征在于,所述步骤2包括:

7.根据权利要求1所述的一种基于大数据的采购数据检索方法,其特征在于,在所述步骤1中,将所述项目数据抽取到所述大数据平台后,判断所述任一项目数据的标题是否与此次抽取项目的项目名称相关,若不相关,则删除所述任一项目数据。

8.根据权利要求1所述的一种基于大数据的采购数据检索方法,其特征在于,所述项目数据类别包括采购项目立项数据、采购公告、采购文件、投标人数据、投标文件、评标专家数据、评标数据、定标数据、采购过程审批资料。

9.一种基于大数据的采购数据检索系统,用于实现如权利要求1至8任一项所述的基于大数据的采购数据检索方法,其特征在于,包括:数据抽取模块、数据存储模块、数据分析模块、数据检索模块和数据展示模块;

10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有程序指令,其中,在所述程序指令运行时控制所述计算机存储介质所在设备执行权利要求1至8中任意一项所述的基于大数据的采购数据检索方法。


技术总结
本发明属于大数据技术领域,公开了一种基于大数据的采购数据检索方法、系统及存储介质:将项目数据抽取到大数据平台;按照项目数据类别将项目数据存储在不同的数据库中;对任一项目数据进行语义分析,提取关键词,将关键词与任一项目数据相对应地存储在数据库中;获取用户输入的检索信息,提取检索信息的关键词并进行词义分析,根据分析结果判断检索信息对应的项目数据类别,确定要进行检索的数据库;根据用户权限判断用户的检索范围,基于检索范围和关键词从检索数据库中检索关键词相似度大于第一预设值的项目数据;将将排序后的检索结果发送给用户。本发明在数据权限管控范围内可快速实现对采购项目数据的搜索,提高了采购数据检索的工作效率。

技术研发人员:赵晓华,李志慧,刘青刚,王继领,张军伟
受保护的技术使用者:郑州信源信息技术股份有限公司
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1153522.html

最新回复(0)