本申请涉及poi数据生产与更新,特别是一种基于路网信息的poi判重方法、装置、存储介质、设备及程序产品。
背景技术:
1、在地图应用或服务中,如导航或地图搜索等,poi数据(如商店、餐厅、加油站等)是非常重要的组成部分,但由于数据来源不同、数据采集时间不同等诸多原因会导致同一地点存在多个重复的poi记录,给用户带来了诸多的不便和困惑。
2、目前,现有技术中解决poi数据重复问题的通常做法是:将poi的名称、地址、类别等属性信息数据输入到神经网络中,神经网络可以从这些属性信息中提取poi数据的隐含特征,然后将提取的隐含特征通过学习和表征,实现不同poi之间相似度的计算和判重。
3、然而,现有的判重做法主要依赖于poi的文本信息,如名称、地址等属性,由于文本信息的限制,仅凭文本信息进行判重可能会存在虽然相似度较高,但实际上并不是同一地点的情况,如不同的商场或酒店可能具有相似的名称,但是它们却位于不同的位置。所以现有技术的判重做法的准确性较低。
技术实现思路
1、本申请主要解决的技术问题是提供一种基于路网信息的poi判重方法、装置、存储介质、设备及程序产品,使用路网信息,通过考虑poi之间的空间关系和交通可达性,建立更准确的特征表示和模型,可以更准确地判断poi之间的相似度,提高poi判重的准确性和泛化能力。
2、为了实现上述目的,本申请采用的第一个技术方案是:提供一种基于路网信息的poi判重方法,包括检索粗召回步骤,根据待更新poi的文本信息,从poi基准库中粗召回相关的一个或多个粗召回poi的信息;差分精排序步骤,根据待更新poi的文本信息和一个或多个粗召回poi的信息,在神经网络中进行表征学习,筛选得到与待更新poi重复的置信度大于置信度阈值的一个或多个差分精排序poi;路网标注步骤,根据待更新poi的经纬度坐标和一个或多个差分精排序poi的经纬度坐标,将待更新poi和一个或多个差分精排序poi标注在动态路网图的相应位置上;以及路网判定步骤,根据动态路网图中的道路信息,若待更新poi与一个或多个差分精排序poi当中的至少一者落入道路围成的同一道路网格中且间距小于间距阈值,则判定待更新poi为重复poi,否则,判定待更新poi为新增poi。
3、优选的,围成道路网格的道路不包含连通主路与小区大门的七级路。
4、优选的,路网判定步骤包括:利用st_buffer函数,生成待更新poi的缓冲区对象和一个或多个差分精排序poi的缓冲区对象;利用一个或多个道路网格对待更新poi的缓冲区对象和一个或多个差分精排序poi的缓冲区对象进行切分;若经切分的待更新poi的缓冲区对象与经切分的一个或多个差分精排序poi当中的至少一者的缓冲区对象落入同一道路网格中,且该经切分的待更新poi的缓冲区对象和该经切分的一个或多个差分精排序poi当中的至少一者的缓冲区对象均包含相应的poi,则判定待更新poi与一个或多个差分精排序poi当中的至少一者落入所述同一道路网格。
5、优选的,路网判定步骤还包括:若待更新poi的缓冲区对象和一个或多个差分精排序poi其对应的缓冲区对象当中的两者位于任一七级路的两侧,且到主路的距离大于该七级路到主路的距离,则该七级路不作为围成道路网格的道路。
6、优选的,待更新poi的文本信息和一个或多个粗召回poi的信息包括poi名称、poi地址、poi类别当中的至少一者。
7、优选的,利用st_buffer函数,生成待更新poi的缓冲区对象和一个或多个差分精排序poi的缓冲区对象的过程,包括:根据待更新poi和一个或多个差分精排序poi与道路之间的相对位置关系,拟合待更新poi的缓冲区对象的缓冲半径和一个或多个差分精排序poi的缓冲区对象的缓冲半径与路网图的表征特征之间的关系,路网图的表征特征包括道路、区域、交叉口当中的至少一者。
8、优选的,根据待更新poi和一个或多个差分精排序poi与道路之间的相对位置关系,拟合待更新poi的缓冲区对象的缓冲半径和一个或多个差分精排序poi的缓冲区对象的缓冲半径与路网图的表征特征之间的关系的过程,包括:利用计算机视觉算法,提取路网图的表征特征以及待更新poi和一个或多个差分精排序poi与道路之间的相对位置关系。
9、本申请采用的第二个技术方案是:提供一种基于路网信息的poi判重装置,包括:检索粗召回模块,根据待更新poi的文本信息,从poi基准库中粗召回相关的一个或多个粗召回poi的信息;差分精排序模块,根据待更新poi的文本信息和一个或多个粗召回poi的信息,在神经网络中进行表征学习,筛选得到与待更新poi重复的置信度大于置信度阈值的一个或多个差分精排序poi;路网标注模块,根据待更新poi的经纬度坐标和一个或多个差分精排序poi的经纬度坐标,将待更新poi和一个或多个差分精排序poi标注在动态路网图的相应位置上;以及路网判定模块,根据动态路网图中的道路信息,若待更新poi与一个或多个差分精排序poi当中的至少一者落入道路围成的同一道路网格中且间距小于间距阈值,则判定待更新poi为重复poi,否则,判定待更新poi为新增poi。
10、本申请采用的第三个技术方案是:提供一种计算机可读存储介质,其存储有计算机指令,其中计算机指令被操作以执行方案一中的基于路网信息的poi判重方法。
11、本申请采用的第四个技术方案是:提供一种计算机设备,其包括处理器和存储器,存储器存储有计算机指令,其中处理器操作计算机指令以执行方案一中的基于路网信息的poi判重方法。
12、本申请采用的第五个技术方案是:提供一种计算机程序产品,其存储有计算机程序,其中计算机程序被处理器执行以实现方案一中的基于路网信息的poi判重方法。
13、本申请的有益效果是:本申请使用路网信息,通过考虑poi之间的空间关系和交通可达性,建立更准确的特征表示和模型,可以更准确地判断两个poi之间的相似度,提高poi判重的准确性和泛化能力,应用于poi数据更新环节,能够极大提高poi数据质量和降低数据的冗余。
1.一种基于路网信息的poi判重方法,其特征在于,包括:
2.根据权利要求1所述基于路网信息的poi判重方法,其特征在于,所述路网判定步骤包括:
3.根据权利要求2所述基于路网信息的poi判重方法,其特征在于,所述路网判定步骤还包括:
4.根据权利要求1所述的基于路网信息的poi判重方法,其特征在于,所述待更新poi的文本信息和所述一个或多个粗召回poi的信息包括poi名称、poi地址、poi类别当中的至少一者。
5.根据权利要求2所述的基于路网信息的poi判重方法,其特征在于,所述利用st_buffer函数,生成所述待更新poi的缓冲区对象和所述一个或多个差分精排序poi的缓冲区对象的过程,包括:
6.根据权利要求5所述的基于路网信息的poi判重方法,其特征在于,根据所述待更新poi和所述一个或多个差分精排序poi与道路之间的相对位置关系,拟合所述待更新poi的缓冲区对象的缓冲半径和所述一个或多个差分精排序poi的缓冲区对象的缓冲半径与所述路网图的表征特征之间的关系的过程,包括:
7.一种基于路网信息的poi判重装置,其特征在于,包括:
8.一种计算机可读存储介质,其存储有计算机指令,其中所述计算机指令被操作以执行权利要求1-6中任一项所述的基于路网信息的poi判重方法。
9.一种计算机设备,其包括处理器和存储器,所述存储器存储有计算机指令,其中所述处理器操作所述计算机指令以执行权利要求1-6任一项所述的基于路网信息的poi判重方法。
10.一种计算机程序产品,其存储有计算机程序,其中所述计算机程序被处理器执行以实现权利要求1-6中任一项所述的基于路网信息的poi判重方法。
