工业知识数据的定价方法与流程

专利检索2022-05-10  6



1.本发明涉及数据定价技术领域,具体而言,涉及一种工业知识数据的定价方法。


背景技术:

2.合理的数据定价是促进数据交易、确保数据自由有序流通和充分共享,还原数据商品价值的根本保证。数据定价机制是个全世界都亟待解决的关键问题,在全世界各国的实践中,均未形成成熟、广泛认可的数据定价机制。数据的价格主要受数据规模、类别、质量、实时性等因素影响,目前数据交易平台通常采用定价模式,有固定定价、实时定价、协议定价和拍卖定价四种,都很难准确地量化数据资产的真正价值,无法使得数据提供者和数据购买者都对交易数据集的价值做出一个合理且双方均认可的评估结果。而工业互联网作为新的基础设施,目标在于构建高效供给的生产环境,其核心在于促进数据的充分共享,因此需要专门针对工业数据设计定价方案。
3.工业数据又可分为时间序列数据、结构化数据、非结构化数据。其中,知识数据是非结构化工业数据中较为特殊的一种。已有的数据定价方法主要基于数据质量、信息熵、查询市场、博弈论、机器学习等理论,其中,后四种方法目前的应用场景还很狭窄,且研究本身偏理论,实际应用较少。而基于数据质量的方法主要针对传统关系型数据结构,缺乏针对工业知识数据质量的特殊设计。工业知识数据的信息化、数字化及智能化管理程度,对其价值影响巨大。此外由于工业知识数据涉及众多业务领域专业知识,传统的基于交易双方主观判断的定价方式有较大局限性,更难使得双方达成一致。


技术实现要素:

4.本发明的目的包括提供了一种工业知识数据的定价方法,其能够将评估方式完全量化,所有计算参数均为根据对数据进行分析可以唯一确定,避免了人工参与的主观影响,确保了评估结果的一致性和相对客观性。本发明的实施例可以这样实现:
5.第一方面,本发明提供一种工业知识数据的定价方法,工业知识数据的定价方法包括:
6.获取工业知识数据的数据总量评定值s、数字化水平评定值d、数据通用性评定值g、数据关联集成水平评定值i以及当前交易均价r;
7.根据数据总量评定值s、数字化水平评定值d、数据通用性评定值g、数据关联集成水平评定值i以及当前交易均价r,确定工业知识数据的数据参考价格p。
8.在可选的实施方式中,工业知识数据的数据参考价格p的计算公式为:p=s*d*g*i*r。
9.在可选的实施方式中,数据总量评定值s的确定步骤包括:
10.获取工业知识数据的原始数据;
11.对原始数据进行解压缩或格式转换,获得数据的实际大小值;
12.根据数据的实际大小值,确定数据总量评定值s。
13.在可选的实施方式中,数字化水平评定值d的确定步骤包括:
14.获取工业知识数据的重要程度和数字化水平值;
15.根据重要程度和数字化水平值,确定单一工业知识数据的质量;
16.根据单一工业知识数据的质量,确定总体数字化水平;
17.根据总体数字化水平,确定数字化水平评定值d。
18.在可选的实施方式中,数字化水平评定值d的计算公式为:
[0019][0020]
其中,n为交易数据中的工业知识数据项总数,e
i
为工业知识i重要程度,d
i
为工业知识i的数字化水平值。
[0021]
在可选的实施方式中,工业知识i重要程度e
i
的确定步骤包括:
[0022]
确认工业知识数据对应的bom结构的bom核心链;
[0023]
沿bom核心链进行逐层关联,每多一层关联关系,则描述对应层级节点的知识数据的bom层级l递增1;
[0024]
若知识数据所描述的节点可通过多条路径关联至bom核心链,则取较短的路径计算bom层级l;
[0025]
根据bom层级l,计算出工业知识i重要程度e
i

[0026]
在可选的实施方式中,工业知识i重要程度e
i
的计算公式为:
[0027][0028]
在可选的实施方式中,数据通用性评定值g的确定步骤包括:
[0029]
获取工业知识数据的设备特征参数的欧拉距离;
[0030]
根据欧拉距离,确定单个工业知识数据的通用性;
[0031]
根据单个工业知识数据的通用性,确定总体的通用性;
[0032]
根据总体的通用性,确定数据通用性评定值g。
[0033]
在可选的实施方式中,若交易数据无任何明确的组织结构,无法通过任意主键实现对所有序列的关联查询,则数据通用性评定值g为0.5;
[0034]
若存在一个唯一主键能够实现对所有序列的关联查询,则数据通用性评定值g为1;
[0035]
若数据有完善的组织结构定义,能够通过多个关键字、从不同维度对所有序列进行分类查询、筛选和关联,则数据通用性评定值g为2。
[0036]
在可选的实施方式中,数据关联集成水平评定值i的确定步骤包括:
[0037]
获取工业时序数据的索引情况、组织结构情况和分类查询、筛选、关联情况;
[0038]
根据索引情况、组织结构情况和分类查询、筛选、关联情况,确定数据关联集成水平评定值i。
[0039]
本发明实施例提供的工业知识数据的定价方法的有益效果包括:
[0040]
1、评估方式完全量化,所有计算参数均为根据对数据进行分析可以唯一确定,避免了人工参与的主观影响,确保了评估结果的一致性和相对客观性;
[0041]
2、引入了通用性评价和数据关联集成评价指标,确保只有推广性、参考性强,且组织合理、方便查询的数据能够获得更高的价值评估;
[0042]
3、引入市场均价系数,使得所有评估结果能够根据当前市场实际状态进行实时调整,从而在更长的时间范围和更复杂的经济环境下,确保价值评估的客观性和有效性。
附图说明
[0043]
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0044]
图1为本发明实施例提供的工业知识数据的定价方法的流程图;
[0045]
图2为数据总量评定值s的确定流程图;
[0046]
图3为工业知识i重要程度e
i
的确定流程图;
[0047]
图4为数字化水平评定值d的确定流程图;
[0048]
图5为数据通用性评定值g的确定流程图;
[0049]
图6为数据关联集成水平评定值i的确定流程图。
具体实施方式
[0050]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
[0051]
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0052]
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
[0053]
需要说明的是,在不冲突的情况下,本发明的实施例中的特征可以相互结合。
[0054]
工业数据又可分为时间序列数据、结构化数据、非结构化数据。其中,知识数据是非结构化工业数据中较为特殊的一种,包含了大量传统人工经验,许多数据需要基于对工单、维修单等纸质文件的信息提取与转化,可覆盖超过几十年时间跨度的生产经验。这些数据可有效解决工业制造中依赖于经验的局面,如果数据组织方式合理,能够对工艺、质量、产能的提升产生巨大的作用。但此类数据高效管理难度较大,领域专业性也较强,因此价值评估难度较大,与传统信息管理系统的数据类型区别较大,需要设计不同的知识数据定价机制。
[0055]
请参考图1,本实施例提供了一种工业知识数据的定价方法,充分考虑数据交易供需双方对数据各项质量要素的不同需求和可见度,为数据价值提出一个更加客观、合理的参考值。
[0056]
工业知识数据的定价方法提供一个针对工业知识数据的定价计算公式,并对其各参数的计算方式进行明确设计,确保该方法的可操作性、合理性及有效性。
[0057]
为了对工业知识数据进行合理定价,需要综合考虑其数据总量、数字化水平、数据通用性、关联集成水平等因素,其总体计算公式为:
[0058]
p=s*d*g*i*r
[0059]
其中,p为数据参考价格,s为数据总量评定值,d为数字化水平评定值,g为数据通用性评定值,i为数据关联集成水平评定值,r为当前交易均价。
[0060]
因此,请参阅图1,本实施例提供的工业知识数据的定价方法包括以下步骤:
[0061]
s1:获取工业知识数据的数据总量评定值s、数字化水平评定值d、数据通用性评定值g、数据关联集成水平评定值i以及当前交易均价r。
[0062]
s2:根据数据总量评定值s、数字化水平评定值d、数据通用性评定值g、数据关联集成水平评定值i以及当前交易均价r,确定工业知识数据的数据参考价格p。
[0063]
其中,数据参考价格p的计算公式为:p=s*d*g*i*r。
[0064]
计算公式中各参数的评定测算在数据交易过程的中立第三方平台中独立完成,各参数测试的具体方式见下文。
[0065]
数据总量评定值s为交易数据以office open xml标准的压缩文件格式存储的大小。以此方式计量,可避免由于采用不同的压缩机制导致的存储大小差异。如果数据量较大不便于进行全量数据的格式转换,可对数据集进行抽样后转换,通过计算出其标准格式下的存储大小以及原始压缩大小所对应的压缩比,从而实现对全量数据转换后大小较为准确的估算。
[0066]
具体的,请参阅图2,数据总量评定值s的具体确定步骤包括:
[0067]
s11:获取工业知识数据的原始数据。
[0068]
s12:对原始数据进行解压缩或格式转换,获得数据的实际大小值。
[0069]
s13:根据数据的实际大小值,确定数据总量评定值s。
[0070]
这样,通过衡量原始数据的实际大小值,能够避免因为不同压缩技术导致的价格差异。
[0071]
数字化水平评定值d为对交易数据的数字化管理水平和质量的评估值。工业知识数据很大一部分由工单、维修单、运维记录、操作记录等传统表单的信息提取转化而来,这些信息通常由自然语言承载,伴随一些图形化的信息,例如手绘图等。本参数的评测采用加权平均的方式对交易数据整体的数字化水平和质量进行衡量,其计算公式如下:
[0072][0073]
其中,n为交易数据中的工业知识数据项总数,e
i
为工业知识i重要程度,d
i
为工业知识i的数字化水平值。
[0074]
工业知识i重要程度e
i
是对该知识数据在整个工业生产中的重要性程度评估。该评估采用bom层级数的方式展开。一个编制合理的bom层级结构,需要以设计、生产、制造、产品等主线活动的为核心进行逐层分解。对于数据集成水平较高的企业,所有数据均可关联至一个主线bom之上,因此可通过一套公式进行计算。对于数据集成水平低的企业,可能会有多个分裂的bom结构,则分别进行计算。基于bom层级的重要性程度计算,主要依赖于其在
bom结构中的层级l确认。
[0075]
具体的,请参阅图3,工业知识i重要程度e
i
的具体确定步骤包括:
[0076]
s21:确认工业知识数据对应的bom结构的bom核心链。
[0077]
核心链由所有父对象不是bom本身的节点组成,代表了这个业务的顶层主线活动。直接描述核心链节点的知识数据,其bom层级l=1。
[0078]
s22:沿bom核心链进行逐层关联,每多一层关联关系,则描述对应层级节点的知识数据的bom层级l递增1;
[0079]
s23:若知识数据所描述的节点可通过多条路径关联至bom核心链,则取较短的路径计算bom层级l;
[0080]
s24:根据bom层级l,计算出工业知识i重要程度e
i

[0081]
其中,工业知识i重要程度e
i
的计算公式为:
[0082][0083]
对于完全没有开展数据集成的企业,无法形成bom结构,则所有数据设为同等权重,即e
i
=1。
[0084]
工业知识i的数字化水平值d
i
为衡量各知识数据管理水平的指标。对于每一条知识数据,本实施例设计了一下的评分方式,见下表:
[0085]
状态得分图片化(图像格式或其它扫描格式)0.2图片化 标签索引0.4文本化(自然语言)0.5文本化 标签索引0.6结构化(自然语言)0.7结构化(词/句向量或其它自然语言处理格式)1
[0086]
具体的,请参阅图4,数字化水平评定值d的具体确定步骤包括:
[0087]
s31:获取工业知识数据的重要程度和数字化水平值。
[0088]
s32:根据重要程度和数字化水平值,确定单一工业知识数据的质量。
[0089]
s33:根据单一工业知识数据的质量,确定总体数字化水平。
[0090]
s34:根据总体数字化水平,确定数字化水平评定值d。
[0091]
数据通用性评定值g用于衡量交易数据的通用性,采取对每一条时间序列分别打分后求平均值的方法进行量化。对于每一条时间序列,其通用性评分取值范围为(0,2],数值越小代表通用性越差。具体计算方式可直接采用设备特征参数的欧拉距离,对其进行标准化后取得。
[0092]
具体的,请参阅图5,数据通用性评定值g的具体确定步骤包括:
[0093]
s41:获取工业知识数据的设备特征参数的欧拉距离。
[0094]
s42:根据欧拉距离,确定单个工业知识数据的通用性。
[0095]
s43:根据单个工业知识数据的通用性,确定总体的通用性。
[0096]
s44:根据总体的通用性,确定数据通用性评定值g。
[0097]
数据关联集成水平评定值i是对交易数据的数据组织结构、索引、完整性等方面的
评估。如果交易数据无任何明确的组织结构,无法通过任意主键实现对所有序列的关联查询,则该项得分为0.5;如果存在一个唯一主键能够实现对所有序列的关联查询,例如通过唯一统一的设备标识号能够实现对所有序列的关联查询,则该项得分为1;如果数据有完善的组织结构定义,能够通过多个关键字、从不同维度对所有序列进行分类查询、筛选和关联,则该项得分为2。
[0098]
这样,对工业知识数据的通用性进行相对客观的评估,并对不同的知识数据管理状况提供相对应的评分准则,确保对常见知识数据管理方式的覆盖,同时确保更关键的核心知识数据的质量获得更高的价值认定。
[0099]
具体的,请参阅图6,数据关联集成水平评定值i的具体确定步骤包括:
[0100]
s51:获取工业时序数据的索引情况、组织结构情况和分类查询、筛选、关联情况。
[0101]
s52:根据索引情况、组织结构情况和分类查询、筛选、关联情况,确定数据关联集成水平评定值i。
[0102]
当前交易均价r是根据数据交易平台中的市场状况实时提供的一个动态参数,反应了当前数据交易市场的宏观供需状况。
[0103]
这样,最终价格计算基于当前市场单位均价,能够确保计算结果符合当前市场总体供需情况。
[0104]
实例:假设待评估交易数据为一条铁轨轧制生产线的相关工业知识数据。
[0105]
根据总体计算公式p=s*d*g*i*r,分别计算各个参数。
[0106]
根据数据总量评定值s:直接对待评估数据进行解压缩及格式转换,形成office open xml标准的压缩文件格式,可采用office2007以后的版本转化为docx格式,每个文档内包含以自然语言文本信息、格式化文本信息、或词/句向量信息以文本形式存储。整个交易数据的总大小为5.1gb。
[0107]
数字化水平评定值d依据其计算公式,首先,各数据条目的工业知识重要程度e
i
,构建bom结构,计算各知识数据所描述的节点的bom层级。在本实例中,bom核心链为:原料

加热炉

开坯

第一粗轧机

第二粗轧机

精轧机

冷床

矫直机

分钢台架

锯钻

检测中心

成品,则知识数据“原料人工检查标准”直接描述核心链节点“原料”,层级为1,其重要程度为:e=1/log2(1 1)=1;而知识数据“精轧机轧辊故障预测规则”描述核心链节点“精轧机”的子节点轧辊的二级子节点“运维”,层级为3,其重要程度为:e=1/log2(3 1)=0.5。
[0108]
接下来评估各数据条目的数字化水平值d
i
。本实例中,知识数据“原料人工检查标准”为一个自然语言描述的表格,根据评分标准,其得分为0.7;知识数据“精轧机轧辊故障预测规则”为一篇自然语言编写的报告文档,其得分为0.5。
[0109]
数据通用性评定值g:本实例中,加热炉、原料、成品的通用性较高,锯钻次之,轧机的专业化程度相对更高。经计算其核心参数,bom核心链上的欧拉距离计算值范围为[0,8.94],标准化后的通用性评定值范围为[0.76,2],则数据通用性评定值g为1.27。
[0110]
数据关联集成水平评定值i:交易数据有完善的组织结构定义,数据结构与设备bom结构对应,能够通过包括时间戳、设备代码、责任人、所属部门等多个关键字、从不同维度对所有序列进行分类查询、筛选和关联,故该项得分为2。
[0111]
当前交易均价r:假设目前平台数据交易均价为5万元/gb。
[0112]
则上述实例中,数据总价计算为:
[0113]
p=s*d*g*i*r=5.1*0.687*1.27*2*5=44.497(万元)
[0114]
本实施例提供的工业知识数据的定价方法包括以下有益效果:
[0115]
1、评估方式完全量化,所有计算参数均为根据对数据进行分析可以唯一确定,避免了人工参与的主观影响,确保了评估结果的一致性和相对客观性;
[0116]
2、评估方式充分考虑工业时序数据的特征和应用场景,设计了一套基于时间序列数据变化趋势的价值评估算法,确保最重要的关键设备信息的数据质量得到更高的评分权重;
[0117]
3、引入了通用性评价和数据关联集成评价指标,确保只有推广性、参考性强,且组织合理、方便查询的数据能够获得更高的价值评估;
[0118]
4、引入市场均价系数,使得所有评估结果能够根据当前市场实际状态进行实时调整,从而在更长的时间范围和更复杂的经济环境下,确保价值评估的客观性和有效性。
[0119]
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
转载请注明原文地址:https://win.8miu.com/read-50446.html

最新回复(0)