本发明涉及用户画像,尤其涉及一种基于多源数据融合的个性化用户画像优化方法。
背景技术:
1、用户画像是一种对目标用户进行描述的模型,它是通过对用户行为数据、社会属性、消费习惯等方面的数据分析、数据挖掘和数理统计而得到的。用户画像广泛应用在推荐、数据分析、运营、营销等领域,能够更加全面、细致的了解目标用户的需求、喜好和行为特点,以便为其提供更加有针对性的产品和服务。通过将用户画像应用于刻画用户用能特征,可以了解用户的能源消耗习惯和需求,为用户提供更加节能的产品和解决方案,有助于降低能源消耗,减少碳排放,促进绿色发展。
2、专利文献cn112365164b所公开的描述中大型能源用户用能特征的方法是利用改进的密度峰值快速搜索聚类算法,对三类负荷数据进行聚类分析,获取用户的电、热、冷负荷日典型用能模式。此发明有助于电力公司把握能源用户的综合用能特性,挖掘用能规律,开展需求响应、节能减排等业务。专利文献cn116304295a所公开的一种基于多元数据驱动的用户用能画像分析方法,利用时间序列符号聚合近似sax算法对负荷曲线进行降维并提取特征,采用模拟退火粒子群算法将其问题转化为多目标优化问题,进而采用聚类分析进行用户用能行为描述。此发明根据用户侧的用能现状,采用数据驱动的算法模型挖掘用能数据中的有效信息,构建用户能源消费行为画像集,将其运用于用户多元用能行为分析中,从而把握用户用能特性。综上所述,现有的用户画像分析方法在能源领域中的应用尚不充分,并且并未考虑从用户用能的时空特性、用能种类、用能强度以及影响用户用能的因素等多维度进行分析,构建用户的用能画像体系。专利文献cn114841832b提出了一种基于用电负荷二次聚类的电力用户画像标签建立方法,首先利用聚类算法分析识别有相似用电模式的客户,实现用户用电模式的分组。此文献重点聚焦于有序用电管控需求,为有序用电组件紧急避峰组群,提供科学准确的客群标签数据支撑。专利文献cn114358474a公开了一种典型多能用户模型建立方法,综合考虑用户主观特性及市场客观环境因素,建立了合理有效的用户评估模型;通过标签建立用户画像,实现用能特征到用户标签的映射;使用模糊c均值聚类算法提取典型多能用户历史的用能参数从多个角度对多元用户进行各类用户用能特征与核心诉求的精细化建模。
3、但现有技术的聚类效果有限,构建的用户画像体系的精准性也有限。
技术实现思路
1、有鉴于此,本发明提供一种基于多源数据融合的个性化用户画像优化方法,结合气候特性、用户建筑形式、人员结构、用能习惯、能源市场特征等,分析用户用能特性并找出主要影响用能的因素,提高了构建用户用能画像体系的精准性。
2、本发明的技术目的是这样实现的:
3、本发明提供一种基于多源数据融合的个性化用户画像优化方法,包括以下步骤:
4、s1从多源设备中采集原始用能数据,对原始用能数据进行预处理,得到标准用能数据;
5、s2将多源设备的标准用能数据进行数据融合,得到用能数据集;
6、s3构建标签模型,确定用户画像的用户标签种类;
7、s4对用能数据集进行聚类分析,识别用户簇群;
8、s5根据用户簇群和用户标签种类构建用户用能画像体系。
9、在上述技术方案的基础上,优选的,步骤s1包括:
10、s11从多源设备中采集原始用能数据,多源设备包括多个传感器、电表、能源管理系统、建筑能源消耗监测系统和物联网设备,原始用能数据包括用电量、用热量、用气量、温度、湿度、压力和能源消耗数据;
11、s12将采集到的原始用能数据通过有线或无线通信方式传输至数据处理系统,并存储于数据库中;
12、s13对原始用能数据进行数据清洗、转换和归一化,得到标准用能数据,其中,数据清洗包括缺失值处理、重复值处理、异常值处理和一致性检查。
13、在上述技术方案的基础上,优选的,步骤s2包括:
14、s21标准用能数据具有零均值和单位方差,根据零均值和单位方差计算各个标准用能数据之间的协方差矩阵;
15、s22对协方差矩阵进行特征值分解,得到特征值和对应的特征向量;
16、s23根据特征值从大到小的顺序将对应的特征向量进行排序,得到第一序列,将第一序列中前m个特征向量依次赋予标签,形成标签矩阵;
17、s24将标准用能数据通过标签矩阵进行线性变换,得到各个标准用能数据在标签空间中的新表示;
18、s25将各个标准用能数据的新表示作为融合后的结果,即用能数据集。
19、在上述技术方案的基础上,优选的,步骤s4包括:
20、s41根据手肘法确定聚类算法的聚类数k;
21、s42利用蛇优化算法寻找聚类算法的初始聚类中心,并根据最近邻原则,将用能数据划分到就近的k个簇中,形成初始聚类簇;
22、s43根据k-means聚类算法迭代聚类初始聚类簇和初始聚类中心,直至达到迭代停止条件,则停止迭代,输出聚类结果,聚类结果中每个簇为一个用户簇群。
23、在上述技术方案的基础上,优选的,步骤s41包括:
24、s411选择数值依次增大的聚类数k的集合{k};
25、s412从最小的k值开始选择,利用k-means聚类算法对用能数据集进行聚类,计算每个k值下的评价指标sse:
26、
27、式中,sse表示误差平方和,k为聚类数,ci为聚类中的一个簇,ui为ci中各用能数据的均值,x为簇中的一个用能数据;
28、s413绘制k值与对应的sse之间的关系图,横坐标为k值,纵坐标为对应的sse值;
29、s414在关系图中寻找拐点,该拐点后方的sse开始急剧下降,则将该拐点对应的k值作为聚类算法的聚类数k。
30、在上述技术方案的基础上,优选的,步骤s42包括:
31、s421设定蛇优化算法的种群数为n,设置蛇群中雄性与雌性比例为1:1,最大迭代次数为t;
32、s422初始化蛇优化算法参数、、、、;
33、s423将用能数据集中的用能数据随机划分为k簇并计算簇中均值,循环一次形成一个个体,第个个体结构为,进而按照1:1比例将所有种群划分雄性种群与雌性种群;
34、s424根据适应度函数计算个体的适应度值;
35、s425根据适应度值确定最优雄性个体和最佳雌性个体及食物位置;
36、s426计算q、temp;
37、s427根据q和temp的值确定雄性种群与雌性种群所处的开发阶段的模式,并更新雄性种群和雌性种群的个体;
38、s428对用能数据集重新进行归类到就近簇内,并重新计算簇内新均值,再次更新个体,并计算适应度值,根据适应度值的最小值更新最优个体;
39、s429重复步骤s426-s428,直至达到最大迭代次数t,则迭代结束,将最后一次迭代得到的最优个体作为k-means聚类算法的初始聚类中心,并根据最近邻原则,将用能数据划分到就近的k个簇中,形成初始聚类簇。
40、在上述技术方案的基础上,优选的,适应度函数为:
41、
42、式中,f为适应度值,cij为第i个个体结构中的第j簇,dist为距离,s为簇内数据点,yij表示簇内均值。
43、在上述技术方案的基础上,优选的,适应度函数设有约束条件,约束条件如下:
44、
45、式中,、、与分别为每个簇内与其他簇内数据点以及均值,的取值范围为[0,1]。
46、在上述技术方案的基础上,优选的,步骤s427中,开发阶段包括靠近食物模式、战斗模式、交配模式,其中:
47、当>0.25且>0.6,蛇处于靠近食物模式,蛇移动到食物上,其公式为:
48、
49、式中,是所有个体的位置,是最优个体的位置,是值为2的常数;
50、当≤0.6时,蛇将处于战斗模式或者交配模式;
51、战斗模式:
52、
53、
54、式中,为第i个雄性个体的位置,表示雌性种群中最优个体的位置,rand是[0,1]范围内的随机数,fm表示雄性个体的战斗能力,为第i个雌性个体的位置,表示雄性种群中最优个体的位置,ff表示雌性个体的战斗能力;
55、fm和ff分别表示为:
56、
57、
58、式中,为雌性种群中最优个体的适应度值,为雄性种群中最优个体的适应度值,是当前个体的适应度值;
59、交配模式:
60、
61、
62、式中,是第i个雄性个体的位置,是第i个雌性个体的位置,rand是[0,1]范围内的随机数,和分别是雄性个体和雌性个体的交配能力,表示如下:
63、
64、
65、式中,是第i个雄性个体的适应度值,是第i个雌性个体的适应度值;
66、若有蛋孵化,则将最差解进行初始化。
67、在上述技术方案的基础上,优选的,步骤s5包括:
68、s51设定四个维度,分别为用能种类、用能强度、影响因素和时空特性;
69、s52从标签模型中确定各个维度的用户标签种类,其中,将用能强度、影响因素和时空特性的用户标签种类划分为高、中、低三类;
70、s53根据各个维度下利用聚类算法得到的用户簇别、用户标签种类,构建用户用能画像体系。
71、本发明的方法相对于现有技术具有以下有益效果:
72、1、本发明利用蛇优化算法改进k-means聚类算法,选取最优簇群中心点,能够改善聚类效果;
73、2、本发明结合气候特性、用户建筑形式、人员结构、用能习惯、能源市场特征等,分析用户用能特性并找出主要影响用能的因素,提高了构建用户用能画像体系的精准性;
74、3、本发明从用能种类、用能强度、影响因素、时空特性等多维度构建用户画像体系,能够全面的反映用户的用能习惯与特性。
1.一种基于多源数据融合的个性化用户画像构建方法,其特征在于,包括以下步骤:
2.如权利要求1所述的一种基于多源数据融合的个性化用户画像构建方法,其特征在于,步骤s1包括:
3.如权利要求1所述的一种基于多源数据融合的个性化用户画像构建方法,其特征在于,步骤s2包括:
4.如权利要求1所述的一种基于多源数据融合的个性化用户画像构建方法,其特征在于,步骤s4包括:
5.如权利要求4所述的一种基于多源数据融合的个性化用户画像构建方法,其特征在于,步骤s41包括:
6.如权利要求4所述的一种基于多源数据融合的个性化用户画像构建方法,其特征在于,步骤s42包括:
7.如权利要求6所述的一种基于多源数据融合的个性化用户画像构建方法,其特征在于,适应度函数为:
8.如权利要求7所述的一种基于多源数据融合的个性化用户画像构建方法,其特征在于,适应度函数设有约束条件,约束条件如下:
9.如权利要求7所述的一种基于多源数据融合的个性化用户画像构建方法,其特征在于,步骤s427中,开发阶段包括靠近食物模式、战斗模式、交配模式,其中:
10.如权利要求1所述的一种基于多源数据融合的个性化用户画像构建方法,其特征在于,步骤s5包括:
