基于联邦深度生成式学习的可再生能源时空场景生成方法与流程

专利检索2022-05-10  36



1.本发明涉及一种基于联邦学习和深度生成式模型的可再生能源场景生成方法,属于人工智能在电力系统中运用的技术领域。


背景技术:

2.可再生能源(如风电和光伏)的开发与利用是解决环境污染、确保能源可持续供应的必然选择。然而,由于其固有的不确定性和间歇性,可再生能源的接入已经给当今电力系统的规划和运行带来了巨大的挑战。如何处理可再生能源发电的不确定性对电网运行的影响是目前电力系统经济优化研究中不得不面对的难点。场景分析法是处理不确定性的一种方法,通过生成一组符合可再生能源电力输出统计特征的典型时间序列场景来表征可再生能源发电的技术,从而将可再生能源的不确定性优化问题转化为确定性问题。通过使用所生成的可再生能源出力场景,电力系统运行人员能够在考虑可再生能源发电输出不确定性的情况下做出合理决策。
3.对可再生能源出力场景生成方法已经在不同方面进行了大量研究。不幸的是,先前的大多数工作都集中在基于模型的场景生成方法上,这些方法必须对可再生能源出力进行概率建模。例如蒙特卡洛方法必须假设风电和太阳辐照度满足某个特定的概率分布,然后从假设的分布中随机抽样得到出力场景。基于copula函数的方法要先通过参数估计得出copula函数参数,之后才能从该函数中随机抽样得到符合该函数的可再生能源出力场景。这些方法依赖于对先验的统计假设,建模过程繁琐并且生成场景的质量较低。
4.随着人工智能的发展,许多机器学习和深度学习方法被应用于场景生成领域。如人工神经网络、变分自动编码器和生成对抗网络等,也被用于可再生能源场景的生成。其中,生成对抗网络(generative adversarial networks,gans)作为一种强大的分布式网格模型受到了研究人员的关注,gans可以在无需显式建模的情况下,以无监督的方式学习真实数据的潜在分布,生成高质量的场景数据。其主要思想是通过二人零和博弈同时训练两个深层神经网络:生成器和鉴别器。生成器网络通过学习已知历史数据的分布映射关系,将噪声分布转换为人工数据,并训练鉴别器来区分生成数据和历史数据。
5.但是,上述所有的方法都需要将每个风能/太阳能发电厂的所有数据传输到具有高性能计算集群的数据中心,从而生成可再生能源场景。这类集中式数据处理方法将面临以下问题:1)这些方法依赖于具有强大计算能力和存储空间的中央工作站;2)可再生能源发电厂和中央工作站之间频繁的数据交换将不可避免地造成较大的通信开销;3)以集中形式存储的数据容易受到数据泄漏和网络攻击;4)最重要的是,一些可再生能源数据所有者,如独立系统运营商,由于数据隐私的原因,不愿意在实际应用中与他人共享数据。数据隐私可以指具有商业竞争的并网可再生能源发电厂的商业敏感数据,也可以指具有可再生能源技术的家庭的个人数据。目前,许多国家颁布了专门法律,如欧盟实施的《通用数据保护条例》、中国的《网络安全法》和《数据安全法》,以规范数据的管理和使用。因此,迫切需要一种能够解决上述问题的分布式场景生成方法。


技术实现要素:

6.本发明的目的是克服现有技术的缺陷,为更好的有效解决在生成多个可再生能源电站出力场景所导致的数据安全和通信开销问题提供一种科学合理,能够以一种分布式的隐私保护方式生成更高质量的可再生能源出力场景,为考虑风、光不确定性的电力系统规划和运行问题提供更先进的不确定变量处理方法。
7.本发明的目的是由以下技术方案来实现的:提出了一种基于联邦深度生成式学习的可再生能源场景生成方法。
8.首先为场景生成任务设计一个全局最小二乘生成对抗网络(least squares generativeadversarial networks,lsgans)模型,该模型能够以数据驱动的方法生成可再生能源场景;然后采用联邦学习(federate learning)技术使各可再生能源电站不需要将数据集中训练,而是每个电站将利用自身历史数据对本地的lsgans模型进行分布式的训练,并将所提发明命名为联邦最小二乘生成对抗网络(fed

lsgan)。在训练过程中,每个电站只需要将模型参数传递至中心服务器,减少了数据传输的通信开销,并且保护了数据的安全。其具体步骤包括:
9.1)对可再生能源历史数据进行归一化处理;
10.2)将历史数据重塑为24
×
24的数组;
11.3)在中心服务器中初始化全局lsgans模型;
12.4)将全局lsgans模型部署到各个客户端(可再生能源电站);
13.5)随机选择一定数量的客户端,被选中的客户端利用历史数据对本地模型进行训练;
14.6)当达到设定的通信间隔时,客户端将本地模型的参数上传至中心服务器;
15.7)中心服务器对上传的模型参数进行加权平均,并将其作为新的全局模型参数;
16.8)中心服务器重新将全局模型部署到各个客户端;
17.9)重复5)

8)直至设定的训练次数。
18.所述步骤1)中需要将历史数据进行max

min归一化处理从而消除数据量纲的影响,计算公式为:
[0019][0020]
其中x为历史出力数据,x
max
和x
min
分别为历史数据的最大值和最小值。
[0021]
所述步骤2)中,将历史数据重塑为24 24的矩阵数组。
[0022]
所述步骤3)中,全局模型为最小二乘生成对抗网络(least squares generativeadversarial networks,lsgans)模型。lsgans是gans的一个改进版本,它们都是受博弈论启发的无监督生成模型。gans包括两个可微分的深层神经网络:判别器和生成器。生成器网络通过学习历史数据的潜在分布,将随机噪声映射到生成的样本,判别器则尽可能判断输入数据是真实的历史数据还是生成的数据,并对生成器和判别器进行二人零和博弈训练。理论上当达到纳什均衡时,两个网络达到最优解,此时生成器能够通过随机噪声生成以假乱真的样本。
[0023]
在传统的gans训练过程中,一批随机噪声向量z~p
z
被送入生成器,生成器从噪声空间映射到数据空间g(z;θ
g
),其中g(z;θ
g
)为生成器生成的样本,服从分布p
g
。同时,来自真
实数据x~p
d
或生成的数据g(z;θ
g
)的一批样本被发送到判别器,该判别器通常是二进制类器,其目标是识别数据来自何处。根据不同的数据源,判别器网络的输出可以表示为
[0024][0025]
在明确了生成器和判别器的目标之后,我们需要分别定义一个损失函数来更新它们的深层神经网络。对于给定的判别器,生成器希望增加判别器对生成样本的概率输出p
fake
,因为较大的判别器输出意味着样本更真实。对于给定的生成器,鉴别器在最小化p
fake
的同时寻求p
real
的最大化。换句话说,较小的生成器损失l
g
表明生成数据和真实数据的流形非常接近,而较小的判别器损失l
d
值表明判别器具有很强的能力来区分数据来自哪个分布。因此,这两个神经网络的损失函数可以定义为
[0026][0027][0028]
其中,e表示期望值。
[0029]
接下来需要在生成器和判别器之间建立一个博弈关系,以便两个网络可以同时训练。有必要构建一个可以组合(3)和(4)的函数,该max

min博弈模型的价值函数v
gans
(g,d)可以表示为:
[0030][0031]
然而在传统的gans中,本质上是优化詹森

香浓(jensen

shannon)散度(js散度),并且以交叉熵作为损失函数,这就导致了传统的gans模型存在模式崩溃、梯度消失和训练不稳定等问题。为了解决这个问题,本发明采用了最小二乘生成对抗网络。用最小二乘损失函数代替交叉熵损失函数,表达式为:
[0032][0033]
其中,a和b分别是生成样本和真实样本的标签,c表示生成器期望判别器对生成样本判定的标签。lsgans利用最小二乘损失函数作为判别器和生成器的损失函数,通过对远离决策边界的样本进行惩罚,可以提供更多的梯度,缓解了梯度消失的问题。同时,这种损失函数有利于生成更高质量的样本,因为它惩罚假样本并将它们“拉”到决策边界。
[0034]
所述步骤4)中,中心服务器将全局lsgans模型分发至所有共同参与训练的客户端(可再生能源电站)中,每个客户端都拥有一个属于自己的本地模型。
[0035]
所述步骤5)中,开始训练时,每一次全局迭代中随机选择一定比例的客户端进行本地训练一次。在训练中,从高斯分布中随机采样的噪声被送入生成器,通过一系列神经网络生成场景样本,并且从历史数据中抽样得到真实历史样本;将二者送入判别器,由判别器判断输入的样本来自生成器所生成的样本还是真是样本。之后通过步骤3中所定义的损失函数计算梯度,利用基于梯度的优化算法去更新模型参数。综上所述,对于判别器
[0036][0037]
对于生成器
[0038][0039]
其中α为学习率;adam为优化器;和分类为判别器和生成器函数的梯度。θ
d
和θ
g
分别为生成器和判别器神经网络模型的参数。
[0040]
所述步骤6)中,本地客户端模型利用自身历史数据不断训练。当达到所设定的通信间隔时,所有客户端将本地lsgans模型参数传输至中心服务器,而无需将所有历史数据上传。
[0041]
所述步骤7)中,中心服务器对上传的模型参数进行加权平均
[0042][0043]
其中和分别为全局模型的生成器和判别器模型参数;n
e
为被选中的客户端集合。
[0044]
所述步骤8)中,将中心服务器的全局lsgans模型重新将全局模型部署到各个客户端的本地模型中。
[0045][0046]
所述步骤9)中,重复步骤5~8直至达到设定的训练次数:
[0047]
本发明的一种基于联邦深度生成式学习的可再生能源时空场景生成方法,首先提出了基于最小二乘生成对抗网络的场景生成模型,并引入了联邦学习技术。我们的发明fed

lsgan,联邦学习使我们的发明能够以保护隐私的方式生成场景,并不会因为通过传输模型参数而不是所有数据来牺牲生成场景的质量;而基于lsgans的深度生成模型能够通过捕捉可再生能源的时空特征生成符合历史数据分布的场景。所提的fed

lsgan能够成功地执行可再生能源场景生成,并且该方案优于现有的集中式方法。
附图说明
[0048]
图1是基本的生成对抗结构示意图。
[0049]
图2是本发明的一种基于联邦深度生成式学习的可再生能源时空场景生成方法的流程框架。
[0050]
图3是训练过程中损失函数值得变化示意图。
[0051]
图4是采用本发明所生成的风电出力场景示意图。
[0052]
图5是采用本发明所生成的光伏出力场景示意图。
[0053]
图6是生成的空间相关性场景示意图。
[0054]
图7是联邦学习参数对所提方法的影响示意图。
具体实施方式
[0055]
下面结合附图,对优选实施例作详细说明。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。
[0056]
图1为生成对抗网络的基本结构示意图,由生成器和判别器两个深度神经网络构成。其工作原理主要是:生成器从某个已知的噪声分布中采样得到随机噪声并送入生成器网络中,通过一系列神经网络生成场景样本;同时,从历史数据中随机抽取可再生能源出力样本,将真实样本和生成的样本送入判别器;判别器则负责判断送入的样本来自哪里;之后通过定义的损失函数去更新生成器和判别器网络。通过不断的训练,当达到纳什均衡时,生成器达到最优,此时能够生成高质量的以假乱真的可再生能源出力场景。
[0057]
参见图2,提出一种基于联邦学习和生成对抗网络的可再生能源时空场景生成方法。首先为场景生成任务设计一个全局lsgans模型,该模型能够以数据驱动的方法生成可再生能源场景;然后采用联邦学习技术避免所有可再生能源电站将历史数据传送至中心工作站,每个电站将利用自身历史数据对本地的lsgans模型进行分布式的训练。在训练过程中,每个电站只需要将模型参数传递至中心服务器,减少了数据传输的通信开销,并且保护了数据的安全。其具体步骤包括:
[0058]
1)对风、光出力的历史数据进行归一化;所述步骤1)中需要将历史数据进行max

min归一化处理从而消除数据量纲的影响。
[0059]
2)将历史数据重塑为24
×
24的矩阵;所述步骤2)中,将时间序列的历史数据重塑为n个24
×
24的矩阵数组。
[0060]
3)构建全局lsgans模型;所述步骤3)中,全局模型为lsgans模型。lsgans是gans的一个改进版本,它们都是受博弈论启发的无监督生成模型。gans包括两个可微分的深层神经网络:判别器和生成器。生成器网络通过学习历史数据的潜在分布,将随机噪声映射到生成的样本,判别器则尽可能判断输入数据是真实的历史数据还是生成的数据,并对生成器和判别器进行二人零和博弈训练。理论上当达到纳什均衡时,两个网络达到最优解,此时生成器能够通过随机噪声生成以假乱真的样本。
[0061]
4)将全局模型分发至各客户端;所述步骤4)中,中心服务器将全局lsgans模型分发至所有共同参与训练的客户端(可再生能源电站)中,每个客户端都拥有一个属于自己的本地模型。
[0062]
5)随机选择客户端进行本地训练。所述步骤5)中,开始训练时,每一次全局迭代中随机选择一定比例的客户端进行本地训练一次。在训练中,从高斯分布中随机采样的噪声被送入生成器,通过一系列神经网络生成场景样本,并且从历史数据中抽样得到真实历史样本;将二者送入判别器,由判别器判断输入的样本来自生成器所生成的样本还是真是样本。最后通过损失函数来更新生成器和判别器模型参数。
[0063]
6)将模型参数上传至中心服务器。所述步骤6)中,本地客户端模型利用自身历史数据不断训练。当达到所设定的通信间隔时,所有客户端将本地lsgans模型参数传输至中心服务器,而无需将所有历史数据上传。
[0064]
7)中心服务器进行参数聚合。所述步骤7)中,中心服务器对上传的模型参数进行加权平均处理。
[0065]
8)中心服务器将全局模型重新分发至各客户端。所述步骤8)中,将中心服务器的
全局lsgans模型重新将全局模型部署到各个客户端的本地模型中。
[0066]
9)重复上述步骤。所述步骤9)中,重复步骤5~8直至达到设定的训练次数:
[0067]
图3为整个全局模型训练过程中,各个客户端损失函数的变化。从图中可以看出,损失值在训练开始时迅速下降,然后每100个全局迭代垂直上升。这是因为在客户端与中央服务器通信后,服务器将聚合参数分发给每个客户机,这会导致客户机损失值急剧增加。最终,每个客户端的鉴别器损失值将接近0,这表明生成场景的分布足够接近真实数据分布。
[0068]
图4是采用本发明方法所生成的风电出力场景。可以看出聚类后生成场景的质心和真实样本的质心几乎一致,所生成的出力曲线符合历史情况。由自相关系数可以看出,生成的场景能够捕获风电出力的时间序列特性。从归一化误差图中可知,采用本发明生成场景的误差很小。
[0069]
图5是采用本发明方法所生成的光伏出力场景。与分析风电出力时一致,可知本发明生成了高质量的光伏场景。
[0070]
图6是生成的空间特性场景。通过使用全局模型生成所有可再生能源出力场景,我们计算不同厂址的场景之间的皮尔逊相关系数。该图这说明fed

lsgan不仅可以捕获可再生能源的时间特征,还可以捕获多个站点之间的空间特征。更重要的是,它可以保护每个可再生发电厂的数据隐私,并在培训模型时减少通信开销。
[0071]
图7是为改变联邦学习设置,如同步间隔k和客户端参与率e,验证所提发明方法的鲁棒性。从图中可以看出,对于同步间隔k,在e固定的情况下,所提发明方法在不同同步间隔k下的性能基本不变,这证明了fed

lsgan对不同的同步间隔具有良好的鲁棒性;关于客户端参与率e,不同参与率e对训练模型的场景生成质量没有影响,但会影响给定时间间隔内方案的收敛速度。
[0072]
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
转载请注明原文地址:https://win.8miu.com/read-29268.html

最新回复(0)