本申请涉及电力系统,尤其涉及一种基于图卷积网络的强化学习的机组组合求解方法和装置。
背景技术:
1、机组组合优化问题常用于生产调度、航空航班编排、电力系统优化等。以前,机组组合优化问题通常依赖于传统的数学规划技术,如整数规划、线性规划和动态规划。这些方法在一些情况下能够提供确切的解决方案,但随着问题规模的增加,复杂性迅速增加,导致计算难度增加。另一种传统方法是启发式算法,如遗传算法、模拟退火和粒子群优化。这些方法通常用于解决大规模机组组合优化问题,但它们不能保证找到最优解,而只是在可接受的时间内找到较好的近似解。但是电力系统中机组、任务以及它们之间的复杂关系,当前深度学习与强化学习技术并未提出有效的解决方案。
技术实现思路
1、针对机组组合优化问题,本申请提供了一种基于图卷积网络强化学习的机组组合求解方法和装置。
2、第一方面,本申请提供了一种基于图卷积网络强化学习的机组组合求解方法,所述方法包括:
3、s1、将预设时间段中当前时间子段的电力系统中发电机组的运行信息、状态空间和动作空间输入电力系统图卷积网络,得到当前时间子段所述电力系统中发电机组的状态集;
4、s2、结合预设奖励函数和预设约束条件,根据强化学习算法和所述电力系统中发电机组的状态集,得到当前时间子段的所述电力系统中发电机组的启停矩阵,并更新所述强化学习算法;
5、s3、将下一时间子段作为当前时间子段,重复执行所述步骤s1至s2,直到得到所有时间子段的所述电力系统中发电机组的启停矩阵,从而得到预设时间段的所述电力系统中发电机组的调度计划。
6、第二方面,本申请还提供了一种基于图卷积网络的强化学习的机组组合求解装置,所述装置包括:
7、第一构建模块,用于将预设时间段中当前时间子段的电力系统中发电机组的运行信息、状态空间和动作空间输入电力系统图卷积网络,得到当前时间子段所述电力系统中发电机组的状态集;
8、第二构建模块,用于结合预设奖励函数和预设约束条件,根据强化学习算法和所述电力系统中发电机组的状态集,得到当前时间子段的所述电力系统中发电机组的启停矩阵,并更新所述强化学习算法;
9、第三构建模块,用于将下一时间子段作为当前时间子段,重复执行所述第一构建模块至第二构建模块,直到得到所有时间子段的所述电力系统中发电机组的启停矩阵,从而得到预设时间段的所述电力系统中发电机组的调度计划。
10、第三方面,本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现第一方面中任一项所述的基于图卷积网络的强化学习的机组组合求解方法。
11、第四方面,本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面中任一项所述的基于图卷积网络的强化学习的机组组合求解方法。
12、本申请提供的一种基于图卷积网络强化学习的机组组合求解方法,包括将预设时间段中当前时间子段的电力系统中发电机组的运行信息、状态空间和动作空间输入电力系统图卷积网络,得到当前时间子段电力系统中发电机组的状态集;结合预设奖励函数和预设约束条件,根据强化学习算法和电力系统中发电机组的状态集,得到当前时间子段的电力系统中发电机组的启停矩阵,并更新强化学习算法;重复执行上述步骤直到得到所有时间子段的电力系统中发电机组的启停矩阵,从而得到预设时间段的电力系统中发电机组的调度计划。本申请可以有效地捕捉机组、任务以及它们之间的复杂关系,使模型能够更好地理解机组之间的关系,有助于优化资源分配。并通过强化学习适应不断变化的条件和需求,使机组组合更具灵活性。
1.一种基于图卷积网络强化学习的机组组合求解方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述步骤s1,具体包括:
3.根据权利要求2所述的方法,其特征在于,所述将更新后的所述网络图、更新后的所述状态空间和更新后的所述动作空间输入基于注意力机制构建的所述电力系统图卷积网络,得到当前时间子段所述发电系统的发电机组的状态集,具体包括:
4.根据权利要求3所述的方法,其特征在于,所述将所述抽象特征输入引入注意力机制的所述卷积层,以使得所述网络图中的各节点的抽象特征通过注意力机制加权并相加后,得到图卷积网络特征,具体包括:
5.根据权利要求4所述的方法,其特征在于,所述步骤s2,具体包括:
6.根据权利要求5所述的方法,其特征在于,
7.根据权利要求1-6中任一项所述的方法,其特征在于,
8.一种基于图卷积网络的强化学习的机组组合求解装置,其特征在于,所述装置包括:
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的基于图卷积网络的强化学习的机组组合求解方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的基于图卷积网络的强化学习的机组组合求解方法。