专利成果展示

一种机组组合深度强化学习求解方法

发布时间:2024.02.20


专利示意图

一、技术领域

电网机组组合技术领域


二、专利介绍

1.专利信息

专利类型:发明

专利权人:清华大学深圳国际研究生院

申请号:202311096902.5

发明人:徐桂磊、吴秋伟、林镇佳

2.专利说明书摘要

本发明提供一种机组组合深度强化学习求解方法,包括以下步骤:S1:接收机组参数与网络拓扑结构,建立基于传统优化的机组组合模型;S2:基于传统优化的机组组合模型进行马尔可夫决策过程建模;S3:改进机组组合马尔可夫决策过程以考虑风电不确定性;S4:搭建用于求解马尔可夫决策过程的深度强化学习模型;S5:接收风电和负荷历史数据对所述深度强化学习模型的参数进行训练;S6:将训练后的所述深度强化学习模型用于求解考虑风电不确定性的机组组合问题,进而得到机组组合调度方案。本方法利用历史风电数据进行深度强化学习模型参数的训练自适应学习风电不确定性对调度方案的影响,从而做出最优的机组组合决策方案。

3.创新点

(1)本发明涉及电网机组组合技术领域,具体涉及一种考虑风电不确定性的深度强化学习机组组合方法;

(2)求解方法能自适应风电不确定性,相较于传统优化算法,求解机组组合的时间大大缩短;

(3)该方法不依赖对风电出力随机变量精确建模和选取不确定性预算的先验知识即可做出决策。

4.痛点问题

(1)现有工作利用强化学习方法求解电网机组组合问题时,仅对确定性的机组组合问题进行求解,并未考虑到电力系统的不确定性如风电出力预测误差;

(2)尽管这些工作采用了强化学习的方法,但是他们并未与传统的优化方法对比以展现强化学习算法求解的精确性。

5.技术优势

尚未有类似发明的技术与产品。


三、产业化信息

1.应用场景

本发明具体涉及一种考虑风电不确定性的深度强化学习机组组合方法,能以系统运行的总体费用最小为目标,利用一种基于策略的深度强化学习方法,指导解决具有离散动作空间机组组合问题,同时自适应考虑了风电出力偏差对奖励函数的影响进而做出最优决策。

2.商业价值

本文构建了独立发电企业机组启停决策和机组组合规划模型。

(1)该模型对发电企业竞价策略的制定和运营方式的优化具有现实的指导意义和参考价值,同时考虑了风电出力的不确定性;

(2)在综合比较各种优化算法的基础上,结合本文数学模型的特点,选用深度强化学习作为数学模型的求解方法,并且结合两个数学模型目标函数和约束条件的特点,对基本深度强化学习从多方面做了改进;从而使得求解速度更高;

(3)在包含风电出力不确定性的情况下,能够辅助发电企业做出更经济的调度方法,与传统优化方法对比,其成本显著降低19.8%。

3.发展规划

(1)该技术未来可应用至电力系统调度领域,缓解在该领域由国外商业求解器垄断的局面,辅助发电企业在日前电力市场快速给出机组组合方案;

(2)该技术通过为发电企业实现以利润最大化为目标的最优竞价设计提供参考和依据,未来可以考虑以买断制或者订阅制的盈利模式为发电企业服务。

4.合作方式

面议



注:所有成果未经授权,请勿转载

联系方式:ttc@sz.tsinghua.edu.cn