← 返回
光伏发电技术 储能系统 微电网 强化学习 ★ 5.0

一种基于在线强化学习的集中式控制微电网能量管理策略

An Online Reinforcement Learning-Based Energy Management Strategy for Microgrids With Centralized Control

作者 Qinglin Meng · Sheharyar Hussain · Fengzhang Luo · Zhongguan Wang · Xiaolong Jin
期刊 IEEE Transactions on Industry Applications
出版日期 2024年7月
技术分类 光伏发电技术
技术标签 储能系统 微电网 强化学习
相关度评分 ★★★★★ 5.0 / 5.0
关键词 可再生能源 在线强化学习 能源管理优化模型 联合调度策略 风-光-储系统
语言:

中文摘要

为解决可再生能源,尤其是风能和太阳能显著的不可预测性和间歇性问题,本文提出了一种基于在线强化学习的新型优化模型。首先,考虑到风电 - 光伏储能系统(WPESS)固有的挑战,设计了一个能源管理优化模型,以实现计划执行并最小化储能(ES)运行成本。采用在线强化学习框架,为能源管理优化模型定义了各种状态变量、动作变量和奖励函数。应用状态 - 动作 - 奖励 - 状态 - 动作(SARSA)算法来学习微电网系统的联合调度策略,利用其迭代探索机制并与环境进行交互。该策略旨在实现有效功率跟踪和减少储能充放电的目标。以一个带有电动汽车(EV)充电负荷的住宅小区为测试案例,验证了所提方法的有效性。数值分析表明,该方法不依赖于传统数学模型,能很好地适应WPESS的不确定性和复杂约束条件,在满足低成本要求的同时,计算效率显著高于模型预测控制(MPC)和深度Q网络(DQN)算法。

English Abstract

To address the issue of significant unpredictability and intermittent nature of renewable energy sources, particularly wind and solar power, this paper introduces a novel optimization model based on online reinforcement learning. Initially, an energy management optimization model is designed to achieve plan adherence and minimize energy storage (ES) operation costs, taking into account the inherent challenges of wind power-photovoltaic energy storage systems (WPESS). An online reinforcement learning framework is employed, which defines various state variables, action variables, and reward functions for the energy management optimization model. The state-action-reward-state-action (SARSA) algorithm is applied to learn the joint scheduling strategy for the microgrid system, utilizing its iterative exploration mechanisms and interaction with the environment. This strategy aims to accomplish the goals of effective power tracking and reduction of storage charging and discharging. The proposed method's effectiveness is validated using a residential community with electric vehicle (EV) charging loads as a test case. Numerical analyses demonstrate that the approach is not reliant on traditional mathematical models and adapts well to the uncertainties and complex constraints of the WPESS, maintaining a low-cost requirement while achieving computational efficiency significantly higher than that of the model predictive control (MPC) and deep Q-network (DQN) algorithm.
S

SunView 深度解读

从阳光电源的业务视角来看,这项基于在线强化学习的微电网能量管理技术具有重要的战略价值。该技术针对风光储系统的不确定性和间歇性问题,提出了SARSA算法驱动的实时优化方案,这与我司在光储一体化解决方案领域的核心需求高度契合。

在产品应用层面,该技术可直接赋能我司的PowerStack储能系统和微电网控制器产品线。相比传统模型预测控制(MPC),强化学习方法无需依赖精确的数学模型,能更好地适应复杂约束和实时波动,这对提升我司储能系统在多场景下的自适应能力具有显著价值。论文验证的计算效率优势意味着该算法可在边缘侧控制器上实现,降低对云端算力的依赖,符合我司分布式能源管理系统的架构理念。

技术成熟度方面,SARSA作为经典强化学习算法,理论基础扎实,且论文已在含电动汽车充电负荷的实际场景中验证。但从工程化角度,仍需关注几个关键挑战:一是算法在极端气象条件下的鲁棒性验证;二是状态空间和动作空间的设计需针对不同应用场景优化;三是与现有SCADA系统的集成适配问题。

战略机遇在于,该技术可强化我司在"源网荷储"协同优化领域的竞争力,特别是在工商业微电网和虚拟电厂项目中,实时优化能力将直接转化为客户的经济效益。建议将此技术纳入我司智慧能源管理平台的算法库,优先在已部署的园区级储能项目中开展试点验证,积累不同场景下的运行数据,为产品化奠定基础。