← 返回
储能系统技术 储能系统 微电网 强化学习 ★ 5.0

深度强化学习与无静差混合控制方法在考虑非线性功率损耗和模型失配的混合储能系统中的应用

Deep Reinforcement Learning and Deadbeat Hybrid Control Method for Hybrid Energy Storage System Considering Nonlinear Power Loss and Model Mismatch

作者 Yanyu Zhang · Pengpeng Li · Xibeng Zhang · Feixiang Jiao · Benfei Wang · Yi Zhou
期刊 IEEE Transactions on Industrial Informatics
出版日期 2025年1月
技术分类 储能系统技术
技术标签 储能系统 微电网 强化学习
相关度评分 ★★★★★ 5.0 / 5.0
关键词 混合储能系统 无差拍控制算法 深度强化学习 功率平衡 稳态误差
语言:

中文摘要

摘要:微电网应用中的混合储能系统(HESS)需进行控制,以平衡发电侧与负载侧之间的功率。然而,转换过程中的功率损耗和模型参数不匹配会影响控制性能。为此,本文提出一种结合深度强化学习的混合储能系统无差拍控制算法。在该方法中,将非线性功率损耗和模型不匹配导致的混合储能系统最优电流参考值的变化视为集中扰动,可由深度确定性策略梯度智能体进行补偿,无差拍控制则基于精确的参考电流生成最优占空比,以消除系统稳态误差并提高动态响应速度。通过仿真和硬件实验验证了所提算法的有效性。结果表明,稳态误差可保持在 1%以内。与传统无差拍控制方法相比,所提方法使母线电压尖峰和调节时间分别降低了 34.24% - 44.44%和 16.66% - 40.00%。

English Abstract

Hybrid energy storage system (HESS) in microgrid applications is controlled to balance the power between generation and load sides. However, power loss of converting and model parameter mismatch would affect the control performance. To this end, a deadbeat control algorithm for HESS combined with deep reinforcement learning is proposed in this article. In the proposed method, the variation of optimal HESS current reference caused by nonlinear power loss and model mismatch is regarded as a centralized disturbance that can be compensated by a deep deterministic policy gradient agent, and a deadbeat control generates an optimal duty cycle based on a precise reference current to eliminate system steady-state error and improve dynamic response speed. The effectiveness of the proposed algorithm is verified through simulation and hardware experiments. Results demonstrate that the steady-state error can be maintained within 1%. Compared to conventional deadbeat control methods, the proposed method reduces the bus voltage spike and settling time by 34.24%–44.44% and 16.66%–40.00%, respectively.
S

SunView 深度解读

从阳光电源储能系统业务视角来看,这项结合深度强化学习与无差拍控制的混合储能技术具有显著的工程应用价值。该技术直击当前储能系统面临的两大核心痛点:非线性功率损耗和模型参数失配,这些问题在我们的光储一体化项目中普遍存在,直接影响系统效率和电能质量。

技术层面,该方法通过深度确定性策略梯度(DDPG)算法动态补偿扰动,结合无差拍控制实现精确电流跟踪,将稳态误差控制在1%以内,母线电压尖峰和稳定时间分别降低34-44%和16-40%。这对阳光电源的PowerTitan储能系统和户用储能产品线意义重大:更低的电压波动可提升逆变器寿命,更快的动态响应能力增强微电网调频调峰性能,这直接转化为系统可靠性和经济性优势。

从应用成熟度评估,深度强化学习已在工业控制领域展现潜力,但从学术研究到产品化仍需跨越工程鸿沟。主要挑战包括:算法在极端工况下的鲁棒性验证、实时计算资源需求与嵌入式控制器的适配、大规模储能电站中多机协同控制的复杂性,以及长期运行中模型退化问题。

战略机遇在于,该技术可嵌入我们的iSolarCloud智慧能源管理平台,形成"云端训练-边缘部署"的AI控制架构。建议启动预研项目,重点验证算法在兆瓦级储能系统中的扩展性,并评估与现有PowerStack产品线的集成方案。若技术验证成功,可作为差异化竞争优势,特别是在对电能质量要求严苛的工商业储能和调频辅助服务市场。