← 返回
基于斯塔克尔伯格博弈的软演员评论家-深度强化学习方法用于锂离子电池及冷却系统的快速充电管理
Fast Charging Management of a Lithium-Ion Battery and Cooling System: A Stackelberg Game-Based Soft Actor Critic−Deep Reinforcement Learning Method
| 作者 | Hongrong Yang · Quanyi Chen · Xiaoying Shi · Yinliang Xu · Xuan Zhang |
| 期刊 | IEEE Transactions on Industrial Electronics |
| 出版日期 | 2025年5月 |
| 技术分类 | 储能系统技术 |
| 技术标签 | 强化学习 |
| 相关度评分 | ★★★★★ 5.0 / 5.0 |
| 关键词 | 锂离子电池 快充管理策略 冷却系统 Stackelberg博弈 深度强化学习 |
语言:
中文摘要
本文提出了一种针对锂离子电池和冷却系统的快速充电管理策略,旨在解决在多种物理约束条件下实现快速充电,同时将冷却能耗和电池老化降至最低的难题。将电池与冷却系统之间的复杂耦合关系构建为基于斯塔克尔伯格博弈的双层优化框架,以反映充电和冷却过程的顺序交互。为此,开发了一种基于斯塔克尔伯格博弈的软演员 - 评论家深度强化学习方法,并对其收敛性进行了严格证明,确保了该方法的可靠性。大量实验结果验证了该方法的有效性,表明其优于现有先进策略,包括单智能体深度强化学习、贝叶斯方法以及恒流 - 恒压(CCCV) - 比例积分微分(PID)控制。该方法实现了安全、节能的快速充电,为平衡性能、能源使用和电池寿命提供了一种有效的解决方案。
English Abstract
This article proposes a fast charging management strategy for lithium-ion batteries and cooling systems, tackling the challenge of achieving fast charging under multiple physical constraints while minimizing cooling energy consumption and battery aging. The complex coupling between the battery and cooling system is formulated as a Stackelberg game-based bilevel optimization framework, reflecting the sequential interactions of the charging and cooling processes. To address this, a Stackelberg game-based soft actor-critic deep reinforcement learning method is developed, with rigorous proof of convergence ensuring its reliability. Extensive experimental results validate the method, showing its superiority over state-of-the-art strategies, including single-agent deep reinforcement learning, Bayesian methods, and constant current−constant voltage (CCCV)−proportional integral derivative (PID) control. This approach achieves safe, energy-efficient fast charging, offering an effective solution to balance performance, energy use, and battery longevity.
S
SunView 深度解读
从阳光电源的业务视角来看,这项基于Stackelberg博弈和深度强化学习的快充管理技术具有重要的战略价值。该技术通过将电池充电与热管理系统的耦合关系建模为双层优化框架,实现了充电速度、能耗控制和电池寿命之间的动态平衡,这与我司储能系统的核心技术需求高度契合。
在储能业务层面,该技术可直接应用于我司的PowerStack、液冷储能系统等产品线。当前储能电站面临快速响应电网调度需求与电池安全寿命的矛盾,该方法通过强化学习实时优化充电策略,相比传统CCCV-PID控制展现出显著优势,能够在保证多重物理约束的前提下缩短充电时间,降低热管理系统能耗,这对提升储能系统的全生命周期经济性具有直接价值。实验验证表明其优于现有单智能体方法和贝叶斯优化,证明了技术的先进性。
对于电动汽车充电业务,该技术可增强我司充电桩产品的智能化水平,实现更安全高效的快充服务。技术的收敛性理论证明为工程应用提供了可靠性保障,但从产业化角度看,仍需关注几个关键挑战:一是深度强化学习模型对不同电池化学体系的泛化能力,需要大量实际工况数据进行训练;二是边缘计算硬件的算力要求与成本控制;三是与现有BMS、EMS系统的集成适配性。
建议我司技术团队重点关注该方法在大规模储能电站中的应用验证,探索与我司iSolarCloud平台的数据协同,通过云边协同架构降低部署成本,抢占智能充电管理技术的制高点。