← 返回
储能系统技术 微电网 强化学习 ★ 5.0

基于多智能体深度强化学习的含电池更换站的微电网群交易能源管理

Multiagent Deep Reinforcement Learning for Transactive Energy Management of MMGs Incorporating Battery Swapping Stations

作者 Ting Cai · You Zhang · Yuxin Wu · Haoyuan Yan · Tianyang Zhao
期刊 IEEE Transactions on Industrial Informatics
出版日期 2025年4月
技术分类 储能系统技术
技术标签 微电网 强化学习
相关度评分 ★★★★★ 5.0 / 5.0
关键词 微电网 换电站 能源交易 混合多智能体深度强化学习 运营成本
语言:

中文摘要

微电网(MGs)与换电站(BSSs)之间的最优能源管理可带来显著的经济效益。然而,由于分布式可再生能源和新兴负荷的时空不确定性以及信息不完整,现有研究在制定微电网与换电站之间的最优交互策略方面面临挑战。本文采用混合多智能体深度强化学习方法解决多微电网与多换电站之间的能源交易问题,以实现运营成本最小化。具体而言,引入了一个分层的交易能源管理社区,在考虑不同利益相关者利益的情况下,促进多微电网与换电站之间的能源交换。该问题被建模为部分可观测马尔可夫博弈。所提出的混合算法将多智能体近端策略优化算法(MAPPO)与双深度Q网络(DDQN)相结合,用于处理微电网的连续调度和换电站的离散操作。数值结果表明,与基线方法相比,所提出的MAPPO - DDQN算法平均可降低13.71%的微电网运营成本,并使换电站的利润提高14.62%。

English Abstract

Optimal energy management between microgrids (MGs) and battery swapping stations (BSSs) offers significant economic benefits. However, existing works face challenges in formulating optimal interaction strategies between MGs and BSSs, due to the temporal-spatial uncertainty of distributed renewables and emerging loads, as well as incomplete information. This article addresses the energy transaction problem between multi-MGs and multi-BSSs using a hybrid multiagent deep reinforcement learning approach to minimize operation costs. Specifically, a hierarchical transactive energy management community is introduced to facilitate energy exchange between MMGs and BSSs, considering different stakeholder interests. The problem is modeled as a partially observable Markov game. The proposed hybrid algorithm, combining multiagent proximal policy optimization (MAPPO) and double deep Q-network (DDQN), handles the continuous scheduling of MGs and the discrete operations of BSSs. Numerical results show that, averaged over the baselines, the proposed MAPPO-DDQN reduces 13.71% of MGs' operation costs and increases 14.62% of BSSs' profit.
S

SunView 深度解读

从阳光电源的业务角度看,这项基于多智能体深度强化学习的能源交易管理技术,与公司在储能系统和综合能源解决方案领域的战略布局高度契合。该技术通过MAPPO-DDQN混合算法实现多微网与换电站间的优化能源调度,平均降低13.71%的微网运营成本并提升14.62%的换电站收益,这为阳光电源的储能系统集成和能源管理平台带来显著价值提升空间。

对于阳光电源的储能业务而言,该技术可深度赋能PowerTitan等储能系统产品。通过处理分布式新能源和负荷的时空不确定性,算法能够优化储能系统的充放电策略,提高资产利用率。特别是在光储充一体化场景中,该技术可协调光伏发电、储能调度与电动汽车换电站运营,这与公司正在拓展的电动汽车能源生态形成战略协同。分层交易能源管理架构考虑了多方利益主体,符合阳光电源构建综合能源服务平台的商业模式需求。

然而,技术应用仍面临挑战。深度强化学习算法需要大量历史数据训练,且在实际部署中的鲁棒性和可解释性有待验证。信息不完全条件下的决策优化虽有创新,但在涉及电网安全和交易结算的实际场景中,需要与现有能源管理系统深度融合。此外,多智能体协同机制的通信延迟和计算资源消耗也是工程化需要解决的问题。

建议阳光电源将此技术纳入iSolarCloud平台的算法储备,优先在园区微网和充换电站示范项目中试点验证,逐步构建差异化的智慧能源管理竞争优势。