← 返回
多时间尺度深度强化学习光储配电网电压优化
Multi-time Scale Deep Reinforcement Learning for Voltage Optimization in Photovoltaic-Storage Distribution Networks
| 作者 | 黄冬梅 · 余京朋 · 崔承刚 · 董倩文 · 周游 · 龚春阳 |
| 期刊 | 中国电机工程学报 |
| 出版日期 | 2025年17月 |
| 卷/期 | 第 45 卷 第 17 期 |
| 技术分类 | 光伏发电技术 |
| 技术标签 | 光伏逆变器 光储一体化 多物理场耦合 强化学习 |
| 相关度评分 | ★★★★★ 5.0 / 5.0 |
| 关键词 | 光储配电网 电压优化 多时间尺度深度强化学习 储能设备 电压偏移与网损 |
版本:
针对分布式光伏接入导致的配电网电压越限问题,提出一种基于多时间尺度深度强化学习的电压优化策略。该方法结合无模型深度强化学习,综合考虑多种离散与连续调压设备、光伏逆变器及储能的动作时域特性,通过事件触发机制限制储能动作次数与荷电状态变化,以最小化电压偏移与网损为目标,实现多时间尺度协同优化。仿真结果表明,所提方法在IEEE 33节点系统中显著降低电压偏移至0.0166 pu和平均网损至141.2 kW,同时将有载调压变压器与电容器组动作次数分别控制在6次与3次,储能15分钟内荷电状态变化低于30%,动作频次降至连续动作的10%以下,有效延长储能寿命并提升系统安全性与经济性。
分布式光伏分散接入配电网,其出力与负荷呈反调节特性,易导致公共接入点电压越限.现有方法通过合理配置储能一定程度上优化了电压分布,但储能调用在时域上与其余无功源高度耦合,加重了联合调压建模的复杂度,影响了调压精度,储能快速充放、过充过放及高频次充放亦将引发其寿命衰减,致使系统经济性与安全性下降.对此,该文提出一种采用多时间尺度深度强化学习的光储配电网电压优化策略,结合深度强化学习无模型的特点,通过计及多种离散/连续调压设备、光伏逆变器及储能设备动作时域特性,并基于事件触发机制严格限制储能设备动作次数与荷电状态,以电压偏移量与网损最小为目标,从多时间尺度设计配电网电压优化方案.最后,基于光储与其他调压设备接入改进的 IEEE 33 节点系统对所提方法进行仿真验证,结果表明,该文所提方法相对文献结果具有较小的电压偏移与平均网损量,分别为 0.016 6 pu与141.2 kW,适用于光伏出力不确定性相对较大的应用场景;同时,有载调压变压器与电容器组动作次数分别低至 6 次与 3 次,储能设备在 15 min内的荷电状态变化量低于 30%,其动作频次大幅低至连续动作的 10%以下,维持其荷电状态始终处于 0.2~0.8 的安全区间.
S
SunView 深度解读
该多时间尺度深度强化学习电压优化技术对阳光电源光储协同控制具有重要应用价值。可直接应用于SG系列光伏逆变器的无功调压功能与ST系列储能变流器的协同控制策略,通过事件触发机制优化储能动作频次,有效延长PowerTitan储能系统寿命。该方法将储能SOC变化控制在30%以内、动作频次降至10%以下的成果,可融入iSolarCloud云平台的智能调度算法,实现光伏逆变器无功调节、OLTC变压器分接头、储能充放电的多时间尺度协同优化。无模型强化学习框架为阳光电源ESS集成方案提供自适应电压控制新思路,提升配电网安全性与经济性,降低储能全生命周期成本。