← 返回
储能系统技术 强化学习 ★ 5.0

基于深度强化学习的含储能船舶的海岛-海上渔排能源运输策略研究

Energy Transportation Strategy for Island-Marine Fish Farm System with Energy Storage Vessels Based on Deep Reinforcement Learning

作者 朱振山陈豪陈炜龙黄缨惠
期刊 中国电机工程学报
出版日期 2025年7月
卷/期 第 45 卷 第 7 期
技术分类 储能系统技术
技术标签 强化学习
相关度评分 ★★★★★ 5.0 / 5.0
关键词 能源运输策略 深度强化学习 马尔可夫决策过程 参数化双深度Q网络 大规模能源运输
版本:
针对海上渔排与风光资源富余岛屿间的能源交互问题,提出一种包含全电船舶的能源运输策略,并构建考虑移动式储能电池组状态细分的混合动作空间马尔可夫决策过程模型。采用基于多批次前向传播的参数化双深度Q网络求解,通过解耦离散与连续动作提升训练稳定性与收敛性能。仿真结果表明,该方法能有效实现多节点间能量调配,在大规模场景下优于传统深度强化学习方法,具备更强灵活性与优化能力。
针对海上渔排与风光资源富余岛屿能源交互问题,该文提出含全电力船舶(all-electric ship,AES)的岛屿-海上渔排-海岸能源运输策略,利用能够很好处理海面风光不确定性问题以及适应较大规模能源转移模型的深度强化学习方法对上述能源运输模型进行求解.首先,将移动式储能电池组细化为满充电池、空载电池以及不完全充电电池;其次,将上述能源运输问题建模为含混合动作空间的马尔可夫决策过程;考虑到针对混合动作空间问题,提出一种适用于混合动作空间的基于多批次前向传播的参数化双深度Q网络,该方法通过多步前向传递策略对不相关离散与连续动作进行解耦,减少了智能体训练过程中的波动性并能够收敛于更优的解;最后,通过算例仿真可知,所提策略能够有效实现各地点间能量转移,所提算法相较于传统适用于离散动作空间的深度强化学习方法更加灵活,在目标场景下能够实现更优运行.此外,在模型逐渐扩大的情况下,将该文方法与传统方法求解效果进行对比,验证所提方法在解决大规模能源运输问题的优势.
S

SunView 深度解读

该深度强化学习能源调度技术对阳光电源移动储能业务具有重要应用价值。研究中的混合动作空间MDP模型和参数化双深度Q网络可直接应用于PowerTitan移动储能系统的智能调度,优化多场景间能量转运策略。其电池状态细分建模方法可增强ST系列储能变流器的SOC管理精度,提升电池全生命周期效益。该技术与iSolarCloud云平台结合,可为海岛微网、应急供电等场景提供预测性能量调配方案,突破传统规则控制局限。混合动作解耦策略对阳光电源开发船舶岸电、移动充电车等新型储能产品具有方法论指导意义,增强多能源节点协同优化能力。