找到 98 条结果

排序:
储能系统技术 储能系统 模型预测控制MPC 强化学习 ★ 5.0

基于稳定性的强化学习控制在电力电子变换器中的应用:一种李雅普诺夫方法

Stability-Guided Reinforcement Learning Control for Power Converters: A Lyapunov Approach

Yihao Wan · Qianwen Xu · IEEE Transactions on Industrial Electronics · 2025年1月

强化学习(RL)因其处理非线性和自学习能力而在电力电子领域受到关注。合理配置下,RL智能体可通过与变换器系统交互自主学习最优控制策略。类似于传统的有限控制集模型预测控制(FCS-MPC),RL可学习最优开关策略并实现良好控制性能。然而,RL控制器改变闭环动态特性,给系统稳定性保障与评估带来挑战。为此,本文提出构造李雅普诺夫函数以引导智能体在提升控制性能的同时确保闭环稳定性,并通过推导电压控制误差收敛的紧致集量化系统的实用稳定域。最后,在实验平台上验证了所提方法的有效性,仿真与实验结果均表明该方法...

解读: 该李雅普诺夫引导的强化学习控制技术对阳光电源ST系列储能变流器和PowerTitan大型储能系统具有重要应用价值。相比传统FCS-MPC,该方法通过李雅普诺夫函数保障闭环稳定性,同时利用RL自学习能力优化开关策略,可显著提升储能变流器在复杂工况下的动态响应和鲁棒性。技术可直接应用于构网型GFM控制器...

储能系统技术 储能系统 SiC器件 深度学习 ★ 5.0

基于软Actor-Critic算法的强化学习控制器改进交错并联DC-DC升压变换器电压调节

Improving Voltage Regulation of Interleaved DC-DC Boost Converter via Soft Actor-Critic Algorithm Based Reinforcement Learning Controller

Jian Ye · Di Zhao · Xuewei Pan · Sinan Li 等6人 · IEEE Journal of Emerging and Selected Topics in Power Electronics · 2025年5月

本文提出采用基于软Actor-Critic(SAC)算法的强化学习(RL)控制器作为三相交错并联DC-DC升压变换器的唯一主控制器,以提升输出电压的动态性能。阐述了最大熵学习的优势及SAC算法原理,给出了神经网络结构与奖励函数的设计方案。SAC智能体经离线训练后,在工作点处进行稳定性分析,并在物理平台上部署测试。与现有方法的对比表明,该方法显著提升了变换器的电压控制能力,且对参数、参考值及负载变化具有强鲁棒性。

解读: 该SAC强化学习控制技术对阳光电源DC-DC变换器产品具有重要应用价值。在ST系列储能变流器中,交错并联Boost拓扑广泛用于电池侧DC-DC升压环节,该方法可显著提升电压动态响应速度和参数鲁棒性,优化储能系统功率爬坡能力。在车载OBC充电机中,面对电池SOC变化和负载突变工况,SAC算法的最大熵学...

储能系统技术 储能系统 强化学习 ★ 4.0

基于吸引力增强型强化学习的去中心化多机器人鱼协同捕食控制

Decentralized Multirobotic Fish Pursuit Control With Attraction-Enhanced Reinforcement Learning

Yukai Feng · Zhengxing Wu · Jian Wang · Junwen Gu 等6人 · IEEE Transactions on Industrial Electronics · 2025年1月

自适应且高效的协同控制对多机器人鱼系统至关重要,可显著提升其在复杂水下任务中的表现。本文提出一种专为多机器人鱼协同追捕设计的新型自适应算法,融合吸引力机制与强化学习技术,使机器人鱼能依据局部观测与环境线索做出自适应决策。针对机器人鱼的独特动力学特性构建了状态转移环境,并结合课程学习方法设计了去中心化的追捕策略。仿真与实物实验验证了该策略的有效性与适应性,为复杂水下环境中多机器人鱼系统的协同控制提供了重要参考。

解读: 该去中心化多智能体协同控制技术对阳光电源分布式储能系统具有重要借鉴价值。文中的吸引力增强型强化学习算法可应用于PowerTitan大型储能系统的多模块协同控制,实现基于局部观测的自适应功率分配与负载均衡。去中心化决策架构可提升ST系列储能变流器集群的容错性与可扩展性,避免单点故障。课程学习方法可优化...

储能系统技术 强化学习 ★ 5.0

基于联邦强化学习的主动配电网多主体博弈协同优化策略

A Multi-Agent Game-Based Cooperative Optimization Strategy for Active Distribution Networks Using Federated Reinforcement Learning

杨文伟 · 彭显刚 · 全欢 · 褚卓卓 等6人 · 电力系统自动化 · 2025年1月 · Vol.49

针对主动配电网多主体协同优化中隐私保护与信任缺失问题,提出一种基于多主体博弈与联邦强化学习的日前-日内协同优化调度策略。构建包含分布式电源、配电网及储能运营商的多主体架构,建立以综合收益最大和调整量最小为目标的优化模型。日前阶段采用有限理性信任演化博弈生成调度计划,日内阶段结合联邦自然策略梯度算法进行滚动优化,在满足系统约束的同时保障数据隐私。仿真结果验证了该方法的经济性与有效性。

解读: 该联邦强化学习多主体协同优化技术对阳光电源PowerTitan储能系统和iSolarCloud平台具有重要应用价值。可直接应用于ST系列储能变流器的日前-日内协同调度,通过联邦学习框架实现分布式光伏、储能运营商与配电网的隐私保护协同优化,解决多主体数据共享难题。该博弈优化策略可集成到iSolarCl...

储能系统技术 储能系统 SiC器件 跟网型GFL ★ 5.0

跟网型逆变器鲁棒稳定性分析:集成参数不确定性和区间时延的PI控制器整定

Robust Stability Analysis of Grid-Following Inverters

Nima Mahdian Dehkordi · Ali Rezaei · Mohsen Hamzeh · IEEE Journal of Emerging and Selected Topics in Power Electronics · 2025年9月

针对跟网型逆变器面临区间参数不确定性和未知有界时延问题,提出新型鲁棒稳定性分析框架。不同于经典鲁棒控制策略(H∞、μ综合、滑模控制)导致高阶或非线性控制器难以实时调谐,以及无模型方法(强化学习、数据驱动)缺乏稳定性保证,该方法采用时延相关准则结合值集和零点排除原理。该方法简单、系统、非保守,无需复杂调谐即可完全确定PI稳定增益。仿真和实验验证了实际鲁棒性和逆变器控制适用性。

解读: 该鲁棒稳定性分析框架对阳光电源跟网型逆变器控制参数整定有重要应用价值。时延相关准则和参数不确定性集成方法可应用于ST储能变流器和SG光伏逆变器的GFL控制器设计,提高在电网参数变化和通信延迟条件下的稳定性。简化的PI增益确定方法便于工程实现,优于复杂鲁棒控制策略。该技术对阳光电源逆变器在弱电网和高比...

储能系统技术 强化学习 ★ 5.0

基于深度强化学习的含储能船舶的海岛-海上渔排能源运输策略研究

Energy Transportation Strategy for Island-Marine Fish Farm System with Energy Storage Vessels Based on Deep Reinforcement Learning

朱振山陈豪陈炜龙黄缨惠 · 中国电机工程学报 · 2025年7月 · Vol.45

针对海上渔排与风光资源富余岛屿间的能源交互问题,提出一种包含全电船舶的能源运输策略,并构建考虑移动式储能电池组状态细分的混合动作空间马尔可夫决策过程模型。采用基于多批次前向传播的参数化双深度Q网络求解,通过解耦离散与连续动作提升训练稳定性与收敛性能。仿真结果表明,该方法能有效实现多节点间能量调配,在大规模场景下优于传统深度强化学习方法,具备更强灵活性与优化能力。

解读: 该深度强化学习能源调度技术对阳光电源移动储能业务具有重要应用价值。研究中的混合动作空间MDP模型和参数化双深度Q网络可直接应用于PowerTitan移动储能系统的智能调度,优化多场景间能量转运策略。其电池状态细分建模方法可增强ST系列储能变流器的SOC管理精度,提升电池全生命周期效益。该技术与iSo...

储能系统技术 储能系统 微电网 强化学习 ★ 5.0

微电网控制与管理的强化学习解决方案综述

Reinforcement Learning Solutions for Microgrid Control and Management: A Survey

Pedro I. N. Barbalho · Anderson L. Moraes · Vinicius A. Lacerda · Pedro H. A. Barra 等6人 · IEEE Access · 2025年1月

微电网MG是包含负荷和分布式能源资源的配电系统部分,能够并网或离网运行。具有适当设计的MG控制器提升能源效率,在现代配电系统中发挥重要作用。因此,MG管理和控制因其复杂运行成为广泛研究领域。强化学习RL为处理MG复杂动态和非线性提供自适应解决方案,是传统算法和控制方法在负荷频率控制、资源分配和能源管理等任务中的替代方案。鉴于该主题相关性,本综述检验RL在MG控制和管理中的作用,在先前综述基础上提供全面更新,按RL类型、控制目标和MG运行模式对文章分类。此外,评估基于RL解决方案的硬件实施和性能评...

解读: 该强化学习综述对阳光电源微电网智能控制具有重要指导价值。阳光PowerStack微电网系统需要自适应控制算法应对负荷波动和能源不确定性。该研究系统梳理的RL方法可应用于阳光微电网EMS系统,优化负荷频率控制和能源调度。在工商业微电网场景下,RL可实现储能系统的智能充放电决策,提升经济效益。该综述识别...

光伏发电技术 储能系统 微电网 强化学习 ★ 4.0

通过结合负荷与光伏预测的迁移学习提升基于强化学习的能量管理

Enhancing Reinforcement Learning-Based Energy Management Through Transfer Learning With Load and PV Forecasting

Chang Xu · Masahiro Inuiguchi · Naoki Hayashi · Wong Jee Keen Raymond 等6人 · IEEE Access · 2025年1月

在可再生能源微电网中,高效能量管理对维持系统稳定性和降低运行成本至关重要。传统强化学习(RL)控制器常面临训练时间长和过程不稳定等问题。本研究提出一种融合迁移学习(TL)技术的新型RL方法,利用ResNet18+BiLSTM等先进预测模型生成的合成数据对RL智能体进行预训练,嵌入领域知识以提升性能。基于一年运行数据的实验结果表明,相较于基线模型,TL增强的RL控制器累计运行成本最高降低62.63%,系统不平衡度改善达80%,并显著提升初始性能与训练效率。该方法展现了TL与RL结合在复杂电力系统实...

解读: 该迁移学习增强的强化学习能量管理技术对阳光电源PowerTitan储能系统和ST系列储能变流器具有重要应用价值。研究中的ResNet18+BiLSTM预测模型可集成至iSolarCloud云平台,提升光伏-储能微电网的实时调度能力。62.63%的成本降低和80%的系统不平衡改善直接契合阳光电源ESS...

光伏发电技术 深度学习 强化学习 ★ 5.0

基于深度强化学习的主动配电网动态重构综述

A Review of Dynamic Reconfiguration in Active Distribution Networks Based on Deep Reinforcement Learning

江昌旭郭辰刘晨曦林俊杰邵振国 · 高电压技术 · 2025年4月 · Vol.51

随着双碳目标推进,风电、光伏等分布式电源大量接入配电网,加剧了出力的间歇性与波动性。主动配电网动态重构属高维混合整数非线性随机优化问题,传统方法存在局限。深度强化学习融合深度学习表征能力与强化学习决策优势,适用于该场景下的重构策略求解。本文综述其研究进展,分析数学模型构建、编码方式及算法应用现状,总结现有方法不足与深度强化学习的优势,并展望未来研究方向。

解读: 该深度强化学习配电网重构技术对阳光电源储能与光伏系统协同优化具有重要价值。在PowerTitan大型储能系统中,可结合iSolarCloud平台实时数据,通过DRL算法动态优化储能充放电策略与网络拓扑,应对光伏出力波动。对于SG系列逆变器集群,该技术可优化多逆变器协同控制与潮流分配,提升MPPT效率...

控制与算法 模型预测控制MPC 强化学习 ★ 5.0

计算高效的长时域预测控制在电力变换器中的应用:一种强化学习方法

Computationally Efficient Long-Horizon Predictive Control for Power Converter: A Reinforcement Learning Approach

Yihao Wan · Yang Zhang · Qianwen Xu · IEEE Transactions on Industrial Electronics · 2025年4月

长预测时域有限控制集模型预测控制(FCS - MPC)在闭环稳定性、谐波失真和开关频率方面表现出卓越的性能。然而,对于传统的穷举法,实际实施时的计算负担会随着预测时域的增加呈指数级增长。传统方法包括将其重新表述为整数最小二乘(ILS)问题,以及采用基于人工神经网络(ANN)的有监督模仿学习技术,以减轻长预测时域带来的计算负担问题。在本文中,通过将强化学习(RL)框架与长预测时域相结合,开发了一种新型自主控制器用于变流器控制。通过这种方式,RL智能体通过与变流器系统进行交互,自主学习最优开关策略。...

解读: 从阳光电源的业务视角来看,这项基于强化学习的长预测时域模型预测控制技术具有重要的战略价值。该技术针对功率变换器控制中的核心痛点——长预测时域带来的计算复杂度问题,提出了创新性解决方案,这与我们在光伏逆变器和储能变流器产品中追求高性能控制的需求高度契合。 技术价值方面,长预测时域控制能够显著改善闭环...

储能系统技术 储能系统 强化学习 ★ 5.0

高渗透率可再生能源电力系统实时调度:一种专家知识与强化学习混合方法

Real-Time Scheduling of High-Penetrated Renewable Power Systems: An Expert Knowledge and Reinforcement Learning Hybrid Approach

Sijun Du · Tao Ding · Yang Xiao · Jingyu Wan 等6人 · IEEE Transactions on Power Systems · 2024年7月

现代电力系统正向低碳可持续转型,可再生能源渗透率的提升及其不确定性给系统调度带来严峻挑战,灵活元件的引入进一步增加了调度复杂性。为此,本文提出一种融合专家知识与强化学习(RL)的混合实时调度方法。首先建立包含柔性负荷与储能的高渗透率可再生能源系统实时调度模型,并转化为马尔可夫决策过程。通过引入专家知识作为系统与RL智能体之间的中介,利用RL算法优化的机组控制序列进行调度决策。基于SG 126节点系统的算例验证了所提方法在保障系统安全稳定运行的同时,显著提升可再生能源消纳能力的有效性与潜力。

解读: 该混合调度方法对阳光电源PowerTitan储能系统和iSolarCloud平台具有重要应用价值。强化学习与专家知识融合的实时调度策略可直接应用于ST系列储能变流器的智能控制算法,优化充放电决策以应对高比例光伏接入的不确定性。该方法可集成至iSolarCloud云平台,实现多站点储能系统协同调度,提...

光伏发电技术 三相逆变器 强化学习 ★ 5.0

基于多智能体深度强化学习的配电网三相不平衡在线治理方法

Online Three-Phase Imbalance Mitigation Method for Distribution Networks Based on Multi-Agent Deep Reinforcement Learning

李彬贤 · 李佳勇 · 海征 · 万灿 等7人 · 中国电机工程学报 · 2025年5月 · Vol.45

随着分布式电源渗透率提升,配电网三相不平衡问题日益严重。针对该问题,以分布式光伏为调控手段,提出一种基于多智能体深度强化学习的在线治理方法。通过地理分区构建多智能体协同架构,采用多智能体注意力动作-评价(MAAC)算法实现光伏控制策略的集中训练与分布式执行,利用实时观测数据在线生成控制指令。基于改进IEEE 123节点系统的仿真结果表明,所提方法能有效降低三相不平衡度,优于四种典型方法,具备良好的协同性与应用前景。

解读: 该多智能体深度强化学习三相不平衡治理技术对阳光电源SG系列光伏逆变器和ST储能变流器具有重要应用价值。可直接集成到三相逆变器的控制算法中,通过MAAC算法实现分布式光伏集群的协同控制,动态调节各相输出功率以平衡负载。该方法与阳光电源iSolarCloud云平台结合,可实现在线实时优化,提升配电网电能...

储能系统技术 DC-DC变换器 微电网 强化学习 ★ 5.0

微网储能侧DC-DC变换器的强化学习自抗扰控制策略

Reinforcement Learning-based Active Disturbance Rejection Control Strategy for Energy Storage Side DC-DC Converters in Microgrids

马幼捷 · 刘熠铭 · 周雪松 · 王博 等6人 · 太阳能学报 · 2025年1月 · Vol.46

直流微电网电压稳定性是新型电力系统的关键问题。针对微电网中直流母线电压波动大、抗干扰能力弱等问题,提出一种基于Q-learning算法的DC-DC变换器自抗扰控制策略。引入线性扩张状态观测器精确估计并补偿内外扰动,结合Q-learning实现控制参数自适应优化,有效提升输出电压稳定性。通过理论分析证明Q-learning算法在范数意义下的收敛性及系统Lyapunov稳定性。仿真结果表明,所提策略在不同工况下较传统线性自抗扰与双闭环PI控制具有更强的抗扰能力与鲁棒性。

解读: 该强化学习自抗扰控制策略对阳光电源ST系列储能变流器和PowerTitan大型储能系统具有重要应用价值。Q-learning自适应参数优化结合线性扩张状态观测器的方案,可直接应用于储能侧DC-DC变换器的母线电压控制,显著提升直流微电网场景下的电压稳定性和抗扰能力。该技术可优化现有储能PCS的双向D...

控制与算法 模型预测控制MPC 强化学习 ★ 5.0

基于强化学习的电力电子变换器预测控制

Reinforcement Learning-Based Predictive Control for Power Electronic Converters

Yihao Wan · Qianwen Xu · Tomislav Dragičević · IEEE Transactions on Industrial Electronics · 2024年10月

有限集模型预测控制(FS - MPC)似乎是一种很有前景且有效的电力电子变换器控制方法。传统的有限集模型预测控制存在权重因子选择耗时的问题,这会显著影响控制性能。有限集模型预测控制面临的另一个持续挑战是,要获得理想的控制性能,它依赖于预测模型。为克服上述问题,我们提议将强化学习(RL)应用于电力变换器的有限集模型预测控制。首先,采用强化学习算法对有限集模型预测控制进行自动权重因子设计,旨在最小化总谐波失真(THD)或降低平均开关频率。此外,通过用预测算法的成本函数为强化学习智能体制定激励机制,该...

解读: 从阳光电源的业务视角来看,这项基于强化学习的预测控制技术对我们的核心产品线具有重要战略价值。该技术针对有限集模型预测控制(FS-MPC)的两大痛点提出了创新解决方案,这与我们在光伏逆变器和储能变流器领域追求高效率、高可靠性的目标高度契合。 在实际应用层面,该技术的自动权重因子设计功能可显著缩短我们...

光伏发电技术 光伏逆变器 光储一体化 多物理场耦合 ★ 5.0

多时间尺度深度强化学习光储配电网电压优化

Multi-time Scale Deep Reinforcement Learning for Voltage Optimization in Photovoltaic-Storage Distribution Networks

黄冬梅 · 余京朋 · 崔承刚 · 董倩文 等6人 · 中国电机工程学报 · 2025年17月 · Vol.45

针对分布式光伏接入导致的配电网电压越限问题,提出一种基于多时间尺度深度强化学习的电压优化策略。该方法结合无模型深度强化学习,综合考虑多种离散与连续调压设备、光伏逆变器及储能的动作时域特性,通过事件触发机制限制储能动作次数与荷电状态变化,以最小化电压偏移与网损为目标,实现多时间尺度协同优化。仿真结果表明,所提方法在IEEE 33节点系统中显著降低电压偏移至0.0166 pu和平均网损至141.2 kW,同时将有载调压变压器与电容器组动作次数分别控制在6次与3次,储能15分钟内荷电状态变化低于30%...

解读: 该多时间尺度深度强化学习电压优化技术对阳光电源光储协同控制具有重要应用价值。可直接应用于SG系列光伏逆变器的无功调压功能与ST系列储能变流器的协同控制策略,通过事件触发机制优化储能动作频次,有效延长PowerTitan储能系统寿命。该方法将储能SOC变化控制在30%以内、动作频次降至10%以下的成果...

储能系统技术 储能系统 户用光伏 用户侧储能 ★ 5.0

基于MILP-TD3的用户侧储能系统优化运行

Optimal Operation of User-side Energy Storage Systems Based on MILP-TD3

陈景文单茜 · 中国电机工程学报 · 2025年13月 · Vol.45

深度强化学习(DRL)在用户侧储能调控中应用广泛,但智能体常难以严格满足运行约束,影响系统安全性。为此,提出一种混合整数线性规划与双延迟深度确定性策略梯度结合的MILP-TD3方法。构建以运行成本最小为目标、计及电池退化成本的实时优化模型,并将功率平衡约束嵌入马尔科夫决策过程。通过将TD3的动作价值函数转化为MILP公式,确保智能体严格执行约束。算例结果表明,该方法平均日运行成本较传统TD3降低25.34%,单次决策平均耗时0.024秒,满足实时性与安全性要求。

解读: 该MILP-TD3方法对阳光电源ST系列储能变流器和PowerTitan储能系统的智能调度具有重要应用价值。通过将约束嵌入强化学习决策过程,可直接集成到iSolarCloud云平台的能量管理系统中,提升用户侧储能的实时优化能力。该方法考虑电池退化成本的建模思路,可优化ST储能系统的全生命周期经济性,...

光伏发电技术 强化学习 ★ 5.0

基于深度强化学习算法的分布式光伏-EV互补系统智能调度

Intelligent Scheduling of Distributed Photovoltaic-EV Complementary Systems Based on Deep Reinforcement Learning Algorithm

陈宁李法社王霜张慧聪唐存靖倪梓皓 · 高电压技术 · 2025年3月 · Vol.51

针对分布式光伏与电动汽车大规模接入电网带来的冲击,构建了光伏-EV互补调度模型,以平抑并网功率波动、提升用户经济性为目标,综合考虑光伏出力、负荷波动、EV接入随机性、实时电价及电池老化成本等因素,提出采用梯度随机扰动改进的近端策略优化算法(GRP-PPO)求解。通过调整目标函数获得两种运行策略:策略一优先满足出行需求与功率稳定,并网点功率稳定率达91.84%;策略二侧重用户收益,单日EV收益达82.6元,有效激励用户参与调度,较传统PPO算法性能提升3.48%。

解读: 该深度强化学习调度技术对阳光电源光储充一体化解决方案具有重要应用价值。GRP-PPO算法可直接集成至iSolarCloud云平台,实现分布式光伏SG系列逆变器、ST储能变流器与充电桩的协同优化调度。91.84%的并网功率稳定率可显著降低PowerTitan储能系统的功率波动应对压力,延长电池寿命;双...

储能系统技术 强化学习 ★ 5.0

重新思考复杂约束满足下的安全策略学习:含储能单元的实时安全约束经济调度初探

Rethinking Safe Policy Learning for Complex Constraints Satisfaction: A Glimpse in Real-Time Security Constrained Economic Dispatch Integrating Energy Storage Units

Jianxiong Hu · Yujian Ye · Yizhi Wu · Peilin Zhao 等5人 · IEEE Transactions on Power Systems · 2024年6月

近年来,用于实时安全约束经济调度(RT - SCED)问题的强化学习(RL)受到了广泛的研究关注。然而,普通的强化学习方法难以确保系统和设备层面约束条件的满足,不得不对违反约束的情况分别进行惩罚。随着可再生能源渗透率的不断提高,大规模储能得以集成,这是因为储能能够缓解可再生能源的间歇性问题。这就使得实时安全约束经济调度问题需要满足时间耦合约束条件。现有的安全强化学习方法要么在每个时间步使用安全层纠正不安全的动作,这可能会导致在可行空间边界制定出次优动作,并且可能违反时间耦合约束;要么构建安全评估...

解读: 该安全约束经济调度技术对阳光电源PowerTitan储能系统及iSolarCloud云平台具有重要应用价值。强化学习结合约束分层建模可直接应用于ST系列储能变流器的实时调度优化,通过安全感知奖励机制保障储能系统在参与电网调频、削峰填谷时满足SOC约束、功率爬坡率及电网安全约束。该方法可集成至iSol...

储能系统技术 储能系统 SiC器件 深度学习 ★ 5.0

利用物理信息神经网络构建代理模型辅助强化学习优化智能电网能源管理

Optimizing energy management of smart grid using reinforcement learning aided by surrogate models built using physics-informed neural networks

Julen Cestero · Carmine Delle Femine · Kenji S. Muroa · Marco Quartulli 等5人 · Applied Energy · 2025年1月 · Vol.401

摘要 在智能电网场景下优化能源管理面临重大挑战,主要源于现实世界系统的复杂性以及各组件之间错综复杂的相互作用。强化学习(Reinforcement Learning, RL)正逐渐成为解决智能电网中最优潮流(Optimal Power Flow, OPF)问题的一种有效方案。然而,RL需要在给定环境中进行强制性的反复迭代才能获得最优策略,这意味着必须从一个很可能代价高昂的模拟器中获取样本,从而导致样本效率低下问题。在本研究中,我们通过使用基于物理信息神经网络(Physics-Informed N...

解读: 该研究采用物理信息神经网络(PINN)构建代理模型加速强化学习训练,对阳光电源ST系列储能变流器和PowerTitan系统的能量管理优化具有重要价值。通过PINN代理模型可将训练速度提升50%,能显著加快储能系统最优潮流控制策略的开发周期。该方法可应用于iSolarCloud平台的智能调度算法优化,...

系统并网技术 强化学习 ★ 5.0

基于奇异摄动理论与自适应动态规划的强化学习稳定现代交直流电网中并网电压源变换器直流侧动态特性

Reinforcement Learning to Stabilize Singularly Perturbed DC-Side Dynamics of Grid-Connected Voltage-Source Converters in Modern AC–DC Grids Using Singular Perturbation Theory and Adaptive Dynamic Programming

Masoud Davari · Jianguo Zhao · Chunyu Yang · Weinan Gao 等5人 · IEEE Transactions on Industrial Electronics · 2024年9月

电网现代化进程中交直流系统的稳定性和性能在很大程度上依赖于并网电压源换流器(GC - VSC)的整流模式。作为系统的核心,其影响十分显著。基于脉宽调制方法的级联控制的电流控制型GC - VSC在智能电网范式中应用广泛。本文探讨了在现代交直流电网中,此类GC - VSC控制结构所引发的动态特性如何被视为奇异摄动系统。为此,本文借助自适应(或近似)动态规划方法和奇异摄动理论(SPT),提出了一种基于强化学习(RL)的、针对具有不确定动态特性的电压控制问题的新型最优控制策略。首先,利用SPT将原最优控...

解读: 从阳光电源的业务视角来看,这项基于强化学习和奇异摄动理论的并网变流器控制技术具有重要的战略价值。该技术直接针对当前级联控制结构中的多时间尺度动态问题,这与我司光伏逆变器和储能变流器面临的核心技术挑战高度契合。 在技术价值层面,该方法通过奇异摄动理论将复杂的全阶系统分解为快慢子系统,有效规避了数值刚...

第 1 / 5 页