找到 11 条结果 · IEEE Transactions on Power Systems

排序:
储能系统技术 储能系统 调峰调频 深度学习 ★ 5.0

基于序的异构智能体强化学习方法用于配电网与输电网协调的负荷频率控制

Order-based Heterogeneous Agents Reinforcement Learning Method with the Coordination of Distribution Network and Transmission Network for Load Frequency Control

Shixuan Yu · Xiaodong Zheng · Tianzhuo Shi · Ruilin Chen 等6人 · IEEE Transactions on Power Systems · 2025年8月

随着大规模分布式能源(DERs)持续接入配电网(DN),DN已具备参与负荷频率控制(LFC)的能力。本文提出一种基于序的异构智能体软演员-评论家方法(OHASAC),以解决异构可控DERs间的协调问题。通过神经网络估计异构智能体的最优更新顺序,并将最优LFC问题建模为考虑DN与输电网(TN)协调的局部可观测马尔可夫博弈。模型涵盖变辐照条件下电池储能系统(BESS)与光伏(PV)的协同调频。仿真结果表明,该方法在DN-TN协同环境中能有效管理多种分布式电源,兼具优良的泛化性与可扩展性。

解读: 该异构智能体协同控制技术对阳光电源PowerTitan储能系统与SG系列光伏逆变器的协同调频具有重要应用价值。OHASAC方法可优化ST储能变流器在变辐照条件下的BESS-PV协同响应策略,提升配电侧分布式资源参与电网LFC的能力。基于序的智能体更新机制可集成至iSolarCloud平台,实现多站点...

储能系统技术 储能系统 SiC器件 强化学习 ★ 5.0

知识增强的群体深度强化学习用于大规模电网实时网络约束经济调度

Knowledge-Augmented Population-Based Deep Reinforcement Learning for Real-Time Network-Constrained Economic Dispatch of Large-Scale Power Grid

Yixi Chen · Jizhong Zhu · Hanjiang Dong · Cong Zeng 等5人 · IEEE Transactions on Power Systems · 2025年6月

近年来,深度强化学习(DRL)因其在在线前瞻决策和应对不确定性方面的优势,被广泛应用于实时网络约束经济调度(NCED)。然而,传统DRL方法在计算效率与并行性方面存在局限,难以适应大规模电网环境。为此,本文提出一种新型知识增强的群体深度强化学习(PDRL)方法。PDRL通过扰动代理参数生成种群进行探索,并聚合个体结果构建代理梯度以更新模型,具有高效探索能力与高并行性。结合电网物理知识,提出序贯安全投影(S2P)技术,显著提升决策安全性并降低训练难度。在39节点、500节点和2383节点系统上的仿...

解读: 该知识增强群体深度强化学习技术对阳光电源PowerTitan大型储能系统及iSolarCloud云平台具有重要应用价值。在储能侧,PDRL的高并行性与序贯安全投影技术可优化ST系列储能变流器的实时调度策略,确保大规模储能电站在电网约束下实现经济最优充放电决策,提升电网友好性。在光伏侧,该方法可集成至...

电动汽车驱动 储能系统 强化学习 ★ 5.0

面向电动汽车协调的两阶段输电系统运营商-配电系统运营商服务提供框架

Two-Stage TSO-DSO Services Provision Framework for Electric Vehicle Coordination

Yi Wang · Dawei Qiu · Fei Teng · Goran Strbac · IEEE Transactions on Power Systems · 2024年12月

高比例可再生能源接入导致电力系统惯性下降,对频率响应服务的需求日益增加。电动汽车(EV)凭借车网互动(V2G)能力可为输电系统运营商(TSO)提供经济高效的频率调节服务,但其在参与频率支撑时可能引发电压安全问题,影响配电系统运营商(DSO)运行。为此,本文提出一种两阶段多电动汽车服务提供框架:第一阶段参与日前TSO-DSO频率备用调度;第二阶段在配电网中实时执行备用交付并支持电压调节。针对大规模EV与复杂环境,第二阶段采用去中心化调控范式,并设计通信高效的强化学习算法以降低多智能体训练的通信开销...

解读: 该两阶段TSO-DSO协调框架对阳光电源充电桩与储能业务具有重要应用价值。文章提出的去中心化强化学习算法可直接应用于阳光电源充电桩产品,实现V2G双向充放电时的频率-电压协同控制,避免频率支撑服务引发配网电压越限。该框架与PowerTitan储能系统的多层级调度架构高度契合:日前阶段可优化储能参与辅...

风电变流技术 储能系统 强化学习 ★ 5.0

基于鲁棒软演员-评论家算法的时空相关性风险调度方法

Risk-Based Dispatch of Power Systems Incorporating Spatiotemporal Correlation Based on the Robust Soft Actor-Critic Algorithm

Jianbing Feng · Zhouyang Ren · Wenyuan Li · IEEE Transactions on Power Systems · 2024年11月

基于安全深度强化学习(SDRL),本文提出一种考虑时空相关性的风险调度方法(SC-RD),同时建模违规风险的时间相关性与风电不确定性的空间相关性。为此设计了一种新型鲁棒软演员-评论家算法(R-SAC),无需近似或不确定性分布假设,即可在线求解非线性、非凸且含积分形式的SC-RD模型。通过构建鲁棒约束马尔可夫决策过程(R-CMDP),将违规风险作为智能体探索成本,并以成本的CVaR作为安全探索的风险指标。引入二阶中心矩评估模块高效估计CVaR,并结合加速原对偶优化实现最大熵自适应学习。在IEEE-...

解读: 该研究提出的时空相关性风险调度方法对阳光电源的储能与风电产品具有重要应用价值。R-SAC算法可优化ST系列储能变流器的调度策略,提升PowerTitan大型储能系统在风电场景的运行稳定性。具体而言:(1)可应用于储能电站EMS的调度优化,提高储能容量配置合理性;(2)可集成到iSolarCloud平...

储能系统技术 储能系统 强化学习 ★ 5.0

AdapSafe2:无先验安全认证的强化学习在多区域频率控制中的应用

AdapSafe2: Prior-Free Safe-Certified Reinforcement Learning for Multi-Area Frequency Control

Xu Wan · Mingyang Sun · IEEE Transactions on Power Systems · 2024年10月

高比例可再生能源接入下,安全强化学习(RL)被广泛用于电力系统频率控制。然而,现有方法在非稳态环境适应与高维时变安全约束满足方面仍面临挑战。本文提出AdapSafe2,一种无需先验知识且具备安全保证的多区域频率控制方法。通过元环境学习算法自适应追踪系统参数变化,并构建元强化学习框架实现无模型自适应控制;设计基于控制屏障函数的安全评判网络与安全补偿器,动态识别并仅对高风险区域进行补偿,提升高维约束下的求解效率。在2区与3区低惯量系统中的仿真验证了该方法在动态安全约束下的优越性能。

解读: 该无先验安全强化学习技术对阳光电源PowerTitan储能系统和ST系列储能变流器的频率调节功能具有重要应用价值。AdapSafe2的元学习自适应框架可增强储能系统在高比例新能源场景下的动态响应能力,其控制屏障函数安全机制能确保储能系统在SOC、功率等多维约束下的安全运行。该技术可与阳光电源现有的V...

电动汽车驱动 SiC器件 强化学习 ★ 5.0

基于物理引导的强化学习进行停电缓解

Blackout Mitigation via Physics-Guided RL

Anmol Dwivedi · Santiago Paternain · Ali Tajer · IEEE Transactions on Power Systems · 2024年10月

本文研究针对系统异常的顺序校正控制策略设计,以防止停电事故。提出一种物理引导的强化学习框架,综合考虑长期稳定性影响,识别有效的实时前瞻性校正决策序列。控制空间包含离散的线路投切操作与连续的发电机调节。通过引入电力网络潮流灵敏度因子指导智能体训练过程中的探索,提升策略质量。基于Grid2Op平台的实验表明,融合物理信号显著优于黑箱方法。值得注意的是,战略性地断开部分输电线路并配合多步发电机调节,常可形成有效延缓或避免停电的长周期决策。

解读: 该物理引导强化学习框架对阳光电源PowerTitan储能系统和构网型控制技术具有重要应用价值。研究中的潮流灵敏度因子引导策略可直接应用于ST系列储能变流器的实时功率调节决策,在电网异常时通过多步序列控制优化有功/无功输出,配合线路投切信号实现主动支撑。该方法与阳光电源GFM构网型控制技术深度契合,可...

光伏发电技术 光伏逆变器 强化学习 ★ 5.0

基于多目标与多智能体深度强化学习的光伏逆变器寿命考虑下配电网实时分散式电压/无功控制

Multi-Objective and Multi-Agent Deep Reinforcement Learning for Real-Time Decentralized Volt/VAR Control of Distribution Networks Considering PV Inverter Lifetime

Rudai Yan · Yan Xu · IEEE Transactions on Power Systems · 2024年8月

光伏逆变器能够为配电网的电压/无功控制(VVC)提供快速且灵活的无功功率支持,但额外的无功功率输出会显著缩短其使用寿命。为平衡电压/无功控制性能与逆变器使用寿命之间的矛盾,本文首先提出了一种多目标实时分散式电压/无功控制框架。然后,开发了一种多目标多智能体深度强化学习(MOMADRL)算法,通过集中训练和分散执行来协调光伏逆变器,为传统的基于模型的方法提供了一种更具优势的替代方案,并且无需进行集中通信。通过引入多个智能体和基于智能体的并行训练方案(ABPTS),可以同时学习多种策略以找到帕累托前...

解读: 该多目标多智能体强化学习技术对阳光电源SG系列光伏逆变器的智能控制具有重要应用价值。研究提出的寿命损耗模型可直接应用于逆变器功率器件(IGBT/SiC模块)的热应力管理,通过优化无功调节频次降低温度循环冲击,延长功率模块使用寿命。分散式控制架构与iSolarCloud云平台的边缘智能策略高度契合,可...

电动汽车驱动 储能系统 微电网 可靠性分析 ★ 5.0

基于模仿专家经验的可解释深度强化学习在电动汽车智能充电中的应用

Interpretable Deep Reinforcement Learning With Imitative Expert Experience for Smart Charging of Electric Vehicles

Shuangqi Li · Alexis Pengfei Zhao · Chenghong Gu · Siqi Bu 等6人 · IEEE Transactions on Power Systems · 2024年7月

深度强化学习(DRL)因计算效率高,有望实现复杂系统的在线优化控制,但其可解释性与可靠性限制了在智能电网能量管理中的工程应用。本文首次提出一种新颖的模仿学习框架,用于解决电网连接电动汽车(GEV)充电管理中的高效计算问题。通过基于车网互动(V2G)成本效益分析的先验优化模型生成最优策略,并构建专家经验池以配置学习环境。设计双Actor-Imitator网络结构,实现专家知识向强化学习模型的有效迁移,提升训练效率与调度性能。实验结果表明,该方法在英国某示范微网中有效提升了V2G经济效益并缓解了电池...

解读: 该可解释深度强化学习技术对阳光电源充电桩产品线及储能系统具有重要应用价值。文章提出的模仿学习框架可直接应用于阳光电源V2G充电桩的智能调度算法,通过专家经验池加速DRL训练,提升充电策略的可靠性与可解释性,解决传统黑盒AI在电网能量管理中的工程化难题。该方法可集成至iSolarCloud云平台,实现...

储能系统技术 储能系统 强化学习 ★ 5.0

高渗透率可再生能源电力系统实时调度:一种专家知识与强化学习混合方法

Real-Time Scheduling of High-Penetrated Renewable Power Systems: An Expert Knowledge and Reinforcement Learning Hybrid Approach

Sijun Du · Tao Ding · Yang Xiao · Jingyu Wan 等6人 · IEEE Transactions on Power Systems · 2024年7月

现代电力系统正向低碳可持续转型,可再生能源渗透率的提升及其不确定性给系统调度带来严峻挑战,灵活元件的引入进一步增加了调度复杂性。为此,本文提出一种融合专家知识与强化学习(RL)的混合实时调度方法。首先建立包含柔性负荷与储能的高渗透率可再生能源系统实时调度模型,并转化为马尔可夫决策过程。通过引入专家知识作为系统与RL智能体之间的中介,利用RL算法优化的机组控制序列进行调度决策。基于SG 126节点系统的算例验证了所提方法在保障系统安全稳定运行的同时,显著提升可再生能源消纳能力的有效性与潜力。

解读: 该混合调度方法对阳光电源PowerTitan储能系统和iSolarCloud平台具有重要应用价值。强化学习与专家知识融合的实时调度策略可直接应用于ST系列储能变流器的智能控制算法,优化充放电决策以应对高比例光伏接入的不确定性。该方法可集成至iSolarCloud云平台,实现多站点储能系统协同调度,提...

储能系统技术 强化学习 ★ 5.0

重新思考复杂约束满足下的安全策略学习:含储能单元的实时安全约束经济调度初探

Rethinking Safe Policy Learning for Complex Constraints Satisfaction: A Glimpse in Real-Time Security Constrained Economic Dispatch Integrating Energy Storage Units

Jianxiong Hu · Yujian Ye · Yizhi Wu · Peilin Zhao 等5人 · IEEE Transactions on Power Systems · 2024年6月

近年来,用于实时安全约束经济调度(RT - SCED)问题的强化学习(RL)受到了广泛的研究关注。然而,普通的强化学习方法难以确保系统和设备层面约束条件的满足,不得不对违反约束的情况分别进行惩罚。随着可再生能源渗透率的不断提高,大规模储能得以集成,这是因为储能能够缓解可再生能源的间歇性问题。这就使得实时安全约束经济调度问题需要满足时间耦合约束条件。现有的安全强化学习方法要么在每个时间步使用安全层纠正不安全的动作,这可能会导致在可行空间边界制定出次优动作,并且可能违反时间耦合约束;要么构建安全评估...

解读: 该安全约束经济调度技术对阳光电源PowerTitan储能系统及iSolarCloud云平台具有重要应用价值。强化学习结合约束分层建模可直接应用于ST系列储能变流器的实时调度优化,通过安全感知奖励机制保障储能系统在参与电网调频、削峰填谷时满足SOC约束、功率爬坡率及电网安全约束。该方法可集成至iSol...

储能系统技术 储能系统 强化学习 ★ 4.0

基于强化学习的CANFIS控制器自适应切负荷用于频率恢复准则导向控制

Reinforcement Learning Based Adaptive Load Shedding by CANFIS Controllers for Frequency Recovery Criterion-Oriented Control

Hao Yang · Bo Jin · Zhaohao Ding · Zhenglong Sun 等6人 · IEEE Transactions on Power Systems · 2024年5月

为满足电网导则中严格的频率恢复准则(FRC),本文提出一种面向受端电网的实时自适应切负荷方法。构建基于协同自适应神经模糊推理系统(CANFIS)的切负荷控制器,以母线频率的幅值偏差和恢复时间偏差作为反馈信号,实现智能切负荷决策。引入基于强化学习的确定性策略梯度(DPG)算法优化控制器性能,在最小切负荷成本下确保频率恢复满足FRC,并提升鲁棒性。通过在负荷站部署CANFIS控制器形成分散式控制策略,可实时自适应决策切负荷的时机、位置、量值与轮次。省级受端电网仿真验证了该方法的有效性与适应性。

解读: 该自适应切负荷技术对阳光电源PowerTitan储能系统和ST系列储能变流器具有重要应用价值。CANFIS控制器结合强化学习的频率响应策略可直接集成到储能系统的电网支撑功能中,增强构网型GFM控制的频率调节能力。通过实时监测母线频率偏差,储能系统可智能决策放电功率和持续时间,在满足电网FRC要求的同...