找到 2 条结果
基于鲁棒软演员-评论家算法的时空相关性风险调度方法
Risk-Based Dispatch of Power Systems Incorporating Spatiotemporal Correlation Based on the Robust Soft Actor-Critic Algorithm
Jianbing Feng · Zhouyang Ren · Wenyuan Li · IEEE Transactions on Power Systems · 2024年11月
基于安全深度强化学习(SDRL),本文提出一种考虑时空相关性的风险调度方法(SC-RD),同时建模违规风险的时间相关性与风电不确定性的空间相关性。为此设计了一种新型鲁棒软演员-评论家算法(R-SAC),无需近似或不确定性分布假设,即可在线求解非线性、非凸且含积分形式的SC-RD模型。通过构建鲁棒约束马尔可夫决策过程(R-CMDP),将违规风险作为智能体探索成本,并以成本的CVaR作为安全探索的风险指标。引入二阶中心矩评估模块高效估计CVaR,并结合加速原对偶优化实现最大熵自适应学习。在IEEE-...
解读: 该研究提出的时空相关性风险调度方法对阳光电源的储能与风电产品具有重要应用价值。R-SAC算法可优化ST系列储能变流器的调度策略,提升PowerTitan大型储能系统在风电场景的运行稳定性。具体而言:(1)可应用于储能电站EMS的调度优化,提高储能容量配置合理性;(2)可集成到iSolarCloud平...
重新思考复杂约束满足下的安全策略学习:含储能单元的实时安全约束经济调度初探
Rethinking Safe Policy Learning for Complex Constraints Satisfaction: A Glimpse in Real-Time Security Constrained Economic Dispatch Integrating Energy Storage Units
Jianxiong Hu · Yujian Ye · Yizhi Wu · Peilin Zhao 等5人 · IEEE Transactions on Power Systems · 2024年6月
近年来,用于实时安全约束经济调度(RT - SCED)问题的强化学习(RL)受到了广泛的研究关注。然而,普通的强化学习方法难以确保系统和设备层面约束条件的满足,不得不对违反约束的情况分别进行惩罚。随着可再生能源渗透率的不断提高,大规模储能得以集成,这是因为储能能够缓解可再生能源的间歇性问题。这就使得实时安全约束经济调度问题需要满足时间耦合约束条件。现有的安全强化学习方法要么在每个时间步使用安全层纠正不安全的动作,这可能会导致在可行空间边界制定出次优动作,并且可能违反时间耦合约束;要么构建安全评估...
解读: 该安全约束经济调度技术对阳光电源PowerTitan储能系统及iSolarCloud云平台具有重要应用价值。强化学习结合约束分层建模可直接应用于ST系列储能变流器的实时调度优化,通过安全感知奖励机制保障储能系统在参与电网调频、削峰填谷时满足SOC约束、功率爬坡率及电网安全约束。该方法可集成至iSol...