← 返回
控制与算法 模型预测控制MPC 强化学习 ★ 5.0

基于强化学习的电力电子变换器预测控制

Reinforcement Learning-Based Predictive Control for Power Electronic Converters

作者 Yihao Wan · Qianwen Xu · Tomislav Dragičević
期刊 IEEE Transactions on Industrial Electronics
出版日期 2024年10月
技术分类 控制与算法
技术标签 模型预测控制MPC 强化学习
相关度评分 ★★★★★ 5.0 / 5.0
关键词 有限集模型预测控制 强化学习 加权因子设计 功率变换器 总谐波失真
语言:

中文摘要

有限集模型预测控制(FS - MPC)似乎是一种很有前景且有效的电力电子变换器控制方法。传统的有限集模型预测控制存在权重因子选择耗时的问题,这会显著影响控制性能。有限集模型预测控制面临的另一个持续挑战是,要获得理想的控制性能,它依赖于预测模型。为克服上述问题,我们提议将强化学习(RL)应用于电力变换器的有限集模型预测控制。首先,采用强化学习算法对有限集模型预测控制进行自动权重因子设计,旨在最小化总谐波失真(THD)或降低平均开关频率。此外,通过用预测算法的成本函数为强化学习智能体制定激励机制,该智能体可在无需系统模型先验知识的情况下,通过模仿预测控制器自主学习,为电力变换器找到最优开关策略。最后,提出了一个部署框架,用于在实际的有限集模型预测控制调节的独立变换器配置上对所提出的基于强化学习的方法进行实验验证。通过两个示例性控制目标展示了所提出的强化学习辅助权重因子调整方法的有效性。此外,结果表明,基于无模型强化学习的控制器与有限集模型预测控制的性能匹配良好。

English Abstract

Finite-set model predictive control (FS-MPC) appears to be a promising and effective control method for power electronic converters. Conventional FS-MPC suffers from the time-consuming process of weighting factor selection, which significantly impacts control performance. Another ongoing challenge of FS-MPC is its dependence on the prediction model for desirable control performance. To overcome the above issues, we propose to apply reinforcement learning (RL) to FS-MPC for power converters. The RL algorithm is first employed for the automatic weighting factor design of the FS-MPC, aiming to minimize the total harmonic distortion (THD) or reduce the average switching frequency. Furthermore, by formulating the incentive for the RL agent with the cost function of the predictive algorithm, the agent learns autonomously to find the optimal switching policy for the power converter by imitating the predictive controller without prior knowledge of the system model. Finally, a deployment framework that allows for experimental validation of the proposed RL-based methods on a practical FS-MPC regulated stand-alone converter configuration is presented. Two exemplary control objectives are demonstrated to show the effectiveness of the proposed RL-aided weighting factor tuning method. Moreover, the results show a good match between the model-free RL-based controller and the FS-MPC performance.
S

SunView 深度解读

从阳光电源的业务视角来看,这项基于强化学习的预测控制技术对我们的核心产品线具有重要战略价值。该技术针对有限集模型预测控制(FS-MPC)的两大痛点提出了创新解决方案,这与我们在光伏逆变器和储能变流器领域追求高效率、高可靠性的目标高度契合。

在实际应用层面,该技术的自动权重因子设计功能可显著缩短我们产品的开发调试周期。传统FS-MPC需要工程师针对不同工况反复调整权重参数,这在面对多样化应用场景(如户用、工商业、大型地面电站)时尤为耗时。强化学习算法能够自主优化THD和开关频率等关键指标,这将直接提升我们逆变器产品的电能质量和效率表现,增强市场竞争力。

更具突破性的是其无模型学习特性。当前我们的储能系统面临电池老化、温度变化等导致的模型参数漂移问题,传统预测控制依赖精确模型的局限性明显。该技术通过模仿学习实现模型无关控制,理论上可提升系统在全生命周期的鲁棒性和适应性,这对降低运维成本具有实际意义。

然而,技术落地仍面临挑战。论文虽提出了实验验证框架,但从实验室到大规模量产还需验证算法在极端工况下的安全性和实时性。强化学习的训练数据需求、计算资源消耗,以及与现有DSP/FPGA控制平台的集成适配,都是工程化需要解决的问题。建议我们的中央研究院可先在新一代储能PCS产品上进行小批量试点,积累工程经验,同步评估边缘AI芯片的应用可行性,为技术的规模化部署做好准备。