← 返回
基于重要性加权的模型预测控制增强型模仿学习
Enhanced Imitation Learning of Model Predictive Control Through Importance Weighting
| 作者 | |
| 期刊 | IEEE Transactions on Industrial Electronics |
| 出版日期 | 2025年1月 |
| 技术分类 | 控制与算法 |
| 技术标签 | 模型预测控制MPC 深度学习 |
| 相关度评分 | ★★★★★ 5.0 / 5.0 |
| 关键词 | 模型预测控制 神经网络 训练数据 重要性权重 双有源桥变换器 |
语言:
中文摘要
在电力电子研究领域,用神经网络模型近似模型预测控制(MPC)算法作为一种实现计算成本高昂方法实时应用的有效工具,已受到广泛关注。训练机器学习模型以模仿MPC算法通常遵循传统的监督学习流程,其静态训练数据集通过均匀采样或仿真生成。使用均匀分布的数据进行训练可使模型在整个运行空间保持一致的性能,但非常小的模型可能无法在对应预期运行的区域取得令人满意的结果。相反,使用仿真数据进行训练可以得到能够精确跟踪某些轨迹的模型,但在数据代表性不足的区域无法获得足够好的性能。本文提出了一种结合这两种方法优势的方法,即利用通过实验数据的核密度估计获得的重要性权重对采样数据进行模型训练。这使得训练过程能够针对运行空间的特定区域,从而显著提高模型性能。该方法通过对双有源桥变换器的移动离散控制集MPC算法进行模仿得到验证,并通过实验结果进行了确认。
English Abstract
The approximation of model predictive control (MPC) algorithms with neural network models has received significant attention in the power electronics research community, as a valuable tool to enable the real-time implementation of computationally expensive methods. Training machine learning models to imitate MPC algorithms typically follows a traditional supervised learning flow, with a static training data set generated through either uniform sampling or simulation. Training with uniformly distributed data allows models to maintain consistent performance throughout the entire operating space, but very small models may fail to achieve satisfactory results in the regions corresponding to expected operation. Conversely, simulation data can be used in training to obtain models that can accurately track certain trajectories but fail to achieve adequate performance in underrepresented regions. The present article proposes a method to combine the advantages of both methods, by training models on sampled data with importance weights obtained through the kernel density estimation of experimental data. This allows the training process to target specific regions of the operating space, and results in measurable performance improvements. The method is demonstrated through the imitation of a moving discretized control set MPC algorithm for a dual active bridge converter, and is validated through experimental results.
S
SunView 深度解读
从阳光电源的业务角度来看,这项基于重要性加权的模型预测控制(MPC)模仿学习技术具有重要的应用价值。该技术针对电力电子系统中MPC算法计算复杂度高、难以实时实现的痛点,通过神经网络模型近似MPC算法,并创新性地采用核密度估计对训练数据进行重要性加权,实现了模型性能的显著提升。
对于阳光电源的核心产品线,这项技术的应用前景广阔。在光伏逆变器领域,高频开关控制需要在微秒级时间尺度内完成复杂优化决策,该技术可显著降低控制器的计算负担,提升系统动态响应速度和效率。在储能变流器方面,双向功率流动控制对实时性要求极高,论文中以双有源桥(DAB)变换器为验证对象,恰好契合储能系统DC-DC变换的典型应用场景。通过针对性训练,模型可在常用工况区域保持高精度,同时兼顾全工况覆盖能力。
技术成熟度方面,该方法已通过实验验证,但从研究成果到产品化仍需跨越工程化鸿沟。主要挑战包括:神经网络模型在极端工况下的鲁棒性验证、不同拓扑结构的泛化能力、以及与现有控制架构的集成问题。同时,训练数据的质量和代表性直接影响模型性能,需要建立完善的数据采集和标注体系。
机遇在于,这项技术可助力阳光电源在新一代高性能变流器产品中实现差异化竞争优势,特别是在多能互补、虚拟电厂等复杂应用场景中,智能化控制算法将成为系统级解决方案的核心竞争力。建议建立专项技术预研团队,探索其在1500V高压系统、储能PCS等关键产品上的应用可行性。