← 返回
基于混合注意力深度强化学习的健康感知集成热管理策略
Health-Conscious Integrated Thermal Management Strategy Using Hybrid Attention Deep Reinforcement Learning for Battery Electric Vehicles
| 作者 | Changcheng Wu · Jiankun Peng · Dawei Pi · Xin Guo · Hailong Zhang · Zexing Wang |
| 期刊 | IEEE Transactions on Power Electronics |
| 出版日期 | 2025年6月 |
| 技术分类 | 电动汽车驱动 |
| 技术标签 | 强化学习 |
| 相关度评分 | ★★★★★ 5.0 / 5.0 |
| 关键词 | 集成热管理系统 电池健康 TD3算法 温度控制 节能 |
语言:
中文摘要
有效的热管理策略(TMS)可以延长纯电动汽车(BEV)的续航里程,并在高温环境下提高车内热舒适性。考虑到集成热管理系统(ITMS)的发展趋势以及动力电池在纯电动汽车中的关键作用,本文建立了一个嵌入电池健康意识的集成热管理系统模型。为进一步挖掘所提出的集成热管理系统的温度控制和节能潜力,采用双延迟深度确定性策略梯度算法(TD3)设计了一种学习型热管理策略。鉴于集成热管理系统内复杂的状态信息,引入了一种混合注意力机制对原始TD3算法进行优化,使TD3智能体能够辨别各种状态信息的相对重要性,从而提高其决策质量。仿真结果表明,与基于规则的热管理策略相比,所提出的基于改进TD3算法的热管理策略分别使电池健康衰减和能量损失降低了22.50%和35.33%。此外,与其他对比热管理策略相比,所提出的热管理策略有效降低了电池、电机和车内的温度波动,均方根误差分别为0.13、0.12和0.08。此外,硬件在环测试进一步表明,与传统热管理策略相比,所提出的热管理策略可降低9.13% - 12.70%的行驶成本。
English Abstract
Effective thermal management strategies (TMSs) can extend the driving range of battery electric vehicles (BEVs) and enhance cabin thermal comfort in high-temperature environments. Considering the development trend toward integrated thermal management systems (ITMSs) and the critical role of the power battery in BEVs, this article establishes an ITMS model embedded with battery health-conscious. To further explore the temperature control and energy-saving potential of the proposed ITMS, a learning TMS is designed using twin delayed deep deterministic policy gradient (TD3). Given the intricate state information within the ITMS, a hybrid attention mechanism is introduced to optimize the original TD3, enabling the TD3 agent to discern the relative importance of various state information and thereby improving its decision-making quality. Simulation results indicate that, compared to rule-based TMS, the proposed improved TD3-based TMS decrease battery health degradation and energy loss by 22.50% and 35.33%, respectively. Additionally, compared to other compared TMSs, the proposed TMS effectively reduces temperature fluctuations in the battery, motor, and cabin, with root mean square errors of 0.13, 0.12, and 0.08, respectively. Moreover, hardware in the loop testing further demonstrates that the proposed TMS can reduce driving costs by 9.13%–12.70% compared to the traditional TMS.
S
SunView 深度解读
从阳光电源的业务布局来看,这项基于混合注意力深度强化学习的电动汽车热管理技术具有显著的战略价值。该研究将电池健康意识嵌入集成热管理系统,通过TD3算法实现了电池健康退化降低22.50%、能量损失减少35.33%的效果,这与我司在储能系统和电动汽车动力解决方案领域的核心诉求高度契合。
从技术迁移角度分析,该论文提出的多目标协同优化策略对我司大型储能电站的热管理系统升级具有直接借鉴意义。当前储能系统面临的温度波动控制、电池寿命延长等挑战,与电动汽车场景本质相似。论文中混合注意力机制能够识别复杂状态信息的相对重要性,这对于处理储能电站多模块、多变量的热管理决策尤为关键。若将此技术应用于我司1500V储能系统,预期可显著提升电池循环寿命和系统能效比。
技术成熟度方面,该研究已完成硬件在环测试验证,表明算法具备工程化基础,但深度强化学习模型的训练成本、实时性保障以及不同工况下的泛化能力仍需进一步验证。对阳光电源而言,关键机遇在于将该技术与我司既有的智慧能源管理平台深度融合,开发面向光储充一体化场景的智能热管理解决方案。
建议重点关注该技术在电化学储能温控系统的适配性研究,特别是在高温、高湿等极端气候条件下的鲁棒性测试,这将为我司拓展海外市场提供差异化竞争优势,同时支撑新能源汽车充电业务的协同发展。