← 返回
揭示有机光伏中的结构-性能关系:可解释的机器学习模型预测功率转换效率
Uncovering Structure–Performance Relationships in Organic Photovoltaics: Interpretable Machine Learning Model for Predicting the Power Conversion Efficiency
| 作者 | Yi Yang · Arowa Yasmeen · Ovidiu Daescu |
| 期刊 | IEEE Journal of Photovoltaics |
| 出版日期 | 2025年8月 |
| 技术分类 | 光伏发电技术 |
| 技术标签 | GaN器件 机器学习 |
| 相关度评分 | ★★★★★ 5.0 / 5.0 |
| 关键词 | 有机光伏 机器学习 XGBoost模型 功率转换效率 高通量筛选 |
语言:
中文摘要
有机光伏(OPV)是一种颇具前景的光伏技术,但传统上候选分子的设计采用试错法,效率低下。然而,机器学习通过从大量的有机光伏材料数据集中学习,提供了一种基于数据的策略,有助于加速高性能有机光伏材料的发现和优化。在本研究中,我们使用极端梯度提升(XGBoost)模型,利用从哈佛光伏数据集(HOPV15)中提取的结构特征,来预测通过密度泛函理论计算得到的有机光伏供体材料的功率转换效率(PCE)。为了提高预测性能,我们基于随机森林和XGBoost的平均特征重要性得分,选择了最具信息价值的分子指纹。我们的XGBoost模型在HOPV15数据集上实现了目前最先进的预测精度,$R^{2}$ = 0.918,均方根误差(RMSE) = 0.302%,优于先前的方法。通过使用SHapley可加性解释(SHAP),我们确定了影响功率转换效率的关键摩根(Morgan)和PubChem子结构,提供了可解释的见解。这一框架支持准确且可解释的有机光伏预测,有望用于高通量筛选。
English Abstract
Organic photovoltaics (OPVs) represent a promising photovoltaic technology, but the design of candidate molecules has traditionally followed a trial-and-error approach, which is inefficient. However, machine learning provides a data-informed strategy by learning from large OPV material datasets, supporting the accelerated discovery and optimization of high-performance OPV materials. In this study, we use an extreme gradient boosting (XGBoost) model to predict the density functional theory-calculated power conversion efficiency (PCE) of OPV donor materials using structural features extracted from the Harvard Photovoltaic Dataset (HOPV15) dataset. To enhance predictive performance, we select the most informative molecular fingerprints based on the averaged feature importance scores from both random forest and XGBoost. Our XGBoost model achieves state-of-the-art predictive accuracy on HOPV15 with R^2 = 0.918 and RMSE = 0.302%, outperforming prior methods. Using SHapley Additive exPlanations, we identify key Morgan and PubChem substructures that influence PCE, offering interpretable insights. This framework supports accurate, explainable OPV prediction and holds promise for high-throughput screening.
S
SunView 深度解读
该可解释机器学习模型对阳光电源光伏产品线具有重要参考价值。虽然研究聚焦有机光伏材料设计,但其核心方法论——通过机器学习建立结构-性能映射关系——可迁移至SG系列逆变器的功率器件选型优化。具体而言,可借鉴该模型框架建立GaN/SiC器件的结构参数(掺杂浓度、栅极结构等)与性能指标(导通损耗、开关速度)的预测模型,加速功率模块的迭代设计。此外,该可解释性方法可应用于iSolarCloud平台的智能诊断模块,通过分析组件性能衰减与环境因素的关联,实现预测性维护。该研究为阳光电源在器件级优化和系统级智能运维提供了数据驱动的方法论支撑。