光氧化还原催化作为实现太阳能转化与绿色合成的关键技术,高度依赖光催化剂的氧化还原电位匹配。然而,传统实验测定与密度泛函理论(DFT)计算分别面临成本高、误差大或计算量巨大的瓶颈,难以满足高通量筛选需求。
2025年10月9日,东北师范大学朱博、关威在国际知名期刊Angewandte Chemie International Edition发表题为《Machine Learning-Assisted Prediction of Ground- and Excited-State Redox Potentials in Iridium(III) Photocatalysts》的研究论文,Xuetao Li为论文第一作者,朱博、关威为论文共同通讯作者。

在本文中,作者提出了一种数据驱动的框架,将密度泛函理论(DFT)计算与机器学习(ML)相结合,以实现对Ir(III)光催化剂的基态和激发态氧化还原电位进行准确且可扩展的预测。
作者首先构建了独立模型,以识别控制氧化还原行为的关键几何和电子描述符。基于Shapley加性解释的分析揭示了清晰的构效关系,为调控氧化还原电位提供了机理洞见和理性指导。基于这些见解,作者开发了统一的多输出模型——用于基态氧化还原电位的Model G和用于激发态氧化还原电位的Model E——以实现快速、经济高效且高通量的预测。通过在共享描述符空间中对氧化和还原过程进行建模,作者能够在保持高预测精度的同时降低计算开销。
为评估跨金属的可迁移性,作者应用了残差迁移学习方法到锇(Os)光催化剂。利用特征相似的配合物,所得的迁移模型(G-T、E-T)达到了与仅基于Os的基线模型相当的性能,展示了高效的少样本跨金属迁移能力。
总之,本研究建立了一个可解释且可迁移的机器学习(ML)框架,用于光催化剂的发现。该框架为大规模筛选和跨多种过渡金属平台的理性设计提供了基础,将加速光氧化还原催化、太阳能燃料生产以及更广泛可持续能源技术的进步。

图1:PC-Ir数据集中代表性配体的化学多样性。本图展示了PC-Ir数据集中配体的多样性,包括单齿、双齿、三齿和四齿配体。这些配体构成了数据集中不同配位模式的代表,为研究提供了广泛的结构基础。

图2:PC-Ir配合物的电化学系列:还原电位(上)和氧化电位(下)与SCE(饱和甘汞电极)的对比。该图展示了PC-Ir配合物的氧化和还原电位分布,电位范围从-3.5到3.0V,显示了催化剂结构的系统性变化,为合理调节催化剂结构以实现目标氧化还原电位提供了参考。

图3:PC-Ir氧化还原电位的机器学习分析。a-d) 基态和激发态氧化/还原电位的预测回归曲线,展示了模型对训练集、OOS和EOD数据集的预测准确性。e) 独立模型中特征重要性的比较,揭示了氧化还原电位的关键分子决定因素。f–i) SHAP值的蜂巢图,展示了每个电位的特征贡献。j–m) SHAP力图,突出了极端催化剂案例,箭头长度与SHAP幅度成正比,颜色表示正负贡献。

图4:PC-Ir基态氧化还原电位预测性能。a) 不同特征/模型组合的R2分析比较。b) 顶级模型的OOS验证。c) 模型G的三阶段评估:10折交叉验证(左)、OOS(中)和EOD(右)。

图5:PC-Ir激发态氧化还原电位预测性能优化。a) 通过数据库细化的三阶段改进。b) 最优数据库-ML组合的评估。c) 最终模型验证(10折交叉验证(左)、OOS(中)、EOD(右))。

图6:使用Ir训练的基模型(灰色)和残差迁移模型(红色)预测Os配合物的氧化还原电位。a) 模型G-T。b) 模型E-T。
综上,作者构建了一套融合DFT计算与ML的数据驱动框架,首次实现了对Ir(III)光催化剂基态与激发态氧化还原电位的高精度、可扩展预测。
通过系统构建包含519个配合物、2076个氧化还原电位值的高质量数据库,开发独立与联合多输出模型,不仅显著提升了预测效率与准确性,还利用SHAP分析揭示了关键电子结构描述符与氧化还原性能之间的定量构效关系,为催化剂理性设计提供了理论依据。研究进一步通过残差迁移学习,将模型成功拓展至数据稀缺的Os光催化剂体系,验证了其在跨金属迁移中的高效性与鲁棒性。
该框架为高通量虚拟筛选、催化剂结构优化和新型光氧化还原体系的发现提供了强大工具,将在光催化水分解、CO2还原、太阳能燃料合成等绿色能源技术中具有广泛应用前景,推动可持续能源与绿色化学的发展。
Machine Learning-Assisted Prediction of Ground- and Excited-State Redox Potentials in Iridium(III) Photocatalysts. Angew. Chem. Int. Ed., 2025. https://doi.org/10.1002/anie.202517393.







