人工智能和机器学习技术的进步,为解决各种环境下分子pKa预测问题提供了新的思路。Grzybowski课题组率先利用人工智能技术,在pKa预测问题上取得了显著进展。罗三中课题组此前也利用物理有机描述符SPOC首次实现了不同溶剂环境中的分子pKa预测。在之前研究的基础上,基于iBonD键能数据库,作者设计了一种新型3D描述符H-SPOC,旨在捕捉质子解离位点附近的微环境特征,囊括了氢键作用和空间相互作用。并由此开发了一种预测分子特定位点pKa的新方法。
模型在著名的SAMPL6、SAMPL7、和SAMPL8等基准挑战中取得了优异的性能,证明了其强大的预测能力。尽管采用了直观的化学描述符设计和简单的XGBoost算法,H-SPOC的表现仍优于其他基于分子图和深度学习的方法,表现出了卓越的性能
同时作者进行了进一步测试,包括预测反应和晶体环境中特定构象的分子pKa。吡虫啉是一种常用农药,具有多种晶型,不同晶型的杀虫能力并不相同,晶型的区别主要源于分子构象差异和分子间氢键作用。利用H-SPOC模型对各晶型中的分子pKa进行了预测。结果发现,预测值可以与晶体的热力学稳定性△G和药代动力学性能KT50(在药物测试中杀死一半害虫所需时间)建立良好的线性关系。证明了H-SPOC模型预测的准确性和对于氢键作用的表示能力。
在该工作中,H-SPOC使用化学直观的物理化学描述方法,结合实用高效的ML框架,实现了对复杂环境中分子pKa的高精度预测。模型展示了卓越的预测准确性和广泛的适用性,为快速、精确地预测分子酸性提供了一个高效的手段,在药物发现、催化和材料科学研究中具有巨大潜力。
论文信息Highly Precise Prediction of Micro- and Supra-pKa Based on 3D Descriptors Integrating Non-Covalent Interactions