咨询电话:021-58952328
Angew. Chem.:基于新型3D分子描述符的pKₐ 高精度预测2025-05-04
分子的酸碱性反映了分子接受/提供质子的能力,对生命活动和化学反应具有重大意义。酸解离常数pKa是量化分子酸碱性的关键参数。在化学过程中,存在多种物质,形成高度复杂的化学系统。在这样的系统中,其复杂的微环境会对pKa产生重大影响,但是,现在的实验/计算方法难以考虑到局部微环境的影响,获取分子特定位点的pKa值仍面临挑战。同时,在多分子体系中,存在多种分子间相互作用,而现有的方法侧重于单分子体系,难以处理多分子环境。

 

 

1
人工智能和机器学习技术的进步,为解决各种环境下分子pKa预测问题提供了新的思路。Grzybowski课题组率先利用人工智能技术,在pKa预测问题上取得了显著进展。罗三中课题组此前也利用物理有机描述符SPOC首次实现了不同溶剂环境中的分子pKa预测。在之前研究的基础上,基于iBonD键能数据库,作者设计了一种新型3D描述符H-SPOC,旨在捕捉质子解离位点附近的微环境特征,囊括了氢键作用和空间相互作用。并由此开发了一种预测分子特定位点pKa的新方法。

2
模型在著名的SAMPL6、SAMPL7、和SAMPL8等基准挑战中取得了优异的性能,证明了其强大的预测能力。尽管采用了直观的化学描述符设计和简单的XGBoost算法,H-SPOC的表现仍优于其他基于分子图和深度学习的方法,表现出了卓越的性能

3
同时作者进行了进一步测试,包括预测反应和晶体环境中特定构象的分子pKa。吡虫啉是一种常用农药,具有多种晶型,不同晶型的杀虫能力并不相同,晶型的区别主要源于分子构象差异和分子间氢键作用。利用H-SPOC模型对各晶型中的分子pKa进行了预测。结果发现,预测值可以与晶体的热力学稳定性△G和药代动力学性能KT50(在药物测试中杀死一半害虫所需时间)建立良好的线性关系。证明了H-SPOC模型预测的准确性和对于氢键作用的表示能力。

5
在该工作中,H-SPOC使用化学直观的物理化学描述方法,结合实用高效的ML框架,实现了对复杂环境中分子pKa的高精度预测。模型展示了卓越的预测准确性和广泛的适用性,为快速、精确地预测分子酸性提供了一个高效的手段,在药物发现、催化和材料科学研究中具有巨大潜力。

文信息

Highly Precise Prediction of Micro- and Supra-pKa Based on 3D Descriptors Integrating Non-Covalent Interactions

Siyuan Liu, Qi Yang, Long Zhang, Sanzhong Luo

Angewandte Chemie International Edition

DOI: 10.1002/anie.202424069