预训练通用神经网络CHGNet，实现基于电荷的原子模拟

2023-10-04 04:10

将 ScienceAI 设为星标

第一时间掌握

新鲜的 AI for Science 资讯

编辑 | 紫罗

复杂电子相互作用的大规模模拟仍然是原子建模面临的最大挑战之一。尽管经典力场通常无法描述电子态和离子重排之间的耦合，但更准确的从头算分子动力学受到计算复杂性的影响，无法进行长时间和大规模的模拟，而这对于研究技术相关现象至关重要。

近日，来自加州大学伯克利分校和劳伦斯伯克利国家实验室的研究人员，提出了一种基于图神经网络的机器学习原子间势（MLIP）模型：晶体哈密顿图神经网络（Crystal Hamiltonian Graph Neural Network，CHGNet），可以对通用势能面进行建模。

研究强调了电荷信息对于捕获适当的化学反应的重要性，并提供了对离子系统的见解，这些离子系统具有以前的 MLIP 无法观察到的额外电子自由度。

该研究以「CHGNet as a pretrained universal neural network potential for charge-informed atomistic modelling」为题，于 2023 年 9 月 14 日发布在《Nature Machine Intelligence》上。

大规模模拟，例如分子动力学 (MD)，是固态材料计算探索的重要工具。但电子相互作用或其在分子动力学模拟中的微妙影响的精确建模仍然是一个重大挑战。经典力场等经验方法通常不够准确，无法捕获复杂的电子相互作用。

从头算分子动力学 (AIMD) 与密度泛函理论 (DFT) 相结合，可以通过显式计算密度泛函近似内的电子结构，产生具有量子力学精度的高保真结果。长时间、大规模的自旋极化 AIMD 模拟对于研究离子迁移、相变和化学反应至关重要，具有挑战性且计算量极大。

诸如 ænet 和 DeepMD 之类的 MLIP，为弥合昂贵的电子结构方法和高效的经典原子间电势之间的差距提供了有希望的解决方案。然而，包含化合价对化学键的重要影响仍然是 MLIP 的一个挑战。

电荷以多种方式表示，从简单的氧化态标签到从量子力学推导出的连续波函数。将电荷信息纳入 MLIP 的挑战来自于许多因素，例如表示的模糊性、解释的复杂性、标签的稀缺性等。

CHGNet 架构

CHGNet 根据材料项目轨迹数据集（Materials Project Trajectory Dataset，MPtrj)）的能量、力、应力和磁矩进行了预训练，该数据集包含 10 多年对超过 150 万个无机结构的密度泛函理论计算。明确包含磁矩使 CHGNet 能够学习并准确表示电子的轨道占据，从而增强其描述原子和电子自由度的能力。

MPtrj 数据集中元素的分布如下图所示。

图示：MPtrj 数据集的元素分布。（来源：论文）

在此，研究人员将电荷定义为一种原子属性（原子电荷），可以通过包含磁矩（magmoms）来推断。研究表明，通过明确地将特定位点 magmoms 作为电荷态约束纳入 CHGNet 中，既可以增强潜在空间正则化，又可以准确捕获电子相互作用。

CHGNet 的基础是 GNN，其中图卷积层用于通过由边 {eij} 连接的一组节点 {vi} 传播原子信息。GNN 中保留了平移、旋转和排列不变性。CHGNet 以具有未知原子电荷的晶体结构作为输入，并输出相应的能量、力、应力和 magmoms。电荷装饰结构可以从现场 magmoms 和原子轨道理论推断出来。

图示：CHGNet 模型架构。（来源：论文）

在 CHGNet 中，通过在原始单元中每个原子 vi 的内搜索相邻原子 vj，将周期性晶体结构转换为原子图。

与其他 GNN 不同，其中 t 个卷积层后更新的原子特征直接用于预测能量，CHGNet 正则化 t−1 卷积层的节点特征以包含有关岩浆的信息。正则化特征携带有关局部离子环境和电荷分布的丰富信息。因此，用于预测能量、力和应力的原子特征是受其电荷态信息约束的电荷。因此，CHGNet 可以仅使用核位置和原子身份作为输入来提供电荷态信息，从而可以研究原子建模中的电荷分布。

CHGNet 在固态材料中的应用

研究人员展示了 CHGNet 在固态材料中的几种应用。展示了 Na2V2(PO4)3 中原子电荷的电荷约束和潜在空间正则化，并展示了 CHGNet 在 LixMnO2 中的电荷转移和相变、LixFePO4 相图中的电子熵以及石榴石型锂超离子导体 Li3+xLa3Te2O12 中的锂 (Li) 和扩散率。

为了合理化对原子电荷的处理，使用 NASICON 型钠离子阴极材料 Na4V2(PO4)3 作为说明性示例。除了从 V 原子核的空间配位中学习之外，在没有任何有关 V 离子电荷分布的先验知识的情况下，CHGNet 成功地将 V 离子区分为三价 V 和四价 V 两组。

图示：Na2V2(PO4)3 中的 Magmom 和隐藏空间正则化。（来源：论文）

在 LixFePO4 的研究中强调了 CHGNet 区分的能力，这对于包含电子熵和有限温度相稳定性至关重要。

图示：来自 CHGNet 的 LixFePO4 相图。（来源：论文）

在 LiMnO2 的研究中，证明了 CHGNet 能够通过长时间的电荷信息 MD 深入了解异价过渡金属氧化物体系中电荷歧化和相变之间的关系。

图示：Li0.5MnO2 相变和电荷歧化。（来源：论文）

接下来，研究了 CHGNet 对于通用 MD 的精度。以石榴石导体中的 Li 扩散为研究对象。

图示：石榴石 Li3La3Te2O12 中的锂扩散率。（来源：论文）

结果表明，不仅精确捕获了活化扩散网络效应，而且 CHGNet 的活化能量与 DFT 结果非常一致。证明了 CHGNet 能够精确捕获活化的局部环境中锂离子之间的强相互作用，以及模拟高度非线性扩散行为的能力。此外，CHGNet 可以显著降低模拟扩散率的误差，并通过扩展到纳秒级模拟，能够对扩散率较差的系统进行研究。

可进一步改进

尽管取得了以上进步，但仍可实现进一步的改进。

首先，使用 magmom 进行价态推断并不能严格确保全局电荷中性。

其次，虽然 magmom 对于离子系统中自旋极化计算的原子电荷来说是很好的启发式方法，但人们认识到非磁性离子的原子电荷推断可能是不明确的，因此需要额外的领域知识。因此，对于没有 magmom 的离子，以原子为中心的 magmom 无法准确反映其原子电荷，CHGNet 将从环境中推断电荷，类似于其他 MLIP 的功能。

还可以通过结合其他电荷表示方法来进一步增强模型，例如电子定位函数、电极化和基于原子轨道的划分。这些方法可用于潜在空间中的原子特征工程。

总之，CHGNet 能够实现基于电荷的原子模拟，适合使用大规模计算模拟来研究异价体系，从而扩大了计算化学、物理学、生物学和材料科学中电荷转移耦合现象的研究机会。

论文链接：https://www.nature.com/articles/s42256-023-00716-3

人工智能 × [ 生物神经科学数学物理化学材料 ]

「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。

欢迎关注标星，并点击右下角点赞和在看。

点击阅读原文，加入专业从业者社区，以获得更多交流合作机会及服务。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章