Npj Comput. Mater.: 局部原子邻域描述符—无损压缩
海归学者发起的公益学术平台
分享信息,整合资源
交流学术,偶尔风月
计算能力的提高使得运用量子力学方法对材料进行精确建模成为可能,从而可以有效地研究材料的化学转化。然而,计算模拟的一个主要缺陷在于其在很大程度上受到建模尺寸和时间尺度的限制。经验势方法使得计算速度加快了几个数量级,同时计算成本与原子数量成线性关系。近年来,机器学习势的出现让精确度和可移植性都有了显著的提升。势的拟合以及更加广泛的材料机器学习均需对材料结构进行数学描述,并将其作为模型的输入。然而,目前使用的许多原子描述符在规模上随着化学元素数量S的增加而急剧增大,因而在应用上受到极大的限制。例如,体序描述符(如三体SOAP功率谱和多体序ACE)的长度随着NS的ν 次方增大,其中ν + 1是体序,N是密度展开式中径向基函数的数量。
来自英国剑桥大学工程系的James P. Darby等人,介绍了两种非数据驱动的方法来压缩SOAP功率谱。首先,通过考虑功率谱中密度展开式系数的恢复能力,证明了对于S和N都能进行无损压缩,因此描述符的长度可以从N2S2数量级降低至NS数量级。其次,通过引入一个普适的SOAP内核,将不依赖于元素的总密度和径向投影相结合也实现了压缩。最后,作者使用数值测试评估了这些压缩后的描述符在各种数据集中的性能。该研究提出的压缩思想可以与以往的技术相结合,这对于在给定情况下选择合适的压缩方法至关重要。
Compressing local atomic neighbourhood descriptors
James P. Darby, James R. Kermode & Gábor Csányi
Many atomic descriptors are currently limited by their unfavourable scaling with the number of chemical elements S e.g. the length of body-ordered descriptors, such as the SOAP power spectrum (3-body) and the (ACE) (multiple body-orders), scales as (NS)ν where ν + 1 is the body-order and N is the number of radial basis functions used in the density expansion. We introduce two distinct approaches which can be used to overcome this scaling for the SOAP power spectrum. Firstly, we show that the power spectrum is amenable to lossless compression with respect to both S and N, so that the descriptor length can be reduced from O(N2S2) to O(NS). Secondly, we introduce a generalised SOAP kernel, where compression is achieved through the use of the total, element agnostic density, in combination with radial projection. The ideas used in the generalised kernel are equally applicably to any other body-ordered descriptors and we demonstrate this for the (ACSF).
扩展阅读
微信扫码关注该文公众号作者