Redian新闻
>
Npj Comput. Mater.: 聚簇描述—机器学习法实现外推

Npj Comput. Mater.: 聚簇描述—机器学习法实现外推

公众号新闻

海归学者发起的公益学术平台

分享信息,整合资源

交流学术,偶尔风月

热电材料可以将热能转化为电能,除了在能量采集、热电制冷和热力发电机等领域有着广泛的应用前景,也是处理工业废热的环保手段,甚至可以用于人体可穿戴的体温供能。


Fig. 1 Interpolation results of XGB that was the best prediction model in the interpolation problems to predict the thermoelectric properties of the 5205 observations in the ESTM dataset.


现有的热电材料主要是合金及其衍生的各种掺杂体系。目前理论预测热电材料有两种方法,传统的以密度泛函计算为代表的量化计算方法和基于数据挖掘或数据驱动发现的机器学习法。由于密度泛函法的计算量会随着粒子的增加而指数增大,因此难以用于面向大体积超胞的掺杂材料的热电性质预测。

 

Fig. 2 The overall process of SIMD to generate the material representations for an input tabular data of the materials.


机器学习法虽然已经有了不少从材料的化学组分预测物理性质的报道,但是除了缺乏公用的数据集,而且还存在外推问题:虽然训练得到的预测模型可以使数据集中材料的化学组成与热电性质之间很好地匹配,但是要外推到完全未知的材料,其预测准确率就迅速降低。对于热电材料,材料化学组成的描述不准确,比如没有考虑基质与掺杂之间的关联作用是外推问题的主要原因。

 

Fig. 3 The overall process of SIMD to generate the system identified features of the input chemical composition in the transfer learning environments.


来自韩国化工研究所的Gyoung S.Na和Hyunju Chang教授团队在公用数据集、机器学习法应用和外推问题的解决上都进行了创新性探索。他们首先建立了一个包含5205个实验观测对象的公用数据集,其中有880种独立的热电材料和包含品质因子在内的五种实验测得的热电性质。


Fig. 4 Confusion matrices of XGBd and SXGBd in the highthroughput screening to discover high-ZT (≥1.5) thermoelectric materials from unknown material groups.


随后他们对比了五种机器学习算法的预测结果,发现XGB法在四种热电性质预测中实现了0.9以上的R2值,同时也发现了外推的低效率问题(R2值小于0.2)。因此他们提出了一种材料描述子。将数据集中不同掺杂但基质组成类似的材料识别出来并归于一簇,提取相关物理与化学信息来构成这种系统识别的材料描述子(system-identified material descriptor,SIMD),并且作为机器学习法的输入参数。利用这种描述子,不但高通量筛选的假阳性可以被降低50%以上,而且针对未参与训练的热电材料的ZT值外推预测,也可以将R2值从原来的0.13显著提高到0.71。

 

Fig. 6 Experimentally measured and predicted ZTs of Ag- and Ti-doped Bi0.5Sb1.5Te3 materials.


作者的研究证明了在机器学习法给出的预测模型中,对输入条件的描述越准确,该模型就越接近客观现实,从而外推结果也就越可靠。这种材料描述子除了有助于提高未知材料性质的预测准确率和材料空间的高通量搜索效率,同时也是聚类分析同机器学习互相结合的典范。


该文近期发表于npj Computational Materials 8:214(2022)英文标题与摘要如下,点击左下角“阅读原文”可以自由获取论文PDF。


撰文:陈昊鸿 (中国科学院上海硅酸盐研究所 副研究员,从事透明光功能材料及相关计算模拟研究)




A public database of thermoelectric materials and system-identified material representation for data-driven discovery


Gyoung S. Na & Hyunju Chang 


Thermoelectric materials have received much attention as energy harvesting devices and power generators. However, discovering novel high-performance thermoelectric materials is challenging due to the structural diversity and complexity of the thermoelectric materials containing alloys and dopants. For the efficient data-driven discovery of novel thermoelectric materials, we constructed a public dataset that contains experimentally synthesized thermoelectric materials and their experimental thermoelectric properties. For the collected dataset, we were able to construct prediction models that achieved R2-scores greater than 0.9 in the regression problems to predict the experimentally measured thermoelectric properties from the chemical compositions of the materials. Furthermore, we devised a material descriptor for the chemical compositions of the materials to improve the extrapolation capabilities of machine learning methods. Based on transfer learning with the proposed material descriptor, we significantly improved the R2-score from 0.13 to 0.71 in predicting experimental ZTs of the materials from completely unexplored material groups.


扩展阅读

 
Npj Comput. Mater.: “工艺-结构-性能”—谁知其中不确定性?
Npj Comput. Mater.: 原子间势—准确性和可迁移性
Npj Comput. Mater.: 优质金属零件的打印—人类智能增强的机器学习
Npj Comput. Mater.: 稳定半导体材料的发现—深度学习-DFT
本文系网易新闻·网易号“各有态度”特色内容
媒体转载联系授权请看下方

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
会议预告 | 首届机器学习与统计会议暨中国现场统计研究会机器学习分会成立大会Npj Comput. Mater.: 二维过渡金属单卤化物—超导和拓扑态甘地是希特勒的好朋友?Npj Comput. Mater.: 优质金属零件的打印—人类智能增强的机器学习Npj Comput. Mater.: 2D过渡金属单卤化物—如此超导和拓扑态Npj Comput. Mater.: 反铁磁遇到铁电—也有心灵感应洛杉矶海边Npj Comput. Mater.: 稳定半导体材料的发现—深度学习-DFT世界公认最牛学习方法!《费曼学习法》(漫画版)火爆上线!清华学霸的高效学习手册!Npj Comput. Mater.: 局部原子邻域描述符—无损压缩[电脑] [第八届机王争霸赛]专业MOD组——X-Computer by JETH-DESIGNNpj Comput. Mater.: “工艺-结构-性能”—谁知其中不确定性?美国哥伦比亚学院计算机科学副学士专业(Computer Science AAS)简介Npj Comput. Mater.: 氧化物中的拓扑态—如何不再众里寻她千百度?Npj Comput. Mater.: 沸石—大规模精确模拟匹兹堡记事 - 2022.12.27 不能凑合的公寓Npj Comput. Mater.: 玻璃结构预测—懂物理的机器学习沁园春 雪Npj Comput. Mater.: 原子尺度成像—机器学习的亚像素处理Npj Comput. Mater.: “鱼与熊掌”可以兼得—兼具高精度、高速度的分子动力学!Npj Comput. Mater.: 多主元素合金硬度—集成神经网络模型Npj Comput. Mater.: 让马儿跑得又快又准—晶格热导率预测重访西班牙(7)-迦太基的司令部Npj Comput. Mater.: 轨道耦合—调控谷能带和激子劈裂Npj Comput. Mater.: 搭乘“特快列车”的异相催化原子模拟Npj Comput. Mater.: 表面合金化学吸附—d带中心模型能否适用?Npj Comput. Mater.: 带电膜的力学和电化学—新理论、新诠释Npj Comput. Mater.: 单原子催化剂动态电荷转移—找CeO2试一下第三届 冇(Mǎo)国际青年影像周 开始征片啦!Npj Comput. Mater.: 原子间势—准确性和可迁移性Npj Comput. Mater.: 拌水泥的高科技—机器学习为混凝土配方而设计一文详解Prompt学习和微调(Prompt Learning & Prompt Tuning)Npj Comput. Mater.: 自由电子金属—原来可以这样做电子关联!Npj Comput. Mater.: DFT中的电子密度—等变图神经网络Npj Comput. Mater.: 单原子催化剂—动态电荷转移模型
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。