Npj Comput. Mater.: 材料信息学门槛高,AlphaMat带你找门道!
海归学者发起的公益学术平台
分享信息,整合资源
交流学术,偶尔风月
计算材料科学不仅使理论工作摆脱了解析推导的束缚,而且对实验研究方法作了根本性改革,更有利于研究人员从实验现象中揭示和确认客观规律。目前,很多材料计算软件已将计算材料科学以实用工具的形式带给了大众,使没有受过理论训练的实验人员也能够作第一性原理计算。因此,高通量计算逐渐发展成为一种常规方法,并加速了材料(有机和无机晶体、单分子和金属合金)和性能(带隙、形成能、离子电导率)数据库的发展。
这些数据库的建立和共享为“第四科学范式”和“第四次工业革命”的出现奠定了基础,即“数据驱动的材料发现”,其关键思想是大数据、人工智能和材料科学的紧密结合。人工智能在材料科学中的效能正以惊人的速度增长,在许多材料系统中取得了显著的成功,例如电池材料、光伏材料、催化材料、仿生材料。正如材料计算软件的开发一样,开发结合材料科学和人工智能的基础设施,恰逢其时,非常必要,这样使材料研发专家能更高效地应用人工智能方法。但目前来说,材料信息学工具总体而言还有进一步改进的巨大空间,如用户仍需掌握程序编写能力、现有模型功能还不完善等问题。
材料信息学紧密结合了材料科学、计算机科学、人工智能等,为建立材料信息化平台以支持常用的材料数据预处理功能和人工智能算法、降低对计算机编程技能的要求以使材料科学家应用人工智能建模提高效率,加快材料科学发展提供了重要途径。
来自上海交通大学人工智能与微结构实验室的李金金教授团队,融合材料计算工具和人工智能建模方法,开发了材料信息学一体式平台AlphaMat,能支持材料建模的整个周期(数据采集→数据预处理→特征工程→模型建立→参数优化→模型评估→结果分析),具备90多个常用AI功能。并在12个常用的材料性能建模中得到了应用。作者使用AlphaMat在电子带隙、热导率、吸附能上构建了不同的机器学习模型,并利用训练好的模型发现了491种潜在的光伏材料、78种电极材料、9种固态电解质、58种导热材料和39种锂硫电池正极材料等。作者通过AlphaMat,用户可以很容易在任何数据规模上构建人工智能模型,以发现和设计高性能材料。遵循交互、可扩展、高效和智能的原则,AlphaMat联合其他材料领域科学家构建的工具包,可为编程能力不强的科研人员提供便捷的AI设计工具,将加速材料科学、计算机科学、物理和化学科学的发展。未来,AlphaMat将不断迭代更新,内嵌更多的机器学习方法、特征工程方法和模型评估方法,通过数据工程和材料知识工程的深度结合,有望成为材料科学研究的必备工具,对于促进AI for Science的发展具有重要意义。
Fig. 1 Overview of AlphaMat.
Fig. 2 Architecture of AlphaMat.
AlphaMat: a material informatics hub connecting data, features, model, and application
Zhilong Wang, An Chen, Kehao Tao, Junfei Cai, Yanqiang Han, Jing Gao, Simin Ye, Shiwei Wang, Imran Ali & Jinjin Li.
The development of modern civil industry, energy and information technology is inseparable from the rapid explorations of new materials. However, only a small fraction of materials being experimentally/computationally studied in a vast chemical space. Artificial intelligence (AI) is promising to address this gap, but faces many challenges, such as data scarcity and inaccurate material descriptors. Here, we develop an AI platform, AlphaMat, that can complete data preprocessing and downstream AI models. With high efficiency and accuracy, AlphaMat exhibits strong powers to model typical 12 material attributes (formation energy, band gap, ionic conductivity, magnetism, bulk modulus, etc.). AlphaMat’s capabilities are further demonstrated to discover thousands of new materials for use in specific domains. AlphaMat does not require users to have strong programming experience, and its effective use will facilitate the development of materials informatics, which is of great significance for the implementation of AI for Science (AI4S).
Fig. 3 Material discovery through C1, R2, and R7 models established by AlphaMat.
扩展阅读
微信扫码关注该文公众号作者