Small Methods: 机器学习加速发现新型铁电光伏钙钛矿和材料描述符

功能材料的研发是工业创新的基石,如何按需高效构筑材料一直是科学研究的热点与难点。传统的材料研发模式通常为试错法,这种方法耗时良久,且对于一些成因复杂的特性往往难以成功。上世纪下半叶,计算机理论模拟成为了材料开发的新工具,但限于计算能力不足,利用计算模拟来设计新材料也仍摆脱不了试错法的窠臼。在上述背景下,机器学习(machine learning)技术被引入到材料设计和材料数据库的构建中来,高效的计算和筛选效率使得机器学习技术成为材料设计的理想“助推器”。更为重要的是,机器学习技术可以从材料数据库中挖掘出材料的构效关系,从而加深对材料“基因”的理解,为材料描述符的发展开辟新的道路。

近期,东南大学物理学院王金兰教授课题组针对寻找铁电光伏材料这一现实问题,结合机器学习算法和DFT高通量计算,提出了一种多目标、多步骤的材料筛选策略。对稳定性、铁电极化、合适带隙这三个目标性质,分别采用机器学习中的分类算法和回归算法对19841种无机钙钛矿结构进行逐层筛选,最终成功选出了151种同时满足三个目标性质的铁电光伏材料。值得一提的是,在对钙钛矿稳定性进行筛选的分类过程中,通过特征工程,首次提出了针对混X位无机钙钛矿结构稳定性的几何描述符,一方面扩展了传统描述符容忍因子和氧八面体因子的适用范围,另一方面,利用它们进一步提升了机器学习预测准确率。这一结果表明,在寻找复杂体系描述符的过程中,除了依赖研究者的经验和直觉,机器学习中的特征工程也可以发挥重要作用。

相关研究成果发表在Small Methods(DOI: 10.1002/smtd.201900360)上。