WIREs Computational Molecular Science:机器学习加速能源材料的模拟和设计

研发更高效清洁且廉价的能源材料对解决当前能源危机具有重大意义。高通量模拟计算能够加快能源材料的设计与研发,但其存在计算成本较高的缺点。结合大数据挖掘技术,以机器学习为核心算法的人工智能技术能够为能源材料的模拟与设计带来新的曙光。在这篇综述中,来自苏州大学的李有勇教授课题组总结了机器学习催化,光电,锂电池以及MOF等能源材料中的应用,并介绍了一种通用的机器学习在能源材料模拟和设计中的研究范式。

首先作者总结了机器学习在能源材料领域应用的一般流程:主要分为四个步骤:一是数据搜集,包括从实验、模拟和数据库中获取;二是数据选择,包括格式优化、噪点消除和特征提取;三是机器学习方法选择,包括监督学习、半监督学习和无监督学习;四是模型选择,包括交叉验证、集成和异常检测。在实际的新材料研发中,人工智能技术已经在文献数据获取、性能预测、测试结果分析等各环节展现出巨大优势。

催化材料在光解水制氢,二氧化碳还原以及燃料电池等新能源技术中发挥着重要的作用。对于新型催化材料的模拟与设计,机器学习可以准确预测多种催化材料对重要中间产物的吸附能以实现对新型催化剂的筛选,同时机器学习可以实现对纳米颗粒的吸附位点进行预测。在这些过程中,机器学习可以大幅减少对DFT计算的需求,从而节省了高通量筛选的成本。另外,在催化反应过渡态搜寻的研究中,机器学习算法跳过DFT计算准确预测鞍点能量从而大幅加速NEB计算过程,这对于加速催化过程的模拟有着重要意义。

对于光伏材料,机器学习可以跳过DFT来准确预测钙钛矿材料的带隙以及形成能等关键参数进而实现对钙钛矿材料的全空间搜索,同时在训练模型的过程中,对各个描述符的权重的分析能够帮助我们进一步对这种材料构效关系的理解。对于有机光伏材料,一方面可以利用机器学习的生成模型自动生成有潜力的高效分子,另一方面利用合适的数据提取与表达方式可以实现直接从分子结构预测光电转化效率,这对于设计新的有机光电分子具有很大意义。

对于锂离子电池材料,利用机器学习可以实现对新型固态电解质材料的分类与筛选。在机器学习以及DFT计算的辅助下,对上万种锂离子电池固态电解质的高通量筛选已能轻松实现。

在以上应用于能源材料的机器学习模型中,我们可以看到机器学习的引入大大地降低了对能源材料进行高通量计算筛选的成本,加速了材料的研发过程。同时对于机器学习所构建模型的分析还能够进一步加深我们对材料构效关系的理解,探索新的理论模型。

相关文章以“Simulation and design of energy materials accelerated by machine learning”为题,发表在 WIREs Comput. Mol. Sci.(DOI: 10.1002/wcms.1421)上,文章第一作者为苏州大学功能纳米与软物质研究院汪鸿帅博士。