Advanced Materials:机器学习在掺杂元素筛选中的应用

掺杂工程是增强光电催化分解水的重要手段。然而关于掺杂元素的筛选仍然严重依赖于试错法:这既浪费了大量时间和成本,也浪费了大量看似无用(即低活性掺杂)的数据。快速发展的数据科学研究为我们研究光电催化的掺杂工程提供了很好的工具,比如机器学习的方法。

昆士兰大学王连洲教授课题组与麻省理工Shijing Sun研究员创新性地报道了一种利用机器学习发掘有效金属掺杂过程中杂原子地筛选指标,这包括金属离子地价态、离子半径和金属-氧键强。基于随机森林(Random Forest, RF)模型机器学习方法被从成功建立,其有效性也得到了验证,同时基于SHAP值分析的模型解析可以有效筛选对模型其关键性因素地参数。

图1展示了本工作的研究思路:基于金属氧化物半导体(这里以Fe2O3为例)的金属离子参杂,我们首先需要构建包含各种金属离子结构参数的数据库(S);另外还需构建各种掺杂改性后的光电响应数据库(P)。这里数据库S包含了10种与金属离子结构相关的本征参数;数据库P包含了各种掺杂条件下的水氧化光电流与电荷分离情况。

【图1】 本文研究思路。

接下来,我们利用机器学习种的不同模型对数据库S-P的关系进行回归分析,并以模型的均方差(RMSE)作为模型可靠性的衡量标准(图2)。结果显示RF模型对光电极的电荷分离结果的预测具有最高的可靠性。为了进一步检验RF模型的可靠性,我们进一步对尚未报道的La-和Y-掺杂的Fe2O3的光生电荷分离与迁移的能力进行研究部,发现其与预测结果具有较高的匹配度。

【图2】数据库的构建与机器学习的过程。

为了进一步认识决定金属离子掺杂有效性的关键结构参数,我们对RF模型进行了SHAP值分析(图3),得出金属离子的价态、离子半径大小和金属-氧键强与掺杂后电荷分离与传递能力密切相关。相对较高的掺杂金属价态有利于提升载流子浓度,另外较大的离子半径结合较高的金属-氧键有利于减小掺杂带来的结构缺陷:以上都会增强电荷的分离与迁移能力。以上关于离子价态、半径和金属-氧键强的影响在CuO体系中也得到了验证

【图3】对于机器学习模型的SHAP值分析

 

英文题目Machine Learning Guided Dopant Selection for Metal Oxide-Based Photoelectrochemical Water Splitting: The Case Study of Fe2O3 and CuO

所有作者英文全名。Zhiliang Wang, Yuang Gu, Lingxia Zheng, Jingwei Hou, Huajun Zheng, Shijing Sun*, Lianzhou Wang*

Advanced Materials

DOI: 10.1002/adma.202106776

原文链接:https://onlinelibrary.wiley.com/doi/full/10.1002/adma.202106776

【推文内容形式参考】

以下推文仅供写作参考。推文内容可长可短,无硬性要求:

1. https://mp.weixin.qq.com/s/_KwgUXBeoczv4Kre2KKOlA

2. https://mp.weixin.qq.com/s/D47OXhcoGaz5H45AbvBEmw