InfoMat:机器学习在聚合物材料信息学中的应用

作者:曹元成团队

聚合物已广泛应用于储能、消防、医药等领域,从塑料包装等日常产品到锂离子电池、太阳能电池和消防灭火剂,日益成为材料科学中不可缺少的重要领域。然而聚合物的单体结构、链段排列及合成工艺的复杂性、多样性等给研究人员带来了巨大的挑战。目前聚合物研究主要是以大量实验为指导,以低效的”试错法”为基础,极大地阻碍了聚合物材料的创新效率。

随着人工智能的兴起和大型数据资源的集成,以材料数据为驱动力的人工智能技术为材料科学与工程的发展开辟了一条新路。新兴的聚合物信息学试图通过使用基于可靠数据的算法模型来加速新聚合物的性能预测和工艺优化。机器学习是人工智能(AI)的一个子领域,近年来发展迅速,擅长处理高维数据并总结规律,具有强大的分类和回归能力。机器学习技术的快速应用为聚合物领域带来了新的机遇。

图1 机器学习应用于聚合物开发的概念图

聚合物信息学的发展仍处于起步阶段,还拥有很大的提升空间,包括扩增数据集、完善特征工程和开发机器学习模型等。为了探索并更好地了解机器学习在聚合物领域中的应用,华中科技大学电气科学与工程学院程时杰院士、曹元成教授(通讯作者)与计算机学院路松峰教授等人就近年来人工智能技术在聚合物材料学方面的代表性研究进展进行了分析和概括,重点介绍了聚合物信息学机器学习的实现过程,强调了数据驱动方法在新型优良聚合物的发现中的优势,并从数据、算法和计算能力三个方面阐述了聚合物信息学未来的发展方向。该工作在InfoMat上以题为“Machine learning in polymer informatics”在线发表(DOI: 10.1002/inf2.12167)。

我们摘取了文章里的几部分重点给大家做个介绍:

1. 机器学习算法的总体类别

图2机器学习算法的总体分类

机器学习可大体分为监督学习、非监督学习和强化学习。监督学习意味着训练数据包含输出标签以实现数据分类或回归,例如支持向量机和人工神经。如果数据中没有输出标签,则这种机器学习称为无监督学习,可以实现数据聚类或维数缩减,如 K-means 聚类和主成分分析。强化学习是一种迭代过程,如马尔可夫决策过程和主动学习等,智能体通过一定的决策行为与环境交互,不断改变自身状态,并使目标奖赏值最大化。整体来看,机器学习的成功应用需要适当的算法和足够的数据。

2. 机器学习应用实例

2.1 机器学习助力聚合物建模和分析

材料建模和模拟计算逐渐成为解释实验现象的必要手段。分子动力学模拟、密度泛函理论等仿真方法为聚合物领域积累了大量的计算结果。机器学习模型可以从这些计算结果中挖掘潜在规律,总而助力聚合物的建模和分析,减少计算开销,加快模拟计算的速度。

图3机器学习应用于聚合物电解质研究。(A)图神经网络模型的结构。(B)聚合物电解质的结构。(C)机器学习模型总结出的聚合物电解质中锂离子存在的4种状态。(D)每种锂离子存在状态之间的转换比例。每个柱的高度表示从状态i到状态 j 的转变占整个锂离子传导的百分比。误差条代表 95% 的置信区间。

2.2 机器学习助力聚合物性质预测

应用机器学习方法预测复杂聚合物材料及其复合材料的理化性质已成为一个新兴领域。例如,Kim等人建立了一个数据库,总结了854种不同聚合物的组分和特性。其特性跨越多个长度尺度,从原子类型到侧链和主链原子的比例,从而准确描述特定聚合物的理化性质。该数据库包括DFT计算结果(形成能、能带结构、介电常数等)和实验数据(如渗透性、玻璃化转变温度和机械强度)。然后,他们创建了一个信息平台,利用基于高斯过程回归的机器学习模型将聚合物的组分结构和理化性质联系起来,并利用数据库进行训练,达到预测聚合物性能的目的。上述工作已开通相关网站(www.polymergenome.org)做进一步研究。

2.3机器学习助力新型聚合物设计合成

图4主动学习模型发现新型聚合物的思路框架。

玻璃化转变温度是聚合物最重要的特性之一,与高分子的微观链段运动和宏观力学特性有关。如何在广阔的组成和结构空间中有效地指导实验成为了寻找新型聚合物的关键挑战。Kim等人将主动学习框架与高斯过程回归算法相结合,有效地筛选出玻璃化转变温度大于一定阈值的聚合物。

2.4 机器学习助力聚合物表征

聚合物的组成和结构通常通过气相色谱、核磁共振和红外光谱等表征方法进行推断。每一个表征方法都有对应的精度和长度尺度,不同表征方法之间的信息是互补的。如果能够对大量聚合物材料的表征信息进行多模态融合,其丰富且全面的信息有助于加速聚合物科学规律的发现。机器学习对高纬数据的挖掘和整合能力,可以统一模拟、合成、表征等聚合物的开发步骤,对材料进行系统、全面、快速的分析,识别缺陷,发现规律,从而反馈指导材料合成方法和工艺参数的优化,加速构建模型和实验之间的关联,从而有力推动聚合物的研发。

3.展望

以机器学习为代表的人工智能拥有比人脑更大的存储空间和更快的计算能力,可以处理更广阔的数据资源,更擅长从高维数据中发现复杂的知识,将成为加速高分子材料研发的有力工具,其应用潜力也可以扩展到其他材料学研究领域,如新型锂电池消防灭火剂设计、固态电解质开发、极端环境条件下材料服役性能与评测技术等。材料研究人员通过学习并掌握这一工具,能更快更好的推动材料科学与工程的发展。

该工作发表在InfoMat(DOI: 10.1002/inf2.12167)上。

个人简介: 华中科技大学电气与电子工程学院曹元成教授“储能安全技术”团队通过构建和开发材料基因工程与人工智能交叉前沿技术,解决我国电力与能源领域绿色、安全领域的关键痛点,实现高安全低成本电化学储能关键材料与技术、退役电池绿色资源化、锂电池储能系统消防安全技术与装备等领域。团队负责人曹元成教授先后获批湖北省 “百人计划”,“黄鹤英才”,已经发表包括Materials Today、Nano Energy、Joule 等在内SCI期刊科研论文100余篇。