Small Methods: 机器学习加速纳米材料的发现和设计

机器学习算法在计算机视觉、自然语言处理、语音识别等计算机技术领域取得了很多突破性的进展,从而受到人们的广泛关注。这些人工智能算法,尤其是新兴的深度学习算法被快速移植和运用到医疗诊断、药物发现、量子物理、计算化学等众多相关的领域,并取得了令人瞩目的成果。在纳米材料的发现和设计领域,机器学习算法也得到了一些关注,如发现新的纳米材料和预测纳米材料的结构-性质 (QSPR) 关系和材料的构效 (QSAR) 关系等。与常规计算模拟的方法不同,机器学习算法主要依靠机器从先前的试验数据(包括失败的实验数据)中学习特征并用来预测新的特性,因此可以大大节约时间和人力成本。尽管如此,机器学习算法对训练数据的类型和任务非常敏感,而且新兴的深度学习性能过于依赖于训练样本数量的大小。针对纳米材料训练数据集自身的特点,如样本量小、不均匀、数据类型多样性等,如何利用机器学习算法来高效、正确地预测纳米材料特性,已成为相关学者研究的热点。

新加坡南洋理工大学材料科学与工程学院陈晓东教授课题组在Small Methods上发表了题为“Nanomaterials Discovery and Design through Machine Learning”的随笔文章,总结并展望了机器学习算法,特别是深度学习算法在纳米材料领域中的应用及方法。文章首先回顾和总结了典型的监督学习、无监督学习、半监督机器学习算法在纳米材料研究领域中的应用及常规流程。然后,针对纳米材料的设计和应用领域,归纳总结了新兴的深度学习算法所带来的变化,例如,自动化的特征工程、多模态和多维度的学习方法、端到端的研究模式等。最后,进一步提炼了机器学习算法在纳米材料应用中的技术挑战,如纳米材料训练数据集的构建和模型可解释性等问题,并对未来发展提出了新的展望。相关文章发表在Small Methods (DOI: 10.1002/smtd.201900025) 上。

Speak Your Mind