JMCA|监督和非监督机器学习复合框架加速新型合金催化材料发现

全屏阅读

2022-11-15 08:11:45 作者: 所属分类:学术动态, 未分类 阅读: 1,907 views

氨气选择性催化氧化反应是面向机动车和工业场景中废弃氨气消除的关键技术手段。贵金属催化剂的低氮气选择性限制了其进一步应用,通过对合金结构的理性设计优化其活性和和选择性是提升其应用价值的重要手段。尽管监督学习方法已经在大批量的材料数据分析和材料设计领域取得了巨大的成功,但是其对数据标签的要求无疑增加了计算或实验研究成本;非监督学习的聚类方法可以实现对无标签数据的快速分析,有效降低材料开发成本,但其无标签特性也限制了其预测精度。

基于此,来自华中科技大学的单斌和陈蓉教授团队与贵研铂业股份有限公司张爱敏研究员团队合作,在国际知名期刊Journal of Materials Chemistry A上发表题为“Rational ensemble design of alloy catalysts for selective ammonia oxidation based on machine learning”的研究文章。该研究文章耦合监督和非监督机器学习建立了面向催化材料高通量研究框架,实现了面向氨气选择性催化剂合金结构的理性设计(如图1所示)。

首先基于开发的催化反应过程的高通量建模、计算和分析软件,实现特征-结合能数据集的自动化构建;其次结合集成学习方法建立了面向氨气选择性氧化反应中间物种结合能的高精度预测模型;进而提取反应中间物种结合能作为非监督学习模型特征集,建立了一个两步的K-means聚类分析模型,实现对研究材料空间的快速筛选和分析;最后结合理论计算对聚类分析结果进行了验证。

图1 高通量计算-机器学习-理论验证的研究框架加速材料发现

要点一:耦合监督和非监督机器学习的催化材料高通量研究框架

基于开发的面向催化反应过程的高通量建模、计算和分析软件,高通量计算研究体系的相关反应物种结合能作为进一步监督学习的预测目标,结合特征构建与特征分析手段,建立面向该类参数的高精度且普适的预测模型,实现面向更大材料空间的目标参量快速预测。

将反应中间物种的结合能作为目标反应催化性能聚类分析模型的特征,结合特征相关性分析和降维等方法以及少量领域知识,建立面向目标反应催化性能研究的多步聚类预测模型。最后挑选少量代表性体系进行理论验证。该研究框架耦合高通量计算、监督和非监督机器学习,可以实现小计算成本下对复杂性质的快速预测。

图2. 耦合监督和非监督机器学习的催化材料高通量研究框架

要点二:基于集成学习的反应物种结合能预测

基于开发的催化反应过程的高通量建模、计算和分析软件,首先批量化构建了Ag、Au、Cu、Ir、Pd、Pt和Rh低指数晶面上具有不同表面掺杂原子数目的合金构型以及氨气选择催化氧化过程关键中间物种(NH3、NH2、NH、N、O、OH和H)的吸附构型;进一步高通量计算对应结合能并自动分析优化后结构去除重复构型等;自动提取表面原子、吸附原子和结合位点的本征原子信息作为特征,构建特征-结合能数据集。

结合特征相关性和重要性分析发现集合表面、吸附物和结合位点信息的特征具有较好的独立性以及与目标量的相关性。结合随机森林回归、极限树回归以及梯度提升决策树回归等集成学习方法建立了面向氨气选择性氧化反应中间物种结合能的高精度预测模型,其中梯度提升决策树模型具有最好的泛化能力,其测试集上MAE仅为0.122 eV,RMSE为0.179eV,(如图3所示)。

图3 面向氨气选择氧化中间物种结合能预测的集成学习模型

要点三:基于聚类分析的合金结构快速筛选

将氨气选择性氧化反应的关键中间物种(NH3、NH2、NH、N、O、OH和H)的结合能作为新的特征,构建训练面向该类催化反应性能预测的特征空间。过去已知性能的纯金属体系作为领域知识也加入数据集,为聚类分析得到的各簇提供简单的属性标记。首先针对该类特征的相关性分析发现,不同物种的结合能存在较强的线性相关,因此引入主成分分析方法(PCA)降低特征相关性和维度。

研究发现,仅前两个主成分即可具备原特征空间超过93%的方差信息,因而进一步基于这两个主成分构成的新特征空间建立聚类分析模型。我们建立了一个2步3簇的K-means聚类分析模型(如图4所示):第一步将所有数据分成3类,其中具有优异性能的Pt、Pd和Cu体系均被归属在C13类,因此选取C13簇作为第二次聚类分析的数据集;进一步发现具有活性优异的Pt、Pd落在C21簇,兼顾活性和选择性的Cu(100)归属于C22簇,具有较差活性和选择性的Cu(111)归属于C23簇。因此我们可以快速判定C22簇内体系应该具有与Cu(100)相似的属性,即具有兼顾活性和选择性。

图4 基于反应中间物种结合能的催化性能聚类分析模型

要点四:理论计算验证筛选催化体系

针对聚类分析筛选得到的体系,我们基于简易氨气选择性催化氧化机理进行理论计算验证。基于过去的研究成果,我们选择氧原子辅助的氨气分解以及三种主要产物的生成步骤构成的简单机理作为全反应网络的代表,计算了各个基元步的反应热和反应势垒。对于C21簇,我们选取距离簇中心最近的两个体系作为典型代表进行研究(见图5a和5b),发现两体系均展示较优的氨气转化活性和选择性。

对于C22簇,我们选取距离中心最近以及Cu(100)最近的共两个体系作为代表(见图5c和5d),研究发现,两个体系具有比C21簇代表体系更优异的活性和选择性。另外距离C23簇中心的研究体系被发现催化性能比较差。因此我们认为归属于C22簇的结构是更具实际应用价值的高效的氨气选择性氧化催化体系。这进一步验证了两步聚类分析模型的有效性。

尽管简单的聚类分析不能保证得到的所有体系都具有优异的催化性能,但是却可以将潜在的材料空间尺寸缩小数个数量级,极大降低研发成本,为材料的理性设计提供一种快速的解决方案。

图5. 针对典型构型的简化反应机理计算