【AI+材料】JPCL：深度生成式模型逆向设计超导材料-Toy模板网

这篇具有很好参考价值的文章主要介绍了【AI+材料】JPCL：深度生成式模型逆向设计超导材料。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

【AI+材料】JPCL：深度生成式模型逆向设计超导材料,华算科技,science,第一性原理,机器学习

自1911年Onnes发现超导后，寻找具有高临界温度（Tc）的新型超导材料一直是材料科学和凝聚态物理学研究的热点。在高成本的实验研究之前，已经有系统的计算工作来确定具有高Tc的Bardeen-Cooper-Schrieffer（BCS）超导体。

然而，由于计算和实验的成本问题，寻找具有高临界温度（Tc）的新型超导体一直是一项具有挑战性的任务。为此，美国国家标准与技术研究院材料测量实验室Daniel Wines等人提出了一种基于深度生成式模型的逆向设计方法来发现超导材料。这种方法超越了传统的材料筛选方法，并将引领下一代材料的逆向设计。

图文导读

在这项工作中，作者使用晶体扩散变分自编码器（Crystal Diffusion Variational Autoencoder，CDVAE）、原子线形神经网络（Atomistic Line Graph Neural Network，ALIGNN）预训练模型和联合自动化模拟数据库（Joint Automated Repository for Various Integrated Simulations，JARVIS），来生成新的超导体。

图1：（a）逆向设计超导材料的流程；（b）在ALIGNN预测的Tc>3的化合物中，含有CDVAE生成结构的给定元素的概率

CDVAE主要用于周期性结构的生成。CDVAE由变分自编码器和扩散模型组成，扩散模型直接作用于结构的原子坐标，并使用等变图神经网络来确保不变性。CDVAE由三个同时训练的网络组成：

（1）编码器，它对潜在空间进行编码；（2）属性预测器，它对潜在空间进行采样并预测结构和组成；（3）解码器，是一个扩散模型，将随机初始化的原子类型去噪为与训练集分布相似的材料。

在这项工作中，作者使用来自JARVIS数据库的1058种DFT计算的超导材料数据集，训练了一个CDVAE模型（在潜在空间中优化Tc），并生成了数千种新的候选超导体。作者通过使用预训练的深度学习模型来进一步预测这些候选结构，以进行快速筛选。在缩小潜在候选超导体的范围后，作者进行了DFT计算来验证模型的预测，并评估了预测材料的动力学和热力学稳定性。

作者利用ALIGNN对每种材料的超导特性进行预测。ALIGNN是基于deep graph library和PyTorch开发的。在ALIGNN框架中，每个材料结构被表示为一个图，其中元素是节点，键是边。图中的每个节点分配了9个输入特征（第一电离能、电子亲和性、电负性、电阻值、价电子、基团数、共价半径和原子体积）。边的特征以原子距离表示，其中径向基函数的截止值为8 Å。在原子图的基础上，利用原子距离作为节点，化学键角作为边，构造线形图。

作者设置batch size为16，数据以90：5：5进行分割，并训练了300个epoch，在训练过程中不使用测试集，保持模型的超参数与原始ALIGNN相同。数据集来源于JARVIS。JARVIS是一个数据库和工具的集合，可以使用经典力场、密度泛函理论、机器学习、理论计算和实验来进行自动化的材料设计。JARVIS-DFT是一个基于密度泛函理论的数据库，包含超过75,000种材料，具有多种材料特性，如形成能、不同理论水平的带隙、太阳能电池效率、弹性模量、介电常数、压电模量、红外和拉曼光谱、剥离能、二维磁体和二维超导体等ALIGNN和CDVAE模型在1058个DFT计算数据上进行了训练。

完整的逆向设计工作流程如图1a所示。其中第一步包含了在1058个DFT计算数据集上训练CDVAE模型。在CDVAE逆向设计模型中，新的候选超导体需要优化的目标性质为Tc。在对JARVIS-SC数据进行训练后，作者使用CDVAE模型生成了3000个候选材料。对于如此大量的晶体结构，对所有候选材料进行DFT计算是不切实际的。因此，作者使用深度学习工具（ALIGNN）来筛选所有3000个候选材料。ALIGNN已经成功地预测了形成能和带隙以及最近的超导Tc等性质。

为了进一步研究这些候选物质，依据高Tc、潜在稳定性和金属特性（费米能级上的高密度态）的目的，作者建立了ALIGNN预测的筛选标准：Tc > 5K, 形成能（Eform）< 0 eV/atom，带隙（Egap）< 0.05 eV。虽然负的Eform是稳定性的严格要求，但仍然需要计算动力学和热力学稳定性来确认稳定性。在使用ALIGNN进行筛选后，作者发现61种材料符合这一标准。

然后，作者对这61种材料执行完整的DFT计算，并使用McMillan-Allen-Dynes方程计算Tc，发现32个结构的Tc在5K以上。通过对声子态密度和化学成分的研究，作者发现这些结构中有7个具有负声子频率，表明动力学不稳定。其余25种候选超导体如表1所示。

表1：25个候选超导体

【AI+材料】JPCL：深度生成式模型逆向设计超导材料,华算科技,science,第一性原理,机器学习

CDVAE模型具有生成新成分与结构的能力。图1b描述了在3000个CDVAE生成的结构中含有给定元素的化合物的ALIGNN预测Tc高于3k的概率。可以观察到，含有C、N、B、O、V、Mn、Nb、Ru和Ta的化合物在ALIGNN预测的Tc较高的结构中最为丰富，因为DFT训练集中有几个具有高Tc值的材料包含这样的元素。

虽然CDVAE结构中的元素丰度（ALIGNN预测Tc > 3 K）遵循与训练数据相似的趋势，但CDVAE候选结构并不局限于训练数据中已经存在的化学计量和晶体结构。图2说明了这一点，其中描述了3000个CDVAE生成的结构用于从JARVIS-DFT数据库中训练的1058个结构的化学公式、密度分布和堆积分数分布。图2a和d的对比强调了CDVAE生成的结构和来自JARVIS的训练数据在化学计量上的差异。

例如，在JARVIS训练集中，大部分数据只包含三种不同的原子种类（A、B、C），元胞的化学式类型有5种。相比之下，基于JARVIS训练集（见图2a）的CDVAE生成的数据具有许多包含四个原子种类（A、B、C、D）的结构和具有更多的化学式类型。

此外，CDVAE生成的数据包含大量的单元素结构，而这在训练集中不是一个普遍的组成部分。比较图2b-e和c-f，可以观察到CDVAE生成的结构和JARVIS训练数据之间密度和堆积分数的分布非常不同。具体而言，CDVAE生成的结构具有更大的低密度和堆积分布。这可能部分是由于CDVAE生成的结构的低对称性，这使得新生成的晶胞的晶体体积更大，因此密度和堆积分数更小。

【AI+材料】JPCL：深度生成式模型逆向设计超导材料,华算科技,science,第一性原理,机器学习

图2：CDVAE与JARVIS的数据对比

在讨论了CDVAE生成结构的结构和化学多样性之后，作者讨论使用ALIGNN和DFT预测Tc的工作流程的步骤。使用预训练的ALIGNN模型，作者可以过滤大量具有瞬时特性预测的CDVAE候选超导体。图3a-b描述了1058个JARVIS-DFT结构（用DFT计算的Tc）和3000个CDVAE结构（用ALIGNN预测的Tc）的分布。如图所示，Tc的分布有很大的不同。

最引人注目的是，CDVAE生成的数据中Tc接近于零（非超导）的结构数量非常少，而JARVIS训练集中的大量材料的Tc值接近于零。此外，CDVAE+ALIGNN的所预测的Tc分布更接近于高斯分布，大部分新生成结构的Tc值集中在2.5-6 K附近。这可以作为CDVAE模型在潜在空间中生成具有优化目标属性的新结构的证明。

【AI+材料】JPCL：深度生成式模型逆向设计超导材料,华算科技,science,第一性原理,机器学习

图3：（a-b）CDVAE与JARVIS的数据对比；（c-d）CDVAE候选材料的EPC参数关系

在用ALIGNN筛选了3000个CDVAE生成的结构之后，作者对符合ALIGNN筛选标准的61个候选结构进行了DFT验证，如图1a所示。在这个阶段，预训练的ALIGNN模型在预测这些新生成结构的Tc值方面取得了成功。

在61个结构中，54个结构的DFT计算Tc > 0.5K，这表明ALIGNN从CDVAE生成的结构中滤除超导材料的成功率为89%。在61个结构中，32个结构的DFT计算Tc > 5K，这表明ALIGNN从CDVAE生成的结构中过滤出Tc大于5K的材料的成功率为52%。就材料属性预测的深度学习模型而言，1058个结构是相对较少的训练数据。

训练集规模较小的原因是因为执行这些DFT计算需要大量的计算成本。原则上，可以通过在训练中增加更多的DFT计算来系统地改进ALIGNN对Tc的预测，这也是JARVIS正在进行的工作。在图3c和d中显示了进行DFT计算的61种材料的EPC参数（λ，ωlog，Tc）之间的关系。图3c描述了λ和ωlog之间的反比关系，在图3d中，可以观察到λ和Tc之间存在某种正相关关系。这些都是BCS超导体的典型行为，并在BCS块体和二维超导体的研究中被观察到。

从图3c-d的颜色图中可以清楚地看出，高λ和ωlog的平衡是材料具有高Tc的必要条件。表1给出了候选超导材料的化学成分、Tc、每个原子的形成能和凸包以上的能量。从表中可以看出，25种结构均有负的形成能。负的形成能虽然是热力学稳定的必要前提，但并不能保证热力学稳定。因此，作者计算了凸包上方的能量（如表1所示）。从JARVIS-DFT中不同相的形成能中计算了这些结构的凸包。可以观察到15个结构在0.45 eV或更低的能量范围内，这些结构是最有可能被实验合成的。

图4给出了这15种材料的原子结构（VN2、MnN、VN、BN2Zr、NP2Sr、TaP2、AlN2Zr、NbRh、AlN2V(I)、TiO2NbN、NBaP、ScO3Zr、Al2N、AlN2V(II)、TiN）。虽然这15种材料在凸包上的能量在0.0~0.43 eV/原子之间，表明热力学稳定性仍不能保证，但它们仍有可能被合成。

【AI+材料】JPCL：深度生成式模型逆向设计超导材料,华算科技,science,第一性原理,机器学习

图4：候选超导材料的结构图

验证CDVAE逆向设计方法的成功，重要的是要评估生成材料的化学成分和晶体结构的多样性，不仅要考虑训练数据，还要考虑更大的化学空间区域。在前25个候选超导体中，有20个化学成分并不包含在CDVAE的训练集中。MnN、VN、AlN2Zr、NbRh和TiN是训练集的一部分，并且在相关文献中都被发现具有超导相。

尽管这五种候选化合物与训练集中的化合物具有相似的化学性质，但除了NbRh（与JVASP-20529具有相同的结构）之外，它们都具有完全不同的晶体结构。由于JARVIS数据库的材料较少（JARVIS的主要重点是扩展材料的属性和准确性）。作者检查了Materials Project（超过150,000个结构）和OQMD（超过1,000,000个结构）。此外，作者搜索了文献，看看这些材料是否被合成过。作者还检索了Supercon数据，其中包括超过16,000种实验实现的超导材料。

作者在前25个候选CDVAE和Supercon数据库中没有发现共同的材料。这进一步证明了CDVAE方法可以生成具有特定所需性质的独特材料，覆盖以前未发现的化学空间。总结与展望在这项工作中，作者使用了一个多步骤的工作流程，结合了生成模型、深度学习属性预测和DFT来发现下一代超导材料。作者证明了使用ALIGNN模型的深度学习特性预测，可以在DFT验证和实验研究之前即时预测新生成材料的特性来加速寻找新的超导体。作者发现了25种新的候选超导体，其中15种结构稳定性好，Tc值高达20.2 K。该方法超越了传统材料筛选的工作流程，并允许新材料的逆向设计，填充以前未发现的化学空间。

文献信息

Daniel Wines, Tian Xie, Kamal Choudhary. Inverse Design of Next-Generation Superconductors Using Data-Driven Deep Generative Models. Journal of Physical Chemistry Letters 14, 6630-6638 (2023)
文章来源地址https://www.toymoban.com/news/detail-830372.html

到了这里，关于【AI+材料】JPCL：深度生成式模型逆向设计超导材料的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！