【AI+材料】JPCL:深度生成式模型逆向设计超导材料

这篇具有很好参考价值的文章主要介绍了【AI+材料】JPCL:深度生成式模型逆向设计超导材料。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

【AI+材料】JPCL:深度生成式模型逆向设计超导材料,华算科技,science,第一性原理,机器学习

自1911年Onnes发现超导后,寻找具有高临界温度(Tc)的新型超导材料一直是材料科学和凝聚态物理学研究的热点。在高成本的实验研究之前,已经有系统的计算工作来确定具有高Tc的Bardeen-Cooper-Schrieffer(BCS)超导体。

然而,由于计算和实验的成本问题,寻找具有高临界温度(Tc)的新型超导体一直是一项具有挑战性的任务。为此,美国国家标准与技术研究院材料测量实验室Daniel Wines等人提出了一种基于深度生成式模型的逆向设计方法来发现超导材料。这种方法超越了传统的材料筛选方法,并将引领下一代材料的逆向设计。


图文导读

在这项工作中,作者使用晶体扩散变分自编码器(Crystal Diffusion Variational Autoencoder,CDVAE)、原子线形神经网络(Atomistic Line Graph Neural Network,ALIGNN)预训练模型和联合自动化模拟数据库(Joint Automated Repository for Various Integrated Simulations,JARVIS),来生成新的超导体。

【AI+材料】JPCL:深度生成式模型逆向设计超导材料,华算科技,science,第一性原理,机器学习

图1:(a)逆向设计超导材料的流程;(b)在ALIGNN预测的Tc>3的化合物中,含有CDVAE生成结构的给定元素的概率

CDVAE主要用于周期性结构的生成。CDVAE由变分自编码器和扩散模型组成,扩散模型直接作用于结构的原子坐标,并使用等变图神经网络来确保不变性。CDVAE由三个同时训练的网络组成:

(1)编码器,它对潜在空间进行编码;(2)属性预测器,它对潜在空间进行采样并预测结构和组成;(3)解码器,是一个扩散模型,将随机初始化的原子类型去噪为与训练集分布相似的材料。

在这项工作中,作者使用来自JARVIS数据库的1058种DFT计算的超导材料数据集,训练了一个CDVAE模型(在潜在空间中优化Tc),并生成了数千种新的候选超导体。作者通过使用预训练的深度学习模型来进一步预测这些候选结构,以进行快速筛选。在缩小潜在候选超导体的范围后,作者进行了DFT计算来验证模型的预测,并评估了预测材料的动力学和热力学稳定性。

作者利用ALIGNN对每种材料的超导特性进行预测。ALIGNN是基于deep graph library和PyTorch开发的。在ALIGNN框架中,每个材料结构被表示为一个图,其中元素是节点,键是边。图中的每个节点分配了9个输入特征(第一电离能、电子亲和性、电负性、电阻值、价电子、基团数、共价半径和原子体积)。边的特征以原子距离表示,其中径向基函数的截止值为8 Å。在原子图的基础上,利用原子距离作为节点,化学键角作为边,构造线形图。

作者设置batch size为16,数据以90:5:5进行分割,并训练了300个epoch,在训练过程中不使用测试集,保持模型的超参数与原始ALIGNN相同。数据集来源于JARVIS。JARVIS是一个数据库和工具的集合,可以使用经典力场、密度泛函理论、机器学习、理论计算和实验来进行自动化的材料设计。JARVIS-DFT是一个基于密度泛函理论的数据库,包含超过75,000种材料,具有多种材料特性,如形成能、不同理论水平的带隙、太阳能电池效率、弹性模量、介电常数、压电模量、红外和拉曼光谱、剥离能、二维磁体和二维超导体等ALIGNN和CDVAE模型在1058个DFT计算数据上进行了训练。

完整的逆向设计工作流程如图1a所示。其中第一步包含了在1058个DFT计算数据集上训练CDVAE模型。在CDVAE逆向设计模型中,新的候选超导体需要优化的目标性质为Tc。在对JARVIS-SC数据进行训练后,作者使用CDVAE模型生成了3000个候选材料。对于如此大量的晶体结构,对所有候选材料进行DFT计算是不切实际的。因此,作者使用深度学习工具(ALIGNN)来筛选所有3000个候选材料。ALIGNN已经成功地预测了形成能和带隙以及最近的超导Tc等性质。

为了进一步研究这些候选物质,依据高Tc、潜在稳定性和金属特性(费米能级上的高密度态)的目的,作者建立了ALIGNN预测的筛选标准:Tc > 5K, 形成能(Eform)< 0 eV/atom,带隙(Egap)< 0.05 eV。虽然负的Eform是稳定性的严格要求,但仍然需要计算动力学和热力学稳定性来确认稳定性。在使用ALIGNN进行筛选后,作者发现61种材料符合这一标准。

然后,作者对这61种材料执行完整的DFT计算,并使用McMillan-Allen-Dynes方程计算Tc,发现32个结构的Tc在5K以上。通过对声子态密度和化学成分的研究,作者发现这些结构中有7个具有负声子频率,表明动力学不稳定。其余25种候选超导体如表1所示。

表1:25个候选超导体

【AI+材料】JPCL:深度生成式模型逆向设计超导材料,华算科技,science,第一性原理,机器学习

CDVAE模型具有生成新成分与结构的能力。图1b描述了在3000个CDVAE生成的结构中含有给定元素的化合物的ALIGNN预测Tc高于3k的概率。可以观察到,含有C、N、B、O、V、Mn、Nb、Ru和Ta的化合物在ALIGNN预测的Tc较高的结构中最为丰富,因为DFT训练集中有几个具有高Tc值的材料包含这样的元素。

虽然CDVAE结构中的元素丰度(ALIGNN预测Tc > 3 K)遵循与训练数据相似的趋势,但CDVAE候选结构并不局限于训练数据中已经存在的化学计量和晶体结构。图2说明了这一点,其中描述了3000个CDVAE生成的结构用于从JARVIS-DFT数据库中训练的1058个结构的化学公式、密度分布和堆积分数分布。图2a和d的对比强调了CDVAE生成的结构和来自JARVIS的训练数据在化学计量上的差异。

例如,在JARVIS训练集中,大部分数据只包含三种不同的原子种类(A、B、C),元胞的化学式类型有5种。相比之下,基于JARVIS训练集(见图2a)的CDVAE生成的数据具有许多包含四个原子种类(A、B、C、D)的结构和具有更多的化学式类型。

此外,CDVAE生成的数据包含大量的单元素结构,而这在训练集中不是一个普遍的组成部分。比较图2b-e和c-f,可以观察到CDVAE生成的结构和JARVIS训练数据之间密度和堆积分数的分布非常不同。具体而言,CDVAE生成的结构具有更大的低密度和堆积分布。这可能部分是由于CDVAE生成的结构的低对称性,这使得新生成的晶胞的晶体体积更大,因此密度和堆积分数更小。

【AI+材料】JPCL:深度生成式模型逆向设计超导材料,华算科技,science,第一性原理,机器学习

图2:CDVAE与JARVIS的数据对比

在讨论了CDVAE生成结构的结构和化学多样性之后,作者讨论使用ALIGNN和DFT预测Tc的工作流程的步骤。使用预训练的ALIGNN模型,作者可以过滤大量具有瞬时特性预测的CDVAE候选超导体。图3a-b描述了1058个JARVIS-DFT结构(用DFT计算的Tc)和3000个CDVAE结构(用ALIGNN预测的Tc)的分布。如图所示,Tc的分布有很大的不同。

最引人注目的是,CDVAE生成的数据中Tc接近于零(非超导)的结构数量非常少,而JARVIS训练集中的大量材料的Tc值接近于零。此外,CDVAE+ALIGNN的所预测的Tc分布更接近于高斯分布,大部分新生成结构的Tc值集中在2.5-6 K附近。这可以作为CDVAE模型在潜在空间中生成具有优化目标属性的新结构的证明。

【AI+材料】JPCL:深度生成式模型逆向设计超导材料,华算科技,science,第一性原理,机器学习

图3:(a-b)CDVAE与JARVIS的数据对比;(c-d)CDVAE候选材料的EPC参数关系

在用ALIGNN筛选了3000个CDVAE生成的结构之后,作者对符合ALIGNN筛选标准的61个候选结构进行了DFT验证,如图1a所示。在这个阶段,预训练的ALIGNN模型在预测这些新生成结构的Tc值方面取得了成功。

在61个结构中,54个结构的DFT计算Tc > 0.5K,这表明ALIGNN从CDVAE生成的结构中滤除超导材料的成功率为89%。在61个结构中,32个结构的DFT计算Tc > 5K,这表明ALIGNN从CDVAE生成的结构中过滤出Tc大于5K的材料的成功率为52%。就材料属性预测的深度学习模型而言,1058个结构是相对较少的训练数据。

训练集规模较小的原因是因为执行这些DFT计算需要大量的计算成本。原则上,可以通过在训练中增加更多的DFT计算来系统地改进ALIGNN对Tc的预测,这也是JARVIS正在进行的工作。在图3c和d中显示了进行DFT计算的61种材料的EPC参数(λ,ωlog,Tc)之间的关系。图3c描述了λ和ωlog之间的反比关系,在图3d中,可以观察到λ和Tc之间存在某种正相关关系。这些都是BCS超导体的典型行为,并在BCS块体和二维超导体的研究中被观察到。

从图3c-d的颜色图中可以清楚地看出,高λ和ωlog的平衡是材料具有高Tc的必要条件。表1给出了候选超导材料的化学成分、Tc、每个原子的形成能和凸包以上的能量。从表中可以看出,25种结构均有负的形成能。负的形成能虽然是热力学稳定的必要前提,但并不能保证热力学稳定。因此,作者计算了凸包上方的能量(如表1所示)。从JARVIS-DFT中不同相的形成能中计算了这些结构的凸包。可以观察到15个结构在0.45 eV或更低的能量范围内,这些结构是最有可能被实验合成的。

图4给出了这15种材料的原子结构(VN2、MnN、VN、BN2Zr、NP2Sr、TaP2、AlN2Zr、NbRh、AlN2V(I)、TiO2NbN、NBaP、ScO3Zr、Al2N、AlN2V(II)、TiN)。虽然这15种材料在凸包上的能量在0.0~0.43 eV/原子之间,表明热力学稳定性仍不能保证,但它们仍有可能被合成。

【AI+材料】JPCL:深度生成式模型逆向设计超导材料,华算科技,science,第一性原理,机器学习

图4:候选超导材料的结构图

验证CDVAE逆向设计方法的成功,重要的是要评估生成材料的化学成分和晶体结构的多样性,不仅要考虑训练数据,还要考虑更大的化学空间区域。在前25个候选超导体中,有20个化学成分并不包含在CDVAE的训练集中。MnN、VN、AlN2Zr、NbRh和TiN是训练集的一部分,并且在相关文献中都被发现具有超导相。

尽管这五种候选化合物与训练集中的化合物具有相似的化学性质,但除了NbRh(与JVASP-20529具有相同的结构)之外,它们都具有完全不同的晶体结构。由于JARVIS数据库的材料较少(JARVIS的主要重点是扩展材料的属性和准确性)。作者检查了Materials Project(超过150,000个结构)和OQMD(超过1,000,000个结构)。此外,作者搜索了文献,看看这些材料是否被合成过。作者还检索了Supercon数据,其中包括超过16,000种实验实现的超导材料。

作者在前25个候选CDVAE和Supercon数据库中没有发现共同的材料。这进一步证明了CDVAE方法可以生成具有特定所需性质的独特材料,覆盖以前未发现的化学空间总结与展望在这项工作中,作者使用了一个多步骤的工作流程,结合了生成模型、深度学习属性预测和DFT来发现下一代超导材料。作者证明了使用ALIGNN模型的深度学习特性预测,可以在DFT验证和实验研究之前即时预测新生成材料的特性来加速寻找新的超导体。作者发现了25种新的候选超导体,其中15种结构稳定性好,Tc值高达20.2 K。该方法超越了传统材料筛选的工作流程,并允许新材料的逆向设计,填充以前未发现的化学空间。


文献信息

Daniel Wines, Tian Xie, Kamal Choudhary. Inverse Design of Next-Generation Superconductors Using Data-Driven Deep Generative Models.&nbsp;Journal of Physical Chemistry Letters&nbsp;14, 6630-6638 (2023)
文章来源地址https://www.toymoban.com/news/detail-830372.html

到了这里,关于【AI+材料】JPCL:深度生成式模型逆向设计超导材料的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 深度生成模型之GAN优化目标设计与改进 ->(个人学习记录笔记)

    1. JS散度度量问题 不合适的度量准则 2. 梯度问题 梯度消失与不稳定 1. 最小二乘损失GAN Least Squares GAN, 惩罚生成器生成的远离决策面的样本,即可将样本拉近决策面,从而可避免梯度消失问题 2. Energy-based GAN(EBGAN) 使用自编码器学习样本重建,生成器作为自编码器的正则项,

    2024年02月03日
    浏览(44)
  • Uibot (RPA设计软件)Mage AI智能识别(发票识别)———课前材料五

     微信群发助手机器人的小项目友友们可以参考小北的课前材料二博客~   (本博客中会有部分课程ppt截屏,如有侵权请及请及时与小北我取得联系~) 紧接着小北的前两篇博客,友友们我们即将开展新课的学习~ RPA 培训前期准备指南——安装Uibot(RPA设计软件)-CSDN博客https://bl

    2024年01月23日
    浏览(39)
  • 设计模式深度解析:AI大模型下的策略模式与模板方法模式对比解析

    ​🌈 个人主页: danci_ 🔥 系列专栏: 《设计模式》《MYSQL应用》 💪🏻 制定明确可量化的目标,坚持默默的做事。 策略模式与模板方法模式对比解析         在人工智能的世界里,设计模式不仅是构建高效、可维护代码的秘密武器,也是理解和掌握大模型内在机制的钥

    2024年04月08日
    浏览(79)
  • Logo Diffusion——基于sd绘画模型的AI LOGO 生成器,5分钟教会你设计超高端logo

    距离上次给大家推荐的AI LOGO生成器,也就才过了一个多月的时间,转眼AI又进化了,本期要给大家分享又一个最新“天菜级别”的AInbsp;LOGO生成神器—— Logo Diffusion 。 由于这款AI工具实在太火了,以至于网站都崩溃了,与过往分享的AInbsp;LOGO生成器最大的区别在于,这款AI工具

    2024年02月04日
    浏览(70)
  • 标题:探索AI绘画:使用深度学习生成艺术

    正文: 随着计算机技术的发展,人工智能在各个领域取得了显著的成果。 通过训练深度学习模型,AI可以学习大量的艺术作品,从而生成具有独特风格和创意的新作品。 本文将介绍如何使用 Python 和 TensorFlow 实现一个简单的AI绘画程序。   二、技术介绍 深度学习 :深度学习

    2024年04月11日
    浏览(37)
  • 基于深度学习的AI生成式人脸图像鉴别

    AIGC(AI内容生成)技术的快速发展确实为创作者提供了高效生产力工具,但同时也引发了一些问题和挑战。这些技术可以生成以假乱真的图像、视频换脸等,给不法分子提供了滥用的机会。其中,一些不法分子可能利用AIGC技术制造虚假新闻、违反版权、绕过活体身份验证、散

    2024年02月10日
    浏览(37)
  • AI:115-基于深度学习的创意广告图像生成

    🚀点击这里跳转到本专栏,可查阅专栏顶置最新的指南宝典~ 🎉🎊🎉 你的技术旅程将在这里启航! 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践都有参考学习意义。 ✨✨✨ 每一个案例都附带有在本地跑过的关键代码,详细讲

    2024年03月13日
    浏览(42)
  • AIGC-AI内容生成深度产业报告

    随着人工智能技术的不断发展和进步,AI内容生成已经成为了一个热门的应用领域。其中,AIGC(AI Generated Content)是最为典型的应用之一。AIGC是指通过人工智能技术生成的各种文本、图像、音频、视频等各种形式的内容,被广泛应用于新闻、广告、电商、游戏、文学、艺术等

    2024年02月03日
    浏览(58)
  • 【AI】深度学习与图像描述生成——看图说话(1)

    还记得我闲来无事,用大模型来“洗图”吗,就是想抄袭别人的图,但是又要装作原创的样子。因为洗稿大家都熟悉,洗图其实也是一样的。 【AIGC】今天想用AI“洗个图”,失败了,进来看我怎么做的-CSDN博客 【AIGC】接着昨天的AI“洗图”骚操作,继续调戏国产大模型_aigc

    2024年01月25日
    浏览(70)
  • 深度学习系列60: 大模型文本理解和生成概述

    参考网络课程:https://www.bilibili.com/video/BV1UG411p7zv/?p=98spm_id_from=pageDrivervd_source=3eeaf9c562508b013fa950114d4b0990 包含理解和分类两大类问题,对应的就是BERT和GPT两大类模型;而交叉领域则对应T5 传统IR方法BM25基于tf-idf,介绍如下 根据单词去匹配有两类问题:有时候同一个词有很多意

    2024年02月22日
    浏览(36)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包