Transformer-M:一个能理解2D和3D分子的Transformer

这篇具有很好参考价值的文章主要介绍了Transformer-M:一个能理解2D和3D分子的Transformer。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

ONE TRANSFORMER CAN UNDERSTAND BOTH 2D & 3D MOLECULAR DATA


目录

总结

一、Introduction

二、Transformer-M

三、Experiment

1. PCQM4Mv2 performance (2D)

2. PDBBIND performance (2D&3D)

3. QM9 performance (3D)

4. Ablation study

Impact of the pre-training tasks:

Impact of mode distribution:

四、Conclusion

参考(具体细节见原文)


总结

        今天给大家介绍的是来自北京大学贺笛团队和微软在arXiv发表的预印本《ONE TRANSFORMER CAN UNDERSTAND BOTH 2D & 3D MOLECULAR DATA》。为了实现跨模态处理分子任务,作者开发了一种新的基于Transformer的分子模型Transformer-M。它可以将2D或3D格式的分子数据作为输入,并生成有意义的语义表示。通过对2D和3D分子数据进行训练,Transformer-M学习来自不同数据模式的知识并正确捕获表征。Transformer-M可以同时在2D和3D任务中实现较强的性能,表明其具有广泛的适用性。


一、Introduction

        化学与视觉和语言等传统领域的一个关键区别是数据的多模态。在视觉和语言中,数据通常以特定的形式进行描述。例如,图像被定义为像素网格中的RGB值,而句子被定义为句子中的字词。与视觉和语言数据通常具有固定的格式不同,分子可以使用不同的化学方法进行表征。比如,可以将分子视为2D图,也可以将其定义为位于3D空间中的原子集合。然而,以往的工作大多集中于设计2D或3D结构的神经网络模型,导致一种形式的模型无法应用到另一种形式的任务中。因此作者开发了Transformer-M,一个基于Transformer的多功能分子模型,它在2D和3D分子表征学习中都表现良好。

二、Transformer-M

        如图1所示,Transformer-M的主干网络是由标准的Transformer块组成的。作者开发了两个单独的通道来编码2D和3D结构信息。2D通道使用度编码、最短路径距离编码和从2D图结构中提取的边编码。最短路径距离编码和边编码反映了一对原子之间的空间关系和键的特征,在softmax注意中用作偏置项。度编码被添加到输入层的原子特征中。

        对于3D通道,作者使用3D距离编码对3D几何结构中原子之间的空间距离进行编码。每个原子对的欧氏距离通过高斯核函数编码,并将在softmax注意中用作偏置项。对于每个原子,我们将其与所有其他原子之间的3D距离编码相加,并将其添加到输入层的原子特征中。

        除了两个结构通道中的参数外,Transformer-M中的所有其他参数(例如,自注意和前馈网络)对于不同的数据模式是共享的。在训练过程中,当batch中的数据是2D图时,2D通道将被激活,3D通道将被禁用。类似地,当batch中的数据是3D几何结构时,3D通道将被激活,而2D通道将被禁用。当二维和三维信息同时给出时,两个通道都将被激活。

Transformer-M:一个能理解2D和3D分子的Transformer

图1:Transformer-M模型架构。在经典主干Transformer上建立了两个通道。红色通道对2D Graph的数据激活,包含度、最短路径距离和边缘信息。紫色通道对3D几何结构的数据激活,利用欧氏距离信息。不同的编码位于适当的模块中。

三、Experiment

        作者研究了三个具有代表性的任务:PCQM4Mv2 (2D)、PDBBind (2D&3D)和QM9 (3D)。使用OGBLSC(包含340万个2D和3D形式的分子)中的PCQM4Mv2数据集来预训练Transformer-M。预训练任务有两个,一个是训练模型预测2D和3D格式分子的HOMO-LUMO能级,另一个是专门设计针对3D数据的3D位置去噪任务。

1. PCQM4Mv2 performance (2D)

        在预训练之后,使用PCQM4Mv2的验证集上评估Transformer-M。PCQM4Mv2的验证集只包含2D分子数据。因此,可以用它来评估Transformer-M在2D分子数据上的表现。该任务的目标是预测HOMU-LUMO能级,评价指标是平均绝对误差(MAE)。

        由于训练目标包括HOMO-LUMO能级预测任务,所以不需要对模型参数进行微调。结果如表1所示,可以很容易地看到,Transformer-M性能大大超过了所有baseline,例如,与之前的最佳模型(GraphGPS)相比,MAE相对减少了8.2%。Transformer-M和Graphormer之间的唯一区别是,Graphormer仅对2D数据进行训练,而Transformer-M同时使用2D和3D结构信息进行训练。因此,可以得出结论,Transformer-M在2D分子数据上表现良好,共享参数的2D- 3D联合训练确实有助于模型学习更多的化学知识。

Transformer-M:一个能理解2D和3D分子的Transformer

 表1  PCQM4Mv2验证集的结果

2. PDBBIND performance (2D&3D)

        为了验证Transformer-M的兼容性,进一步对PDBBind数据集进行测试。PDBBind数据集由蛋白-配体复合物组成,这些数据是在生物测定实验中获得的,与pKa(或−log Kd,−log Ki)相关。每个数据提供了3D几何结构,并通过预定义规则构造2D图形结构。在PDBBind数据集上对微调模型进行了评估。评价指标包括Pearson相关系数(R)、平均绝对误差(MAE)、均方根误差(RMSE)和标准差(SD)。

        将Transformer-M与经典方法、基于CNN的方法和GNN的模型进行比较。所有实验都用不同的种子重复五次,报告平均性能。结果如表2所示,Transformer-M在所有评估指标上的表现都明显优于所有baseline,例如,Pearson相关系数(R)的绝对改善率为3.3%。值得注意的是,PDBBind数据集是蛋白-配体复合物,而Transformer-M是在简单分子上预训练的,这证明了Transformer-M的可迁移性。

Transformer-M:一个能理解2D和3D分子的Transformer

 2  PDBBind数据集的结果

3. QM9 performance (3D)

        使用QM9数据集评估Transformer-M在3D分子任务上的表现。QM9是由134万个稳定的有机小分子组成的量子化学基准。每个分子都与12个目标相关联,涵盖了它的能量、电子和热力学性质。作者随机选择了10,000和10,831个分子进行验证和测试评估,剩下的分子被用来微调Transformer-M。

        结果如表3所示,与这些baseline相比,Transformer-M取得了具有竞争力的性能,表明模型与3D分子数据兼容。特别地,Transformer-M在HUMO、LUMO和HUMO-LUMO预测上表现最好。这说明在预训练任务中学习到的知识能够更好地迁移到类似的任务中。该模型在其他一些任务上执行得不太好,作者认为Transformer-M可以在几个方面进行改进,包括采用精心设计的输出层或使用更多的自监督训练策略进行预训练。

Transformer-M:一个能理解2D和3D分子的Transformer

 3   QM9数据集的结果

4. Ablation study

Impact of the pre-training tasks:

        Transformer-M通过两个任务在PCQM4Mv2训练集上进行预训练:(1)预测2D和3D格式分子的HOMO-LUMO能级。(2)3D位置去噪。作者对PCQM4Mv2和QM9数据集进行了消融实验,以检查这两个目标是否有利于下游任务。作者进行了另外两个实验。第一个实验是在PCQM4Mv2和QM9上使用其2D数据和3D几何数据从头训练Transformer-M模型,以检查预训练方法的效果。第二个实验是对Transformer-M进行预训练,不使用3D去噪任务,以研究2D-3D联合预训练方法的有效性。结果如表4所示。可以看出,联合预训练显著提高了在两个数据集上的性能。此外,3D位置去噪任务也是有益的,特别是在QM9数据集上。

Transformer-M:一个能理解2D和3D分子的Transformer

 预训练任务的影响

Impact of mode distribution:

        为了训练Transformer-M,作者为每个数据提供了三种模式:(1)激活2D通道和禁用3D通道(2D模式);(2)激活3D通道,禁用2D通道(3D模式);(3)激活两个通道(2D&3D模式)。在训练过程中,每个数据的模式是根据预定义的分布随机绘制的,实现方法类似于Dropout。p2D, p3D, p2D& 3D为模式的概率,实验研究了不同模式分布对模型性能的影响。作者选择三个模式分布,p2D, p3D, p2D& 3D分别为1:1:1、1:2:2和1:2:1,结果如表5所示。可以看到模型在三种模式分布上的性能都显著超过了以前的工作。此外,在3D模式上使用稍微大一点的概率可以达到最好的效果。

Transformer-M:一个能理解2D和3D分子的Transformer

模式分布的影响

 

四、Conclusion

        在这项工作中,作者向通用分子模型迈出了第一步。提出的Transformer-M提供了一种很有前途的方法来处理2D和3D格式的分子任务。作者使用两个单独的通道对2D和3D结构信息进行编码,并将它们集成到主干Transformer中。当输入数据为特定格式时,相应的通道将被激活,而另一个通道将被禁用。通过对2D和3D分子数据的训练,模型能自动学习不同数据格式的化学知识,并正确捕获表征。大量的实验表明,Transformer-M可以同时在2D和3D任务中实现较强的性能。

        作者相信Transformer-M是一个起点,未来有更多的可能性去探索。例如,在这项工作中,作者使用了一种简单的方法,将2D和3D结构的结构信息进行线性组合,作者相信应该有其他有效的方法来融合这种编码。此外,模型还可以与以往的多视角对比学习方法相结合。如何使用这些方法对模型进行预训练是值得研究的。


参考(具体细节见原文)

原文链接:https://doi.org/10.48550/arXiv.2210.01765

代码:https://github.com/lsj2408/Transformer-M 文章来源地址https://www.toymoban.com/news/detail-459439.html

到了这里,关于Transformer-M:一个能理解2D和3D分子的Transformer的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【用unity实现100个游戏之4】手搓一个网格放置功能,及装修建造种植功能(2d3d通用,附源码)

    参考原视频链接 【视频】:https://www.youtube.com/watch?v=l0emsAHIBjU 注意 :本文为学习笔记记录,推荐支持原作者,去看原视频自己手敲代码理解更加深入

    2024年02月13日
    浏览(29)
  • Rdkit|分子3D构象生成与优化

    github; 地址 RDKit是一款非常强大的分子信息学工具包,其中包含了分子3D构象生成与优化的功能。通过RDKit,您可以将一个分子的2D结构转化为3D结构,并进行能量最小化优化,得到最稳定的构象。 基于距离(distance-based) 基于知识(knowledge-based) 下面是基本代码逻辑 传统的距

    2024年02月13日
    浏览(27)
  • MindSponge分子动力学模拟——定义一个分子系统(2023.08)

    在前面两篇文章中,我们分别介绍了分子动力学模拟软件MindSponge的软件架构和安装与使用教程。这里我们进入到实用化阶段,假定大家都已经在本地部署好了基于MindSpore的MindSponge的编程环境,开始用MindSponge去做一些真正的分子模拟的工作。那么分子模拟的第一步,我们就需

    2024年02月11日
    浏览(31)
  • Top 15 开源3D分子蛋白质建模与渲染软件

    如今,WebGL 是一种趋势技术,因为它允许开发人员使用现代浏览器作为客户端来创建复杂的 3D 交互式图形、游戏,而无需安装额外的插件、扩展或软件。 WebGL允许浏览器直接与GPU(图形处理单元)一起工作。 推荐:用 NSDT编辑器 快速搭建可编程3D场景 有多种 JavaScript 框架旨

    2024年02月09日
    浏览(34)
  • Stable Diffusion架构的3D分子生成模型 GeoLDM - 测评与代码解析

    之前,向大家介绍过3D分子生成模型 GeoLDM。 GeoLDM按照Stable Diffusion架构,将3D分子生成的扩散过程运行在隐空间内,优化了基于扩散模型的分子生成。可能是打开Drug-AIGC的关键之作。让精确控制分子生成有了希望。 详见:分子生成领域的stable diffusion - GEOLDM-CSDN博客) 作者提供

    2024年02月03日
    浏览(33)
  • 比最优技术快 8 倍:浙大侯廷军等人提出 ResGen,基于蛋白质口袋的 3D 分子生成模型

    作者:彬彬 编辑:李宝珠,三羊 浙江大学与之江实验室研究团队提出了一种基于蛋白质口袋 (protein pocket) 的 3D 分子生成模型——ResGen,与以往最优技术相比,速度提升 8 倍,成功地生成了具有更低结合能和更高多样性的类药物分子。 过去,创新药物的发现往往依赖于古早配

    2024年01月22日
    浏览(29)
  • 全网最全!RasMol 2.7.5.2 WIN版本,观看生物分子3D微观立体结构!软件安装包下载 安装教程步骤,以及使用教程!...

    重要提示: 如果大家需要下载各种科研软件,学习资源资料等等,关注下方公众号,号内有 详细的科研软件安装教程以及使用教程 噢~ 软件资源链接及软件解压密码 关注下方公众号 回复【软件名称】即可获取 本篇 【 RasMol 】 (ps: 复制 括号内红色的 回复,不

    2024年04月14日
    浏览(53)
  • 2D-3D配准指南[方法汇总]【入门指导向】(二)2D-3D MatchNet +pointnet

    近年来,采用三维和二维数据的应用层出不穷,它们都需要将 三维模型 与 二维图像 进行匹配。大型定位识别系统可以估算出照片拍摄的位置。在全球定位系统可能失灵的情况下,地理定位系统可以进行地点识别,对自动驾驶非常有用。此外,法医警察也可以利用该系统破案

    2024年02月05日
    浏览(32)
  • 【Web2D/3D】CSS3的2D/3D转换、过渡、动画(第一篇)

    1. 前言         本篇开始介绍Web2D和3D相关基础知识,会从CSS3的2D/3D转换、过渡、动画,讲到Canvas 2D图形绘制,再到SVG,最后到WebGL。         坐标系:左上点是坐标原点(0,0),x轴正方向向右,y轴正方向向下,z轴正方向向外(垂直屏幕向外)。 2. 2D转换         CSS3的2D/3D旋

    2024年02月04日
    浏览(37)
  • Unity3D:2D/3D 项目

    推荐:将 NSDT场景编辑器 加入你的3D工具链 3D工具集: NSDT简石数字孪生 无论是创建 2D 还是 3D 游戏,Unity 都很拿手。在 Unity 中创建新项目时,可以选择以 2D 或 3D 模式启动。您可能已经知道要构建什么,但有一些细微的要点可能会影响选择的模式。 选择是以 2D 还是 3D 模式启

    2024年02月07日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包