港大&谷歌提出GO-NeRF:在NeRF中生成协调且高质量的3D对象

这篇具有很好参考价值的文章主要介绍了港大&谷歌提出GO-NeRF:在NeRF中生成协调且高质量的3D对象。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

港大&谷歌提出GO-NeRF:在NeRF中生成协调且高质量的3D对象,AIGC,AIGC,3D对象,算法框架

尽管在3D生成方面取得了进展,但在作为NeRF表示的现有3D场景中直接创建3D对象仍然是未经探索的。这个过程不仅需要高质量的3D对象生成,还需要将生成的3D内容无缝地合成到现有的NeRF中。为此,作者提出了一种新方法,GO-NeRF,能够利用场景上下文进行高质量和谐调的3D对象生成,将其嵌入到现有的NeRF中。方法采用了一个组合渲染公式,允许通过学到的3D感知不透明度图将生成的3D对象无缝地合成到场景中,而不会引入意外的场景修改。此外,还开发了定制的优化目标和训练策略,以增强模型利用场景上下文和减轻源于场景中3D对象生成的浮动物等的能力。在前馈和360°场景上进行的大量实验证明了GO-NeRF在生成与周围场景谐调的合成对象以及合成高质量新视图图像方面的卓越性能。

开源地址:https://daipengwa.github.io/GO-NeRF/

近年来,在使用神经辐射场(NeRF)进行可重渲染的现实环境重建方面取得了巨大的进展。与此同时,文本引导的对象生成在创造新颖的3D内容方面表现出显著的潜力。在这项工作中,研究了一个新颖的问题:生成与给定的3D现实场景谐调的3D对象。这种能力对于新场景的创建和编辑至关重要,要求将生成的内容无缝地组合到环境中,并确保在下游应用中获得高度沉浸式的体验。

主要贡献

主要贡献如下:

• 引入了GO-NeRF,这是一种新颖的流程,可以通过文本提示生成与上下文兼容的3D虚拟对象,并将其无缝地嵌入到预训练的神经辐射场中,同时保留不变的场景上下文,并与任意NeRF表示法兼容,适用于现有场景。

• 开发了考虑场景上下文的学习目标和正则化器,实现了高质量、无浮动物体的3D合成和与场景谐调组合,以创建新的3D场景。

• 实验结果展示了方法利用场景上下文进行虚拟对象生成的能力,在前馈和360°数据集上均优于先前的方法。

算法框架

从输入文本提示中生成给定3D NeRF场景内虚拟对象的流程。该流程始于创建一个3D边界框来定义修改区域。这个过程可以通过使用界面在渲染图像上点击三个点来自动化完成。接下来,引入了一个用于场景中生成对象的组合渲染流程。具体而言,从预定义的透视图中将场景辐射场渲染成RGB-D图像;通过在3D框中优化对象NeRF来生成新的对象。为了获得最终的渲染结果,基于预渲染的RGB-D图像和优化后的不透明度映射,将对象和场景进行合成。最后,描述了精心设计的损失函数和训练策略(具体损失公式见原文),这些策略指导了优化过程,并确保了在场景中生成协调一致的对象。方法的概览如下图2所示。

港大&谷歌提出GO-NeRF:在NeRF中生成协调且高质量的3D对象,AIGC,AIGC,3D对象,算法框架

左图:提供了一个用户友好的界面,用于在预训练场景NeRF中选择生成区域。具体而言,用户只需在图像平面上点击三个点,界面将通过透视投影和叉积运算返回场景中的3D边界框。右图:分离了场景渲染(上)和对象生成(下),然后在NeRF的输出空间中将它们合成。场景渲染使用预定义的相机C将场景NeRF渲染成RGB-D图像(S,D)。对象生成在3D框内优化神经辐射场,并通过体积渲染生成RGB图像和不透明度映射。随后,通过优化后的不透明度映射将场景和生成的内容混合,生成最终输出。在优化过程中,设计了损失函数和训练策略,以确保高质量和与场景谐调的结果。

效果展示

定性比较

在前馈和360度场景上将我们的方法与其他基线进行比较。第一行显示了3D框和相应的2D mask,其他行显示了不同方法的结果。Blended-NeRF往往会产生不真实和不谐调的结果,例如水果飞在天空中。Spin-NeRF∗在风格化场景和视角变化较大的360度场景中失败。类似地,手动放置既繁琐又存在利用场景上下文的问题。我们的方法在所有场景中表现良好,能够生成具有不同风格的猫和桌子上带有阴影的水果,以促进谐调。在最后一行的右下方,可视化了经过优化的不透明度图,准确描述了生成内容的轮廓。

港大&谷歌提出GO-NeRF:在NeRF中生成协调且高质量的3D对象,AIGC,AIGC,3D对象,算法框架

港大&谷歌提出GO-NeRF:在NeRF中生成协调且高质量的3D对象,AIGC,AIGC,3D对象,算法框架

港大&谷歌提出GO-NeRF:在NeRF中生成协调且高质量的3D对象,AIGC,AIGC,3D对象,算法框架

定量比较

此表显示了CLIP分数,表明生成的内容与文本之间的匹配程度。GO-NeRF遥遥领先。

港大&谷歌提出GO-NeRF:在NeRF中生成协调且高质量的3D对象,AIGC,AIGC,3D对象,算法框架

使用不同的文本提示提供更多结果:

港大&谷歌提出GO-NeRF:在NeRF中生成协调且高质量的3D对象,AIGC,AIGC,3D对象,算法框架

当使用参考图像作为引导时,生成的对象的样式会跟随参考图像:

港大&谷歌提出GO-NeRF:在NeRF中生成协调且高质量的3D对象,AIGC,AIGC,3D对象,算法框架

我们的方法在mask区域内生成所需的对象,而不引入意外的场景修改。其他图像修复方法改变了场景内容,比如白线和道路表面。

港大&谷歌提出GO-NeRF:在NeRF中生成协调且高质量的3D对象,AIGC,AIGC,3D对象,算法框架

总结

GO-NeRF,这是一种新颖的方法,通过在现有的场景级NeRF中直接生成受文本控制的3D对象,迈出了重要一步。为了实现这一目标,采用了与量身定制的优化目标和训练策略相关的组合渲染公式,用于合成无缝嵌入现有场景的3D对象。方法利用了预训练的文本引导图像修补网络的图像先验,以促进对象及其周围环境的谐调生成。实验结果显示了我们的方法在前馈和360度数据集中的优越性能。希望我们的研究能在这个领域激发更多的工作。

参考文献

[1] GO-NeRF: Generating Virtual Objects in Neural Radiance Fields

链接:https://arxiv.org/pdf/2401.05750

更多精彩内容,请关注公众号:AI生成未来

港大&谷歌提出GO-NeRF:在NeRF中生成协调且高质量的3D对象,AIGC,AIGC,3D对象,算法框架文章来源地址https://www.toymoban.com/news/detail-800688.html

到了这里,关于港大&谷歌提出GO-NeRF:在NeRF中生成协调且高质量的3D对象的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 谷歌推出了一种名为提示扩展(Prompt Expansion)的创新框架,旨在帮助用户更轻松地创造出既高质量又多样化的图像。

    谷歌推出了一种名为提示扩展(Prompt Expansion)的创新框架,旨在帮助用户更轻松地创造出既高质量又多样化的图像。 论文标题 : Prompt Expansion for Adaptive Text-to-Image Generation 论文链接 : https://arxiv.org/pdf/2312.16720.pdf 文本到图像生成模型能够根据文本提示创造相应图像,但这通常需

    2024年02月03日
    浏览(35)
  • 探索谷歌的Certificate Transparency Go库:透明、安全的HTTPS时代

    项目地址:https://gitcode.com/google/certificate-transparency-go 在数字证书世界中,保证HTTPS的安全性是至关重要的。然而,传统的证书验证机制存在潜在缺陷,可能导致中间人攻击。为了解决这一问题,谷歌推出了Certificate Transparency(CT)项目,并提供了一个强大的Go语言实现—— cer

    2024年04月16日
    浏览(21)
  • Go:实现SMTP邮件发送订阅功能(包含163邮箱、163企业邮箱、谷歌gmail邮箱)

    需求很简单,就是用户输入自己的邮箱后,使用官方邮箱给用户发送替邮件模版 邮件模版类似如下图发来的欢迎加入的模版 这里我们使用html格式存储模版,上图源码如下 选择好官方邮箱来开启smtp服务,这里我测试验证了163邮箱、163企业邮箱、谷歌gmail邮箱和腾讯企业邮箱(

    2024年02月08日
    浏览(46)
  • 为什么需要协调能力?如何提高协调能力?

    协调能力指的是协作与调和,属于综合性能力的体现,涉及到表达,沟通,逻辑等方面,在日常生活中缺乏协调能力,也许影响并不太大,但是如果在职业发展中,协调能力就尤为重要,尤其是某些职业岗位,对协调能力有更高的要求。 在我们的职业生涯中,团队协作是永恒

    2024年02月07日
    浏览(35)
  • Java中生成二维码

    代码如下:

    2023年04月17日
    浏览(29)
  • MATLAB中生成矩阵的方法

    MATLAB中生成矩阵的方法 在MATLAB中,有多种方法可以生成矩阵。这些方法可以根据具体需求选择,包括手动创建、使用内置函数和生成特定类型的矩阵。下面将介绍一些常用的方法,并提供相应的源代码示例。 手动创建矩阵 手动创建矩阵是最基本的方法之一。您可以直接在代

    2024年02月07日
    浏览(27)
  • 分布式协调组件Zookeeper

    ZooKeeper 是⼀种 分布式协调组件 ,用于管理大型主机。 在分布式环境中协调和管理服务是一个复杂的过程 。ZooKeeper 通过其简单的架构和 API 解决了这个问题。ZooKeeper 允许开发人员专注于核心应用程序逻辑,而不必担心应用程序的分布式特性。 分布式协调组件 在分布式系统

    2024年02月13日
    浏览(33)
  • Java中生产者消费者模型

    在Java中,生产者消费者模型是一种常见的多线程编程模型,用于解决生产者和消费者之间的数据交互问题。 生产者(Producer)负责生成数据,并将数据放入共享的缓冲区(队列)中。消费者(Consumer)从缓冲区中获取数据并进行处理。生产者和消费者是两个独立的角色,彼此

    2024年02月11日
    浏览(22)
  • 在CMD脚本中生成空心字

    程序启动时,需要通过串口向外打印信息,想在信息最前面打印一个log,如下图所示: 使用pip安装pyfiglet,如下: 安装成功后如下图: 运行以下代码即可生成相应的空心字: 可以更改颜色、字体、格式 Python控制台输出艺术字

    2024年02月10日
    浏览(25)
  • 【Python】 Python中生成随机整数

    在Python中生成一到一百随机整数是一项基本任务,不仅可以帮助我们进行调试和演示,还可以用于生成测试数据或进行随机化实验。在本篇文章中,我们将从多个方面对如何在Python中生成一到一百随机整数进行详细阐述,并给出代码示例。 Python标准库中的random模块可以帮助我

    2024年02月07日
    浏览(51)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包