[23] IPDreamer: Appearance-Controllable 3D Object Generation with Image Prompts

这篇具有很好参考价值的文章主要介绍了[23] IPDreamer: Appearance-Controllable 3D Object Generation with Image Prompts。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

[23] IPDreamer: Appearance-Controllable 3D Object Generation with Image Prompts,3d

pdf

  • Text-to-3D任务中,对3D模型外观的控制不强,本文提出IPDreamer来解决该问题。
  • 在NeRF Training阶段,IPDreamer根据文本用ControlNet生成参考图,并将参考图作为Zero 1-to-3的控制条件,用基于Zero 1-to-3的SDS损失生成粗NeRF。
  • 在Mesh Training阶段,IPDreamer将NeRF用DMTet转换为3D Mesh,并分别优化Mesh的几何与纹理。1)用参考图的法向图编码作为控制信号,用IPSD (Image Prompt Score Distillation) 优化3D Mesh的几何;2)用渲染rgb图像编码(和法向图差异)作为控制信号,用IPSD优化3D Mesh的纹理。
  • 将Text-to-3D任务,转换为单图重建任务,实现了更好的外观控制。

[23] IPDreamer: Appearance-Controllable 3D Object Generation with Image Prompts,3d

目录

Method

NeRF Training

Mesh Training

Experiments

Some Results

​编辑Comparison with SOTA Text-to-3D Methods


Method

[23] IPDreamer: Appearance-Controllable 3D Object Generation with Image Prompts,3d

NeRF Training

  • Image Generation. 给定文本描述和控制条件,本文用ControlNet生成参考图片。
  • Training of the Coarse NeRF Model. 给定参考图片,本文用基于Zero 1-to-3的SDS损失生成粗NeRF。

Mesh Training

  • Mesh Extraction. 给定粗NeRF,本文用DMTet将其转换为3D Mesh。3D Mesh由顶点V和四面体T(tetrahedrons)组成。每个顶点包含一个signed distance field (SDF) 值和形变值组成。描述了相较于初始正则坐标的变换。本文基于IPSD优化。
  • Geometry Optimization. Fantasia3D和ProlificDreamer用SDS优化3D Mesh的法向图,实现几何优化。但常用扩散模型缺少法向图的训练数据,导致几何优化效果不佳。为解决该问题,本文引入法向图编码,其中是IP-Adapter的denosing model。IPSD几何损失表达如下:

[23] IPDreamer: Appearance-Controllable 3D Object Generation with Image Prompts,3d

  • Texture Optimization. 首先,提取参考图像编码。其次,计算渲染角度和参考角度的法向图编码,并计算差值得到。这一步的目的是希望用[23] IPDreamer: Appearance-Controllable 3D Object Generation with Image Prompts,3d来表征任意渲染角度图像的图像编码。IPSD纹理损失表达如下:

[23] IPDreamer: Appearance-Controllable 3D Object Generation with Image Prompts,3d

Experiments

Some Results

[23] IPDreamer: Appearance-Controllable 3D Object Generation with Image Prompts,3d

Comparison with SOTA Text-to-3D Methods

[23] IPDreamer: Appearance-Controllable 3D Object Generation with Image Prompts,3d文章来源地址https://www.toymoban.com/news/detail-724253.html

到了这里,关于[23] IPDreamer: Appearance-Controllable 3D Object Generation with Image Prompts的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【四】3D Object Model之创建Creation——read_object_model_3d()算子

    😊😊😊 欢迎来到本博客 😊😊😊 🌟🌟🌟 Halcon算子太多,学习查找都没有系统的学习查找路径,本专栏主要分享Halcon各类算子含义及用法,有时间会更新具体案例。 😊😊😊 具体食用方式:可以点击本专栏【Halcon算子快速查找】–搜索你要查询的算子名称;或者点击

    2024年02月01日
    浏览(36)
  • 3d Object

    1.3DPPE: 3D Point Positional Encoding for Transformer-based Multi-Camera 3D Object Detection 2.NeRF-Det: Learning Geometry-Aware Volumetric Representation for Multi-View 3D Object Detection以 RGB 图像为输入进行室内 3D 检测,利用 NeRF 来明确估计 3D 几何图形 3.(track)A Fast Unified System for 3D Object Detection and Tracking 4.A Sim

    2024年04月12日
    浏览(37)
  • 3D Object Detection简单介绍

    3D Object Detection 是计算机视觉领域中的一项重要任务,它的目标是在三维点云数据中检测出场景中的物体,并估计它们的位置、姿态、大小等信息。在本教程中,我们将介绍 3D Object Detection 的基本原理、常用的数据集、算法和工具,以及如何使用它们进行目标检测。 3D Object

    2024年02月08日
    浏览(40)
  • 论文解读:Splicing ViT Features for Semantic Appearance Transfer

    Project webpage: https://splice-vit.github.io 将两张图片中语义相近的目标的结构和风格(外观)拼接 • 输入一个 Structure/ Appearence 图像对 : 训练生成器 。 • 关键思想是利用 预训练 和固定的视觉转换器 ( ViT ) 模型( 作为外部语义先验 )。 • 从 deep Vit features 提取到 structure 和ap

    2024年02月09日
    浏览(44)
  • 【论文阅读】CubeSLAM: Monocular 3D Object SLAM

    这一部分是论文中最难理解的一章,作者的主要想法,是利用2d图像来生成3d的目标包围框(bounding box),一方面这个思路本身就不是很好懂,另一方面,作者写这一章还是用的倒叙,显得更难理解了。 3d包围框的定义 对于本文的3d包围框,需要使用九个量来定义,可以分为三

    2024年02月07日
    浏览(42)
  • CubeSLAM: Monocular 3D Object SLAM 论文笔记

    提出了一种静态和动态环境下单幅图像3D长方体目标检测和多视点目标SLAM的方法,并证明了这两个部分是相互促进的。 首先,对于单图像目标检测,我们通过2D包围盒和消失点采样生成高质量的长方体轮廓。基于与图像边缘的对齐,进一步对方案进行评分和选择。 其次,提出

    2023年04月09日
    浏览(40)
  • 3D Object Detection经典论文整理【分类/下载/代码/笔记】

    3D Object Detection经典论文整理 【分类/下载/代码/笔记】 W.P. Xiao, Visual group, SHUSV 版本 更新时间 更新内容 作者 1 V 1.0 2021.12 论文分类整理 W.P. Xiao 2 V 1.0.1 2022.1.7 更新code链接 Y.Q. Wu 目录   笔者分类整理了与三维目标检测有关的经典论文和部分最新论文的PDF下载链接、开源代码

    2023年04月27日
    浏览(39)
  • 详解3D物体检测模型:Focal Sparse Convolutional Networks for 3D Object Detection

    用于3D目标检测的焦点稀疏卷积神经网络【CVPR2022】【3D检测】 本文介绍一篇新的 3D 物体检测模型: Focals Conv ,论文收录于 CVPR2022 。在 3D 检测任务中,点云或体素数据 不均匀地 分布在3维空间中, 不同位置的数据对物体检测的贡献是不同的 。然而目前主流的 3D 检测网络(

    2023年04月08日
    浏览(35)
  • 23个销量最高的3D扫描仪【2023】

    如果你可以 3D 扫描它,你就可以 3D 打印它。 市场上 3D 扫描仪的种类和质量非常丰富,机器尺寸、功能和价格各异。 这样的选择虽然本身是一件很棒的事情,但也会让从无用的东西中挑选出宝石成为一件苦差事。 推荐:用 NSDT编辑器 快速搭建可编程3D场景 无论你是在寻找适

    2024年02月06日
    浏览(44)
  • 【论文阅读】【3d目标检测】Embracing Single Stride 3D Object Detector with Sparse Transformer

    论文标题:Embracing Single Stride 3D Object Detector with Sparse Transformer 源码地址:https://github.com/TuSimple/SST CVPR2022 文章写得很好! 文章从2d 3d目标检测目标的尺寸的不同入手,在2d目标检测中确实由于图像近大远小的尺寸关系 存在着图像中物体尺寸长尾的问题: 如coco数据集中,大小

    2023年04月15日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包