Mip-NeRF 360

这篇具有很好参考价值的文章主要介绍了Mip-NeRF 360。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Mip-NeRF 360: Unbounded Anti-Aliased Neural Radiance Fields 无边界抗锯齿神经辐射场
论文提出了mip-NeRF(一种解决采样和混叠的NeRF变体)的扩展,该扩展使用非线性场景参数化、在线蒸馏和基于失真的新正则化器来克服无界场景带来的挑战。

将NeRF以及扩展模型应用于大型无界场景有以下挑战:
1.参数化。无边界360度场景可以占据欧几里得空间的任意大区域,但mip-NeRF要求3D场景坐标位于有界域中。
2.效率。大型和详细的场景需要更多的网络容量,但在训练期间密集地沿每条射线查询大型MLP是昂贵的。
3.歧义。无界场景的内容可能位于任何距离处,并且将仅由少量光线观察到,这加剧了从2D图像重建3D内容的固有模糊性。

创新点
· 非线性场景参数化:提出一种类似卡尔曼滤波的方式将超出一定距离范围外的无界区域的高斯模型变换到非欧式空间中
· 在线“蒸馏”:若要令现有MLP去渲染无界场景,扩大网络结构的方式会降低渲染效率;因此在优化阶段,论文将网络分为两个:proposal MPL来优化权重参数,NeRF MLP来输出结果,这样在训练过程中,通过NeRF MLP优化proposal MLP来提高效率
· 基于失真的优化器:对于无界场景的渲染而言,会产生模糊的现象,即伪影;论文引入了一种优化器,针对基于圆锥体采样的渲染方式,最小化沿光线的所有点之间的加权绝对距离Ws(.)对重建场景中的伪影进行优化

Mip-NeRF回顾:
论文第一节介绍了Mip-NeRF:Mip-NeRF中将像素点看为一个锥体的圆形截面
原始nerf的一个像素点对应mip-nerf的一块区域
原始nerf的一条射线对应mip-nerf 的一个圆锥
原始nerf的一个采样点对应mip-nerf的一个圆台
原来的位置编码需要修改成对圆台进行位置编码,将圆台设置成服从高维的高斯分布(高斯分布表示圆台),在进行积分求期望编码,然后将位置与观看方向输入MLP得到颜色和密度,接着沿着这些圆台进行积分或加权平均。

1、场景和光线参数化

1、这里重新参数化3D坐标
mipnerf360,NERF系列,计算机视觉,人工智能,深度学习

上图是场景参数化的二维可视化,远点应按视差(反距离)而不是距离成比例分布。定义了一个contract(·) operator,它可以将坐标映射到半径为2的球体(橙色),其中半径为1(蓝色)的点不受影响。将这种收缩应用于欧几里德3D空间中的mip-NeRF高斯(灰色椭圆),类似于卡尔曼滤波器来产生收缩高斯得到红色椭圆,其中心保证位于半径为2的球内。contract(·)的设计与根据视差线性划分光线间隔的选择相结合,意味着从位于场景原点的camera投射的光线在橙色区域具有等距间隔。公式如下
mipnerf360,NERF系列,计算机视觉,人工智能,深度学习
当圆台超出蓝色区域,就会通过公式进行转换,首先进行归一化,除以||x||(∈(+1,-1)),(2-1/||x||)(该值∈(1,2)),就能把该区域转换到橙色球体内,论文中指出改变换类似于类似卡尔曼滤波。

2、论文提出了一种选择光线距离t(沿光线的距离)的方式,即根据视差参数化光线ray。将显式地对视差中的距离t进行线性采样,为了根据视差参数化光线,我们定义了欧几里得光线距离t和“归一化”光线距离s之间的可逆映射:g()是某个可逆标量函数,将[tn , tf]映射“归一化”射线距离s ∈ [0,1]。
mipnerf360,NERF系列,计算机视觉,人工智能,深度学习

2、Coarse-to-Fine Online Distillation

mip-NeRF使用了一种从粗到细的重采样策略
mipnerf360,NERF系列,计算机视觉,人工智能,深度学习
在 mip-NeRF 中,首先需要定义一组大致均匀分布的区间tc,可以理解为直方图中的端点。如上图所示,每个间隔的高斯都被送入 mlp,并且得到直方图权重 wc 和颜色 cc。然后将这些颜色加权后得到像素点的颜色 Cc。之后这些权重被重采样,并得到一组新的区间tf,并且在场景中有内容的地方,端点就会较为聚集。经过mlp得到精细的Cf 在计算两次得到的值得损失函数。

论文中建立两个网络,一个proposal MLP,它预测体积密度(不计算颜色),得到直方图权重后,使用一个“NeRF MLP”来产生权重和颜色,生成渲染图像C,我们监督proposal MLP被训练以产生与NeRF MLP的w输出一致的proposal weights w ^ \hat w w^ 。通过使用一个小的proposal MLP和一个大的NeRF MLP,获得了一个高容量的组合模型,它仍然易于训练。
为了使模型起效,需要一个损失函数来鼓励两个网络的直方图一致,首先定义一个函数,该函数计算与区间T重叠的所有proposal权重之和:
mipnerf360,NERF系列,计算机视觉,人工智能,深度学习
如果两个直方图彼此一致,那么它必须保持wi≤bound(), 损失将惩罚违反此不等式并超过此界限的任何剩余直方图质量mipnerf360,NERF系列,计算机视觉,人工智能,深度学习

3、Regularization for Interval-Based Models

mipnerf360,NERF系列,计算机视觉,人工智能,深度学习

经过训练的NeRFs通常表现出两种特征伪影,论文中称之为“漂浮物”和“背景塌陷”,提出了一种正则化器,在阶跃函数方面有一个简单的定义,阶跃函数由参数化每条射线的一组(归一化)射线距离s和权重w定义,该优化器的目的为最小化沿光线的所有样本之间的归一化加权绝对距离的值,即上图中所示的直方图的面积:
mipnerf360,NERF系列,计算机视觉,人工智能,深度学习
离散化该公式
mipnerf360,NERF系列,计算机视觉,人工智能,深度学习

例如下图中,通过以下方式鼓励每条射线尽可能紧凑:1)最小化每个间隔的宽度,2)将远处的间隔拉向彼此,3)将权重合并为单个间隔或少量附近的间隔,以及4)在可能的情况下(例如当整个射线未被占用时)将所有权重朝着零。
mipnerf360,NERF系列,计算机视觉,人工智能,深度学习

4、优化

使用了一个具有4层和256个隐藏单元的提议MLP和一个具有8层和1024个隐单元的NeRF MLP,这两个MLP都使用ReLU内部激活和密度τ的软加激活。损失函数如下, λ \lambda λ=0.01
mipnerf360,NERF系列,计算机视觉,人工智能,深度学习文章来源地址https://www.toymoban.com/news/detail-549527.html

到了这里,关于Mip-NeRF 360的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 计算机视觉与图形学-神经渲染专题-第一个基于NeRF的自动驾驶仿真平台

    如今,自动驾驶汽车可以在普通情况下平稳行驶,人们普遍认识到,真实的 传感器模拟将在通过模拟解决剩余的极端情况方面发挥关键作用 。为此,我们提出了一种基于神经辐射场(NeRF)的自动驾驶模拟器。与现有作品相比,我们的作品具有三个显着特点:(1) 实例感知

    2024年02月12日
    浏览(37)
  • 计算机视觉与图形学-神经渲染专题-Seal-3D(基于NeRF的像素级交互式编辑)

    摘要 随着隐式神经表示或神经辐射场 (NeRF) 的流行,迫切需要与隐式 3D 模型交互的编辑方法,以完成后处理重建场景和 3D 内容创建等任务。虽然之前的作品从不同角度探索了 NeRF 编辑,但它们在编辑灵活性、质量和速度方面受到限制,无法提供直接的编辑响应和即时预览。

    2024年02月13日
    浏览(32)
  • Part1:使用 TensorFlow 和 Keras 的 NeRF计算机图形学和深度学习——计算机图形学世界中相机的工作原理

    是否有一种方法可以仅从一个场景多张不同视角的照片中捕获整个3D场景? 有。 NeRF:将场景表示为用于视图合成的神经辐射场中(NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis),Mildenhall等人(2020)的论文解答了这个问题。NeRF的更简单实现赢得了 TensorFlow社区聚光

    2024年02月07日
    浏览(34)
  • Nerf系列数据集记录

    此篇文章用于记录nerf系列的常用数据集 😺(猫猫头防伪认证) NeRF主要采用了两类数据集,合成数据集(synthetic)和真实数据集(real images) 😺其中 合成数据集 包括: DeepVoxel 该数据集包含四个具有 简单几何结构 的 朗伯对象 (Lambertian objects)。 视图为512×512像素 每个对

    2024年02月05日
    浏览(22)
  • 【NeRF】(一)NeRF论文学习笔记

    概述: 重建:根据目前有的不同角度二维图片,重建三维物体。 用 MLP 网络学 Scene Representation,以实现 输入源图像对应的三维空间坐标和相机视角 ( x , y , z , θ , ϕ ) (x,y,z,theta,phi) ( x , y , z , θ , ϕ ) ;输出 ( R , G , B , σ ) (R,G,B,sigma) ( R , G , B , σ ) ,分别表示RGB 颜色值和体素

    2024年02月06日
    浏览(29)
  • 【AD-NeRF】音频驱动人脸NeRF

    🔗 PDF Link 🍺 GitHub Code 任务目标:生成高质量的音频驱动的面部视频序列合成,实现音频到视觉人脸的跨模态映射。 应用方向:数字人、聊天机器人、虚拟会议等 针对这个任务,目前已经有了一些解决方案。早期的方案基于专业的建模师以及动作捕捉系统,近些年深度学习

    2023年04月08日
    浏览(21)
  • NeRF必读五:NeRF in the wild

    NeRF从2020年发展至今,仅仅三年时间,而Follow的工作已呈井喷之势,相信在不久的将来,NeRF会一举重塑三维重建这个业界,甚至重建我们的四维世界(开头先吹一波)。NeRF的发展时间虽短,有几篇工作却在研究领域开始呈现万精油趋势: PixelNeRF----泛化法宝 MipNeRF----近远景重

    2023年04月23日
    浏览(72)
  • 神经网络辐射场NeRF、实时NeRF Baking、有向距离场SDF、占用网络Occupancy、NeRF 自动驾驶

    NeRF (Neural Radiance Fields,神经辐射场) 是2020年ECCV会议上的Best Paper,其将隐式表达推上了一个新的高度,仅用 2D不同的posed images 作为监督,即可渲染出 复杂的三维场景 。一石激起千层浪,自此之后NeRF迅速发展起来被应用到多个技术方向上例如新视点合成、三维重建等等,并取

    2023年04月23日
    浏览(28)
  • 论文解读Nerf2Mesh:基于Nerf的网格资产生成

    论文标题 Delicate Textured Mesh Recovery from NeRF via Adaptive Surface Refinement 简单翻译:通过Nerf恢复网格结构 论文下载地址,点这里 1:网格知识点介绍(可跳过): 3D模型有三种表达方式, 体素(Voxel),网格(Mesh),点云(Point Cloud) 、SDF等,但在实际渲染应用中,主流的表达方

    2024年02月02日
    浏览(51)
  • NeRF必读:Instant-NGP----RTX3090单卡就能玩转NeRF

    NeRF从2020年发展至今,仅仅三年时间,而Follow的工作已呈井喷之势,相信在不久的将来,NeRF会一举重塑三维重建这个业界,甚至重建我们的四维世界(开头先吹一波)。NeRF的发展时间虽短,有几篇工作却在我研究的领域开始呈现万精油趋势: PixelNeRF----泛化法宝 MipNeRF----近远

    2024年02月09日
    浏览(25)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包