Nerf神经辐射场三维重建0基础学习

这篇具有很好参考价值的文章主要介绍了Nerf神经辐射场三维重建0基础学习。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言

本期内容为对Nerf神经辐射场的网络结构以及其使用的体渲染技术的一个介绍。文章会同步更新到公众号 AI知识物语 ,并且后续有需要也会更新响应的讲解视频到B站,同名 出门吃三碗饭

开讲!

简单介绍Nerf

Nerf是2020年的一篇ECCV论文,其贡献就是通过提供2维信息来渲染3维复杂的真实场景。
在介绍Nerf网络结构以及体渲染近似前,我们需要知道下面的知识:

(1)Nerf流程:

输入数据(空间、方向信息)—>通过MLP网络—>输出对应的数据(点密度、颜色信息)—>对各个点、光线进行渲染—>渲染后输出像素值—>对比预测的像素值和实际像素值的损失值,并优化—>网络训练好后,可以得到各个角度的视图(视图也就是各个像素值组成的)
Nerf神经辐射场三维重建0基础学习

(2)光学知识、拍照原理:

1:物体反射光线—>反射光线进入小孔—>反射光线打在感光面上—>通过处理形成像素—>像素最终组成图像
Nerf神经辐射场三维重建0基础学习
2:光线由一个个粒子组成,也可以叫光子,其有很多属性,对像素值影响比较大的两个属性是密度和颜色(也叫发光强度)。
颜色: 发光强度越大,对像素贡献越大;
密度:可以假设粒子A密度为1,粒子B穿过A的时候会被反弹,为0.7,大部分的粒子B在经过A后会消失(准确说是散射掉),为0的话,则认为A是透明,B可以完全顺利通过。再通俗点,A密度越大,光线通过A后减弱越多(可以是变暗)。

(2)神经辐射场网络结构

(1)这个网络是一个简单的全连接神经网络,在左边是输入处理过后的输入位置空间位置数据,最后通过Relu激活函数处理输出 σ \sigma σ.
Care1:空间位置数据x,y,z并不是真实场景的坐标,而是经过相机(or手机相机)处理过后的空间坐标系下的坐标
Care2:通过对三维数据坐标进行升维,提高到60维,来获取更丰富的输出信息。(基于前任研究:输入信息维度越高,输出的信息信号也越高,丰富)
Care3:在图最上面,也就是空间数据送入结构处理一半的过程中,再次输入空间坐标。目的是为了加强坐标信息。
(2)同时在另一个位置(图下方),方向坐标通过升维,并且和处理过的空间坐标信息特征拼接在一起,通过最后的两层网络处理,由Sigmoid激活函数输出RGB值,也叫 c c c值,是代表颜色,发光强度。

(3)体渲染

大概过程:通过网络输出的每个点的密度 σ \sigma σ和颜色 c c c,去模拟一条光线,并计算其成像的像素。

Nerf神经辐射场三维重建0基础学习

先来看两个公式
光线公式:

r ( t ) = o + t d r(t)=o+td rt=o+td
r表示一条光线,o是光线的起点,t代表光线在方向d上前进的距离
渲染公式:
Nerf神经辐射场三维重建0基础学习
(1) C ( r ) C(r) Cr代表某条光线在平面形成的像素值
(2) t f t_f tf代表光线的起点, t n t_n tn代表终点
(3) T ( t ) T(t) Tt代表透光率,其具体表达看右式,通过密度 σ \sigma σ求积分并取指数得到,物理意义可以理解为其值越大,透射程度越大,即光穿过该位置后能量减少程度小
(4) σ \sigma σ ( r ( t ) ) (r(t)) (r(t)) c ( r ( t ) , d ) c(r(t),d) c(r(t),d) 表示粒子密度和颜色的乘积
(5)通过对上述属性在时间区间上求积分,可以求出其最终在平面的成像像素值

(4)相关工作

1:在隐式神经渲染爆火之前,业界常用的渲染方法是显式渲染,如下图,
Nerf神经辐射场三维重建0基础学习
Nerf神经辐射场三维重建0基础学习
显示表达通常采用点云、网格、体素等形式去进行场景的表达,但是其在渲染过程去对显存的要求比较大,也就是其需要占用过多的内存、算力,而隐式渲染则使用一个相对较小的神经网络去代替了上述的工作,因为隐式表示,在表达复杂场景时其参数量相比显示表示是较少的,并且隐式函数因为其连续性,对场景表达更精细。
NeRF做到了利用”隐式表示“实现了照片级的视角合成效果,把Volume作为中间3D场景表征,并通过“体渲染”实现了特定视角照片合成效果。因此,NeRF实现了从离散的照片集中学习出了一种隐式的体表达,然后在某个特定视角,利用该隐式体表达和体渲染得到该视角下的照片。

2:另外Nerf在数据处理上还做了一些小的创新。
(1)位置编码:
这里位置编码的作用在于对输入的数据进行一个升维操作,因为研究表明输入数据维度越高,其输出数据维度也越高,也就是输出数据更加丰富。
Nerf神经辐射场三维重建0基础学习

def positional_encoding(inputs, L=10):
    """
    inputs: 输入向量,包含(x,y,z)三个坐标
    """
    L = 10
    # freq_bands: [2^0, 2^1, ..., 2^(L-1)]
    freq_bands = 2 ** torch.linespace(0, L-1, L)
    outputs = []
    for freq in freq_bands:
        # [sin(2^f \pi x), sin(2^f \pi y), sin(2^f \pi z)]
        outputs += [torch.sin(freq * inputs)]
        # [cos(2^f \pi x), cos(2^f \pi y), cos(2^f \pi z)]
        outputs += [torch.cos(freq * inputs)]
    # [sin(2^0 \pi x), sin(2^0 \pi y), sin(2^0 \pi z), cos(2^0 \pi x), cos(2^0 \pi y), cos(2^0 \pi z), ...]
    outputs = torch.cat(outputs, -1)
    return outputs

(2)分层采样(由粗到细采样)
因为对所有光线的所有粒子进行计算模拟需要大量的算力,并且十分费时,为了提高效率,论文作者先对每条光线各个区域选取一部分采样,采样处理后,选取上一步采样中信息比较丰富的的区域进行细采样。通过该操作可以提高数据采样计算的整体速度。

(5)结果展示

论文采用了PSNR和SSIM这两个指标来进行评价:
Nerf神经辐射场三维重建0基础学习
可以看到本文结果相比上述结果有了很大的提升,在PSNR值体现比较大。

Nerf神经辐射场三维重建0基础学习
Nerf神经辐射场三维重建0基础学习

参考资料

港大本科余同学对Nerf体渲染相关的介绍
AI小男孩 对体渲染以及Nerf的介绍
论文是最好的老师 Nerf论文
Talk is cheap, give me your code!!!文章来源地址https://www.toymoban.com/news/detail-487355.html

到了这里,关于Nerf神经辐射场三维重建0基础学习的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 辐射神经场算法——NeRF算法详解

    NeRF(Neural Radiance Fields)是2020年ECCV会议上的Best Paper,一石激起千层浪,在此之后的两三年的各大顶会上相关文章层出不穷,其影响力可见一斑,NeRF通过隐式表达的方式将新视角合成任务(Novel View Synthesis Task)推向了一个新的高度。那么,什么是“新视角合成任务”呢?什么

    2024年02月06日
    浏览(47)
  • 【三维重建】NeRF原理+代码讲解

    NeRF是2020年ECCV论文,任务是 做新视角的合成 ,是借助深度学习技术的计算机图形学任务,实现了摄像机级别的逼真的新视图合成。仅仅2年时间,相关work和论文就已经大量涌现。 论文 :https://arxiv.org/abs/2003.08934 TensorFlow代码 :https://github.com/bmild/nerf PyToch代码 :https://github.

    2024年02月01日
    浏览(45)
  • 一文搞懂 神经辐射场(Neural Radiance Fields,NeRF)

    神经辐射场(Neural Radiance Fields,简称NeRF)是一种计算机视觉技术,用于生成高质量的三维重建模型。它利用深度学习技术从多个视角的图像中提取出对象的几何形状和纹理信息,然后使用这些信息生成一个连续的三维辐射场,从而可以在任意角度和距离下呈现出高度逼真的

    2024年02月06日
    浏览(39)
  • 神经辐射场(Neural Radiance Field,NeRF)的简单介绍

    参考文章:https://arxiv.org/abs/2210.00379    神经场 是一种神经网络,其输入为坐标,输出为坐标对应点的某个属性。    神经辐射场 (NeRF)模型是一种新视图合成方法,它使用体积网格渲染,通过MLP进行隐式神经场景表达,以学习3D场景的几何和照明。    应用 :照片编

    2024年02月07日
    浏览(48)
  • 基于Nerf的三维重建算法Neus初探

    目录 介绍 安装 训练开源数据 训练自己的数据 作者提出了一种新的神经表面重建方法,称为NeuS,用于从2D图像输入中以高保真度重建对象和场景。在NeuS中,我们建议将曲面表示为有符号距离函数(SDF)的零级集,并开发一种新的体绘制方法来训练神经SDF表示。我们观察到,

    2024年02月09日
    浏览(56)
  • 神经网络辐射场NeRF、实时NeRF Baking、有向距离场SDF、占用网络Occupancy、NeRF 自动驾驶

    NeRF (Neural Radiance Fields,神经辐射场) 是2020年ECCV会议上的Best Paper,其将隐式表达推上了一个新的高度,仅用 2D不同的posed images 作为监督,即可渲染出 复杂的三维场景 。一石激起千层浪,自此之后NeRF迅速发展起来被应用到多个技术方向上例如新视点合成、三维重建等等,并取

    2023年04月23日
    浏览(41)
  • 【3D生成与重建】SSDNeRF:单阶段Diffusion NeRF的三维生成和重建

    题目 :Single-Stage Diffusion NeRF: A Unified Approach to 3D Generation and Reconstruction 论文 :https://arxiv.org/pdf/2304.06714.pdf 任务 :无条件3D生成(如从噪音中,生成不同的车等)、单视图3D生成 机构 :Hansheng Chen,1,* Jiatao Gu,2 Anpei Chen, 同济、苹果、加利福尼亚大学 代码 :https://github.com/Lakon

    2024年02月02日
    浏览(48)
  • Mip-NeRF:抗混叠的多尺度神经辐射场ICCV2021

    数据采集时,如果采样频率不满足奈奎斯特采样定理,可能会导致采样后的信号存在混叠。 当采样频率设置不合理时,即采样频率低于2倍的信号频率时,会导致原本的高频信号被采样成低频信号。如下图所示,红色信号是原始的高频信号,但是由于采样频率不满足采样定理

    2024年02月07日
    浏览(46)
  • 【论文解读】基于神经辐射场NeRF的像素级交互式编辑(Seal-3D)

    来源:投稿 作者:橡皮 编辑:学姐 论文链接:https://arxiv.org/pdf/2307.15131 项目主页:https://windingwind.github.io/seal-3d/ 随着隐式神经表征或神经辐射场(NeRF)的普及,人们迫切需要与隐式三维模型交互的编辑方法,以完成重建场景的后期处理和三维内容创建等任务。虽然以前的作

    2024年02月03日
    浏览(46)
  • 三维重建方法3D gaussian splatting与NeRF的区别和异同

    最近学习了一些三维重建相关的内容,目前比较主要的重建流派就是3DGS以及NeRF,NeRF作为2020年发布的文章轰动一时,影响深远,有很多NeRF based的相关工作在这些年涌现。3DGS作为2023年的new talk of the town,其在保证合成质量的情况下能够以数倍乃至数十倍的速度碾压许多NeRF b

    2024年02月01日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包