论文笔记: NSG: Neural Scene Graphs for Dynamic Scenes

这篇具有很好参考价值的文章主要介绍了论文笔记: NSG: Neural Scene Graphs for Dynamic Scenes。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1.目标:

对动态场景进行渲染,完成动态前景与背景分离、背景inpainting、动态前景编辑和新视角生成。

2.动机:

之前的方法如nerf只能够渲染静态场景(利用的是静态场景在多视角下的一致性),如将整张图像场景中的所有物体编码进单个神经网络中,缺乏表征动态物体和将这些物体分解为单个物体的能力。

3.贡献:

1、提出了一种新的神经渲染方法,将动态的多目标场景分解为一个具有,经过解耦的目标运动与场景表征,的场景图。

2、直接从一个序列的视频帧与对应的跟踪数据中学习每个场景中节点(物体)的表征。并对一类实例(如卡车,汽车)使用共享的体积表征。

3、能够给完全不可见的动态物体渲染新视图,例如在一个场景中加入该场景中不存在的动态物体。

4、能够通过逆渲染方式完成3D目标检测。

4.方法:

neural scene graphs for dynamic scenes,论文阅读

1.场景图定义:

定义了一个场景图S:

neural scene graphs for dynamic scenes,论文阅读

其中W代表世界节点,C代表相机节点,F代表物体类别,包含了静态背景与每个类别的动态目标,L代表每个具体物体的表征latent,,E代表不同节点之间的仿射变换,如局部和全局坐标系之间的变换。

由于同一个类别共享一种外形,所以对于每个具体个体需要计算一个尺寸变换参数S0,用于表达每个具体物体的外形尺寸。

2.网络结构:

neural scene graphs for dynamic scenes,论文阅读

使用单个nerf模型对静态背景进行统一的建模表达;对动态物体进行类别级nerf建模表达,即每个类别的物体对应一个独立的模型;对每个具体的动态个体,加入表征个体信息的隐变量L与P。L可以理解为该物体的具体外形shape,P可以理解为该物体的具体外观appearance。

动态物体局部的3D坐标(修正并与物体的姿态对齐)可由全局坐标经过变换得到:

neural scene graphs for dynamic scenes,论文阅读

其中T是变换矩阵,S0是尺寸变换参数,采用的是每个物体bounding box的尺寸的倒数。这样可以使得网络能够学习到不依赖于尺寸的相似性。

neural scene graphs for dynamic scenes,论文阅读

渲染的pipline和流程:

1.用场景图对场景进行建模。

2.采样光线的路径上对点进行采样,落在动态物体bounding box内的为动态前景采样点,其它的为静态背景采样点。

3.对每个采样点使用对应的nerf模型进行体密度和RGB预测,并经过体渲染获得每条光线的最终RGB值。

静态背景:

初始(t=0)相机坐标系下,near clip 和 far clip 之间定义与图像平面平行的N个等距平面,对于任意一条光线,背景节点采样点是光线与逐个平面的交点。

动态物体:

首先把光线变到物体的local坐标系,然后计算每条射线方向和所有动态物体的bbox交点的起点与终点,然后在起点与终点之间采样Nd个点即为采样点。

3.结果:

neural scene graphs for dynamic scenes,论文阅读

neural scene graphs for dynamic scenes,论文阅读

能够实现动态物体的旋转平移,并尽量保证光照和阴影的保持与变换。

neural scene graphs for dynamic scenes,论文阅读

neural scene graphs for dynamic scenes,论文阅读

能够实现场景的编辑,如动态车辆的加入,移除,排列等。

neural scene graphs for dynamic scenes,论文阅读

neural scene graphs for dynamic scenes,论文阅读

在定性结果和定量指标中,均能获得sota效果。文章来源地址https://www.toymoban.com/news/detail-795118.html

到了这里,关于论文笔记: NSG: Neural Scene Graphs for Dynamic Scenes的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 论文阅读《Block-NeRF: Scalable Large Scene Neural View Synthesis》

    论文地址:https://arxiv.org/pdf/2202.05263.pdf 复现源码:https://github.com/dvlab-research/BlockNeRFPytorch   Block-NeRF是一种能够表示大规模环境的神经辐射场(Neural Radiance Fields)的变体,将 NeRF 扩展到渲染跨越多个街区的城市规模场景。该方法将场景分解为单独训练的 NeRF,使渲染时间与

    2024年02月03日
    浏览(46)
  • [论文笔记]Glancing Transformer for Non-Autoregressive Neural Machine Translation

    这是论文Glancing Transformer for Non-Autoregressive Neural Machine Translation的笔记。 传统的非自回归文本生成速度较慢,因为需要给定之前的token来预测下一个token。但自回归模型虽然效率高,但性能没那么好。 这篇论文提出了Glancing Transformer,可以只需要一次解码,并行地文本生成。并

    2024年02月12日
    浏览(46)
  • 论文笔记:Dual Dynamic Spatial-Temporal Graph ConvolutionNetwork for Traffic Prediction

    IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS 2022 GCN和TCN被引入到交通预测中 GCN能够保留交通网络的图结构信息 TCN能够捕获交通流的时间特征 基于GCN的交通预测方法依赖于如何构建图或邻接矩阵 将道路段的交通测量作为节点 通过不同道路段的直接连接来构建图 道路段上的交通

    2024年02月03日
    浏览(60)
  • SimVODIS++: Neural Semantic Visual Odometry in Dynamic Environments 论文阅读

    题目 :SimVODIS++: Neural Semantic Visual Odometry in Dynamic Environments 作者 :Ue-Hwan Kim , Se-Ho Kim , and Jong-Hwan Kim , Fellow, IEEE 时间 :2022 来源 : IEEE ROBOTICS AND AUTOMATION LETTERS(RAL) 语义的缺乏和动态对象导致的性能下降阻碍了其在现实场景中的应用。 为了克服这些限制,我们在Simultanero

    2024年02月09日
    浏览(41)
  • SRM : A Style-based Recalibration Module for Convolutional Neural Networks论文笔记

    整体结构图: Style Pooling风格池部分: Style Integration风格集成部分 1.提出了一个基于风格的重新校准模块(SRM),他通过利用中间特征映射的风格来自适应地重新校准。 2.SRM首先通过样式池从特征图的每个通道中提取样式信息,然后通过独立于通道的样式集成估计每个通道的重校

    2024年02月11日
    浏览(48)
  • Learning to Super-resolve Dynamic Scenes for Neuromorphic Spike Camera论文笔记

    脉冲相机使用了“integrate and fire”机制来生成连续的脉冲流,以极高的时间分辨率来记录动态光照强度。但是极高的时间分辨率导致了受限的空间分辨率,致使重建出的图像无法很好保留原始场景的细节。为了解决这个问题,这篇文章提出了SpikeSR-Net来从低分辨率二进制脉冲

    2024年02月12日
    浏览(38)
  • 【论文笔记】FasterNet:Run, Don’t Walk: Chasing Higher FLOPS for Faster Neural Networks

    为了设计快速神经网络,许多工作都集中在减少浮点运算(FLOPs)的数量上。然而,作者观察到FLOPs的这种减少不一定会带来延迟的类似程度的减少。这主要源于每秒低浮点运算(FLOPS)效率低下。 为了实现更快的网络,作者重新回顾了FLOPs的运算符,并证明了如此低的FLOPS主

    2024年02月07日
    浏览(47)
  • 2023 Mask R-CNN 改进:DynaMask: Dynamic Mask Selection for Instance Segmentation 论文笔记

    写在前面   本周更新的第二篇论文阅读,2023年每周一篇博文,还剩5篇未补,继续加油~ 论文地址:DynaMask: Dynamic Mask Selection for Instance Segmentation 代码地址:https://github.com/lslrh/DynaMask 收录于:CVPR 2023 欢迎关注,主页更多干货,持续输出中~   一般的实例分割通常采用固定

    2024年02月01日
    浏览(86)
  • 【论文阅读】Know Your Surroundings: Exploiting Scene Information for Object Tracking

    发表时间 :2020 期刊会议 :ECCV 方向分类 : 目标跟踪 做了什么: 本文提出了一个能够在视频序列中传播目标附近场景信息的跟踪结构,这种场景信息被用来实现提高目标预测的场景感知能力。 解决了什么问题: 已存在的跟踪器只依靠外观来跟踪,没有利用任何周围场景中

    2024年04月23日
    浏览(58)
  • 【论文阅读】Scaling Laws for Neural Language Models

    本文简要介绍 Scaling law 的主要结论 原文地址:Scaling Laws for Neural Language Models 个人认为不需要特别关注公式内各种符号的具体数值,而更应该关注不同因素之间的关系,比例等 Performance depends strongly on scale, weakly on model shape scale: 参数量 N N N , 数据量 D D D , 计算量 C C C shape: 模

    2024年02月16日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包