Nerf系列数据集记录

这篇具有很好参考价值的文章主要介绍了Nerf系列数据集记录。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

此篇文章用于记录nerf系列的常用数据集 😺(猫猫头防伪认证)

NeRF

NeRF主要采用了两类数据集,合成数据集(synthetic)和真实数据集(real images)

😺其中合成数据集包括:

  1. DeepVoxel

    • 该数据集包含四个具有简单几何结构朗伯对象(Lambertian objects)。
    • 视图为512×512像素
    • 每个对象从上半球(the upper hemisphere)采样的视点渲染(479个作为输入,1000用于测试)。
  2. nerf_synthetic

    • 其中包含八个对象的路径跟踪图像(pathtraced images),这些对象具有复杂的几何结构和逼真的非朗伯材质(non-Lambertian materials)。六个从上半球上采样的视点渲染,两个从整个球体上采样的点渲染。

    • Nerf渲染每个场景的100个视图作为输入,200个视图用于测试

    • 所有视图均为800×800像素。

😺其中真实数据集包括:

  1. LLFF

    • 在Nerf中,这个数据集由8个场景组成,这些场景是用手持手机拍摄的(5个取自LLFF文章,3个是Nerf拍摄的),用20到62张图像拍摄的,并为测试集保留其中的1/8。

    • 设计用于为采样良好的正向场景生成逼真的新视图。(ndc)

    • 所有图片都是1008×756像素。

      (🐵在泛化系列中,IBRNet又对其进行了扩充,共有102个,67来自IBRNet作者制作,35来在LLFF)

  2. nerf_real_360

    • 官方Google云里有的数据,但没看到论文提到
    • 我看了一下是对真实场景的360的拍摄,然后利用colmap完成了位姿估计
    • 具体数据格式同LLFF
    • 像素比较高,vase_deck:4032x3024; pinecone:3024x4032

其它

  1. DTU

    • DTU是一个MVS数据集,常被被用来做MVS、NeRF方法的训练集。

    • DTU是一个大型数据集,包含受控实验室环境中的128个场景,其模型使用结构光扫描仪捕获。

    • 在7种不同的照明条件下,在相同的49或64个相机位置扫描每个场景,生成分辨率为1200×1600像素的RGB图像。

      (🐵Note:在NeRF泛化系列论文中,如PixelNerf、MVSNerf中在DTU数据集上训练框架,以学习可泛化的网络,PixelNerf下采样400x300,而MVSNerf下采样到512 × 640分辨率,都采用的88个训练场景和15个测试场景的不同分割)

  2. ShapeNet

    • 属于小型点云数据集,小型数据集指一个点云中包含的对象或场景非常小,直观表现就是点数非常少的数据集。

    • 该数据集有16个类别(飞机,椅子,汽车等),共16,881个形状。每个类别又进一步的标注了组件结构(例如飞机分为机翼,机身和机尾)用作part segmentation,16个类别一共分成了50个part。每种类别形状规则无杂点,点数少,因此为小型数据集。

      (🐵Note:在PixelNerf中,它主要利用这些有明确类别的数据集来做:①用于特定类别和类别未知的视图合成,②具有未见类别和多个对象的ShapeNet场景,这两者都需要几何先验而不是识别,以及域转移到真实的汽车照片)

  3. Google scanned objects

    • 一个由超过 1000 个 3D 扫描的家用物品组成的精选集。
    • 在IBRNet中,作者利用该数据模型生成了以对象为中心的渲染图片,共1023个类别
    • RealEstate10K[74]、Spaces数据集[12]和102个来自手持手机捕捉的真实场景(35个来自LLFF[41]
  4. RealEstate10K

    • RealEstate10K 一个大规模相机姿势 (camera pose) 数据集,包含从大约 10,000 个 YouTube 视频中收集的大约 80,000 个视频片段,总共 1000 万帧。对于每个视频片段,这些相机姿势形成一条轨迹,其中每个姿势都指定了相机的位置和沿轨迹的方向。
    • 该数据集包含从视频片段派生的相机轨迹。这些轨迹是通过在大量视频上运行 SLAM 和捆绑调整 算法 得出的。
  5. Spaces

    • 该数据集包含了由16台摄像机捕捉到的100个场景。
  6. ModelNet40

    • 属于小型点云数据集
    • 含有40种类别比ShapeNet大。
    • 但ShapeNet数据集有实例标签,ModelNet40好像没有。
  7. Stanford Large-Scale 3D Indoor Spaces (S3IDS)

    • 属于大型点云数据集,大型数据集指一个点云中包含的对象或场景非常大,直观表现就是点数非常多的数据集。
    • 斯坦福室内数据集是由6个大型室内区域组成(如上图所示),每个区域又分为若干个房间,一共有271个房间,13个语义类别(例如:桌子,板凳,墙壁,沙发等)。
  8. Virtual KITTI dataset(vKITTI)

    • 属于大型点云数据集
    • 虚拟激光雷达点云是一个大型的室外道路点云,也包含了13个类别(例如:汽车,道路,树木等)。

论文使用数据集记录

🐔顺便记录每篇论文用了啥数据集(鸡哥护体文章来源地址https://www.toymoban.com/news/detail-451327.html

论文 数据集 补充
Nerf DeepVoxel, nerf_synthetic, LLFF
PixelNerf DTU、ShapeNet 88个训练场景和15个测试场景的不同分割(在MVSNerf和PointNerf中采取一样的策略)
IBRNet Google scanned objects,RealEstate10K、Spaces、LLFF(自己补充了一些) Google数据集是合成的,剩下三个是真实数据集
MVSNerf DTU, nerf合成数据集,LLFF DTU上训练,nerf数据集上泛化和微调
PointNerf DTU,nerf合成数据集,tank and temples DTU上训练,nerf、tank数据集上泛化和微调

到了这里,关于Nerf系列数据集记录的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Debezium系列之:记录变更事件

    Debezium 数据更改事件具有复杂的结构,可提供丰富的信息。 但是,在某些情况下,在下游消费者可以处理 Debezium 更改事件消息之前,它需要有关原始数据库更改导致的字段级更改的其他信息。 为了使用有关数据库操作如何修改源数据库中的字段的详细信息来增强事件消息,

    2024年02月09日
    浏览(52)
  • 【SQL开发实战技巧】系列(二十三):数仓报表场景☞ 如何对数据排列组合去重以及通过如何找到包含最大值和最小值的记录这个问题再次用执行计划给你证明分析函数性能不一定高

    【SQL开发实战技巧】系列(一):关于SQL不得不说的那些事 【SQL开发实战技巧】系列(二):简单单表查询 【SQL开发实战技巧】系列(三):SQL排序的那些事 【SQL开发实战技巧】系列(四):从执行计划讨论UNION ALL与空字符串UNION与OR的使用注意事项 【SQL开发实战技巧】系列

    2023年04月10日
    浏览(72)
  • 【AD-NeRF】音频驱动人脸NeRF

    🔗 PDF Link 🍺 GitHub Code 任务目标:生成高质量的音频驱动的面部视频序列合成,实现音频到视觉人脸的跨模态映射。 应用方向:数字人、聊天机器人、虚拟会议等 针对这个任务,目前已经有了一些解决方案。早期的方案基于专业的建模师以及动作捕捉系统,近些年深度学习

    2023年04月08日
    浏览(27)
  • NeRF必读五:NeRF in the wild

    NeRF从2020年发展至今,仅仅三年时间,而Follow的工作已呈井喷之势,相信在不久的将来,NeRF会一举重塑三维重建这个业界,甚至重建我们的四维世界(开头先吹一波)。NeRF的发展时间虽短,有几篇工作却在研究领域开始呈现万精油趋势: PixelNeRF----泛化法宝 MipNeRF----近远景重

    2023年04月23日
    浏览(86)
  • 神经网络辐射场NeRF、实时NeRF Baking、有向距离场SDF、占用网络Occupancy、NeRF 自动驾驶

    NeRF (Neural Radiance Fields,神经辐射场) 是2020年ECCV会议上的Best Paper,其将隐式表达推上了一个新的高度,仅用 2D不同的posed images 作为监督,即可渲染出 复杂的三维场景 。一石激起千层浪,自此之后NeRF迅速发展起来被应用到多个技术方向上例如新视点合成、三维重建等等,并取

    2023年04月23日
    浏览(41)
  • 《Kafka系列》Kafka常见问题处理记录

    1.创建语句如下所示,按照习惯在添加zookeeper参数的时候,指定了 zxy:2181/kafka ,但是却创建失败, Error while executing topic command : Replication factor: 1 larger than available brokers: 0. 2.检查各个broker的server.properties文件 发现在配置参数的时候, zookeeper.connect 指定的是 zxy:2181,zxy:2182,zxy:21

    2024年02月03日
    浏览(50)
  • 春秋云境系列靶场记录(合集)-不再更新

    春秋云境系列靶场记录合集,不更新了哈~~~ 感谢各位朋友的关注,2022年11月到12月,利用空闲时间做了春秋云镜的靶场,因为穷,所以也只能做免费的(当然还有个原因就是我太菜,不会做专业的),总结一下春秋云境靶场吧,截止到目前,我做了41个免费的靶场 我的这个合

    2024年02月02日
    浏览(55)
  • Oracle系列十二:视图、记录、同义词、序列

    (1)基本概念 Oracle视图是数据库中的一种特殊对象,它是一个虚拟的表,不存储数据,而是基于一个或多个表的查询结果而创建的。视图可以看作是一个 存储在数据库中的查询结果集 ,具有表的特性,包含一系列带有名称的列和行数据, 可以被查询、修改和删除 等。 视图

    2024年02月03日
    浏览(35)
  • 【论文阅读笔记】NeRF+Mip-NeRF+Instant-NGP

    NeRF是NeRF系列的开山之作,将三维场景隐式的表达为神经网络的权重用于 新视角合成 。 MipNeRF和Instant NGP分别代表了NeRF的两个研究方向,前者是抗锯齿,代表着渲染质量提升方向;后者是采用多分辨率哈希表用于加速NeRF的训练与推理速度。 通过NeRF实现新视角合成 Title:NeR

    2024年02月04日
    浏览(69)
  • 论文解读Nerf2Mesh:基于Nerf的网格资产生成

    论文标题 Delicate Textured Mesh Recovery from NeRF via Adaptive Surface Refinement 简单翻译:通过Nerf恢复网格结构 论文下载地址,点这里 1:网格知识点介绍(可跳过): 3D模型有三种表达方式, 体素(Voxel),网格(Mesh),点云(Point Cloud) 、SDF等,但在实际渲染应用中,主流的表达方

    2024年02月02日
    浏览(68)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包