【三维重建补充知识-0】视差、深度概念及其转换

这篇具有很好参考价值的文章主要介绍了【三维重建补充知识-0】视差、深度概念及其转换。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、基本概念

把手指放在眼前,分别闭上左、右眼,我们会发现手指与后边物体的相对位置是不同的,也即两眼所识别的两幅图像之间存在视觉差异,我们通过“视差”这一概念来表示这种差别

该过程也可以通过两个处于同一平面的相机来模拟:
【三维重建补充知识-0】视差、深度概念及其转换

如下图所示,在同一水平面上存在位置偏移的两个相机,它们对同一物体拍照成像后在图片上的像素点坐标位置并不相同

【三维重建补充知识-0】视差、深度概念及其转换

对于同一特征点P,在相机Ol和Or下成像点分别为p和p’,两条向上的箭头线代表了相机的摄影主轴方向(平行),两条红线代表了成像平面(沿x方向的长度相等),以相片的左边界为x方向的零起始边,p点和p‘点在对应相平面下的x坐标分别为xl和xr,定义视差(disparity)为xl-xr

二、视差与深度的转换

通过视差,利用相似三角形我们可以计算出点P距离相机的深度信息

记OlOr距离为B,pp‘距离为b,深度为z,焦距为f,视差xl-xr为s,则有
b B = z − f z \frac{b}{B}=\frac{z-f}{z} Bb=zzf
B − s B = z − f z \frac{B-s}{B}=\frac{z-f}{z} BBs=zzf
z = f B s z=f\frac{B}{s} z=fsB
由此通过视差便可以求出物体与相机沿光轴方向上的距离,也即深度信息。

b=B-s推导:
b为pp‘距离,即B减去左右两个红色小三角形的底边,左边的底边为xr - L/2,右边的底边为L/2 - xl,因此b=B - (xr - L/2) - (L/2 - xl) = B - xr + xl,也即b = B-s

三、视差与深度关系

同时根据公式我们可以看出当物体距离越远,视差越小,物体越近,视差越大
【三维重建补充知识-0】视差、深度概念及其转换
这是符合我们日常生活经验的,对于手指的例子,放的离眼睛越近,两次背后物体与手指的位置偏差越大,当放到足够远时,与手指靠很近的物体则基本看不出位置的偏移。

对于人眼双目系统而言,正是因为两眼之间存在水平的位置偏移产生了视差,人脑在接受到两张图片之后才可以恢复出深度信息,也即我们能够感受到3D场景下看到的物体离我们有多远

3D电影就是利用了视差,使用两个投影仪投影出两幅具有视差的图像(所以不戴3D眼镜直接看会感觉画面是重叠模糊的),在3D眼镜作用下左、右眼分别只看到对应的一张图像,这就模拟了人眼的双目视觉体系,从而在大脑中产生具有深度感的立体3D场景

四、视差图与深度图

视差图上每个像素点存储了该点在两幅图像下的视差值(为了反映不同视角下图片的差异),而深度图则记录了各点对应真实物体与相机光心沿光轴方向上的距离(为了存储真实三维场景信息)。

以下分别为不同视角的源图像、处理后的视差图和处理后的深度图:
【三维重建补充知识-0】视差、深度概念及其转换
【三维重建补充知识-0】视差、深度概念及其转换
【三维重建补充知识-0】视差、深度概念及其转换

上边的步骤并不复杂,要想从两张图片中获取视差图,只需对两幅图像上的特征点进行提取,随后在另一张图像上进行特征匹配来寻找对应点,随后即可计算出对应点的视差,获取视差图后可进一步转换为深度图,而有了深度图之后则可以进行三维重建来恢复真实的3D场景(点云等表示方法),因此:

  • 视差图可以看作立体匹配(提取特征、特征匹配)的输出承载体
  • 深度图是立体匹配与点云生成之间的中间桥梁

参考:
https://www.fpga-china.com/4559.html
https://zhuanlan.zhihu.com/p/522285892
https://www.cnblogs.com/riddick/p/8486223.html文章来源地址https://www.toymoban.com/news/detail-499692.html

到了这里,关于【三维重建补充知识-0】视差、深度概念及其转换的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【STM32】知识补充 晶振的基本原理及其应用

    晶振作为现代电子技中的重要组件, 广泛应用于各种电子设备中, 起到稳定时钟信号的作用. 本文将为您解释晶振的基本原理及其在实际应用中的用途. 晶振 (Crystal Oscillator) 又称为石英晶体振荡器, 是一种利用石英晶体的压电效应产生稳定频率信号的电子器件. 石英晶体在收到外

    2024年02月05日
    浏览(45)
  • Linux知识点 -- 进程概念(补充)

    在用户每次使用malloc等函数在进程的堆区申请地址时,用户只需要指定空间的大小,并且会得到一个起始地址,而不会得到结束地址; 因为 堆区的结构都是由 vm_area_struct 管理的,每次malloc都会申请一个该结构体; malloc在堆上申请空间时,只需要知道起始地址,不需要知道结

    2024年02月13日
    浏览(44)
  • 【必备知识】 三维空间/坐标转换/相机知识

    以下内容包含了2D坐标与3D坐标系之间的转换以及关于相机场的基础知识,理解这部分内容可以更快入门SLAM相关、多视角合成、三维空间变换等内容。 照相机制造过程中的一些涉及到透镜精密以及组装工艺等原因需要对图像进行相应的矫正。如下所示: 需要建立世界坐标系到

    2024年02月03日
    浏览(42)
  • (DTU数据集、Tanks and Temples 数据集、ETH3D 数据集、BlendedMVS数据集 ) 深度学习三维重建MVS论文中最受欢迎的大型数据集

    近几年,在MVS类论文中使用最为广泛的大型数据集分别是DTU数据集、Tanks and Temples 数据集、ETH3D 数据集 、数据集。 对于基于学习的MVS训练,深度图是必不可少的,而评估是基于点云的。对基于平面扫描的多视图立体视觉技术的深度学习中,如果一个数据集不包含地面真实摄

    2024年02月05日
    浏览(38)
  • 医疗PACS源码,支持三维多平面重建、三维容积重建、三维表面重建、三维虚拟内窥镜

    C/S 架构的PACS系统源码,PACS主要进行病人信息和影像的获取、处理、存储、调阅、检索、管理,并通过网络向全院提供病人检查影像及诊断报告;各影像科室之间共享不同设备的病人检查影像及诊断报告;在诊断工作站上,调阅HIS中病人的其它信息 (如: 病人信息、病历信息、

    2024年02月12日
    浏览(42)
  • 立体匹配入门指南(8):视差图、深度图、点云

    本篇是比较简单的基础概念,刚入门的朋友可能是需要的。 视差图 三维点云 首先,我们要介绍下这三个概念。 视差(disparity) 视差 d d d 等于同名点对在左视图的列坐标减去在右视图上的列坐标,是 像素单位 d = x l − x r d=x_l-x_r d = x l ​ − x r ​ 立体视觉里,视差概念在极

    2023年04月08日
    浏览(40)
  • 结构光三维重建(一)条纹结构光三维重建

    在近景三维重建领域,结构光技术可以说是应用最广泛的,尤其在工业领域。该技术目前具有高精度和无视弱纹理等优点,但复杂的室外环境还是会对该技术造成一定程度的干扰。目前用的比较多的结构光分别两大类:线结构光以及条纹结构光。接下来我先来简单介绍一下条

    2024年02月06日
    浏览(48)
  • 聚焦型光场相机基于立体视差的深度估计原理

    聚焦型光场相机可以看作是主透镜将物面成了一个放大或者缩小的虚像,然后每个微透镜阵列对这个经过放大或者缩小的虚像进行二次成像后投影在了ccd平面,其中二次成像的过程可以比拟为一个虚拟阵列相机,利用MLA和主透镜的相关参数就可以以立体视觉的原理实现对像面

    2024年02月16日
    浏览(39)
  • 深度学习相关知识点概念

    卷积神经网络(Convolutional Neural Network,CNN) 是一种专门用于处理和分析具有网格结构数据的人工神经网络。CNN主要应用于计算机视觉领域,用于图像识别、物体检测、图像分割等任务。 CNN的设计受到了生物视觉系统的启发,其主要特点是在网络中引入了卷积层(convolutiona

    2024年04月16日
    浏览(47)
  • 【卫星三维重建】卫星影像三维重建数据集-MVS3DM数据集介绍

    MVS3DM数据集是用于IARPA多视图卫星影像3D重建挑战赛的标准数据集(IARPA Multi-View Stereo 3D Mapping Challenge),该数据集由Digital Globe WorldView-3卫星影像以及机载激光雷达获取的影像覆盖范围内的点云数据作为算法真值数据组成。 卫星影像数据类型和数量 :包含50张WorldView3全色影像(

    2024年03月12日
    浏览(110)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包