Monocular metasurface camera for passivesingle-shot 4D imaging

这篇具有很好参考价值的文章主要介绍了Monocular metasurface camera for passivesingle-shot 4D imaging。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

课题组:清华大学杨原牧、曹良才

期刊:nature communications

一、研究背景

       传统相机对于获取深度、偏振等多维的光场信息是一个巨大挑战。如果解决这个问题,就会需要其它的光学元件、时域复用技术(我理解为分时技术)和主动激光照明。本文实验证明了配有单层超构透镜的单目相机可以在正常环境光照明的情况下捕获4维图像,包括2维的全聚焦强度、深度和偏振信息。超构透镜是被依赖于目标物体深度且具有共轭对的偏振解耦旋转单螺旋点扩散函数优化。在此基础上结合简单的物理可解释图像检索算法,该照相机可以在室内和室外环境中的静态和动态场景的扩展景深上同时执行高精度深度感测和高保真偏振成像。

二、工作原理

       1、广义多维图像模型:

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测

         其中,(x,y,z)和(x',y')代表物体空间和成像平面的坐标位置,f 表示包含多维光场信息的目标物体(成像系统输入),p表示经过目标物体反射光的偏振态, 表示产生的噪声项。PSF是描述成像系统对点光源的单脉冲响应的点扩散函数,它取决于z和p并且通过菲涅尔信息量化

       2、单次照明4D成像框架

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测

   (1)设计优化单层超表面产生一对共轭单螺旋PSF,可以在光电传感器上形成目标物体的正交线偏振且横向偏移的孪生像。

     (2)   场景的深度被编码在孪生图像的平移向量的局部方向上

     (3)   计算检索场景的全聚焦2D光强度、深度和偏振对比度。通过基于对象对的图像分割模板匹配template matching的直接的、物理上可解释的算法从原始图像对中检索。

     3、超表面设计(工作波长:800nm)

     (1) 

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测
Spiral phase profiles

          是归一化径向坐标,φu 是方位角,[L, ε] 可调节设计参数。对于参数[L,ε],L可以被调整以控制旋转速度,而ε可以被调整以平衡在PSF的旋转期间的主瓣限制和形状不变性之间进行折中。文章中,L=8, ε=0.8

          设计方法:菲涅尔zone 设计;迭代傅里叶变换算法优化

          优势:相比于Gauss-Laguerre mode方法设计的双螺旋PSF,该方法可以生成紧凑的旋转PSF,并且在扩展的景深内保持PSF的形状几乎不变。                (2)

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测
Polarization splitting phase

           焦距:f=20mm; 离轴角: =8°

           功能: 空间解耦共轭单螺旋PSF

      (3)

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测
Full phase profile of the metasurface

          优化:

          基于菲涅耳积分计算PSF的复振幅为monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测

         r 是归一化的径向坐标,是相对于几何图像点的方位角(当不添加菲涅耳区相位项时,其指的是PSF的中心)。r0 聚焦衍射光斑的半径。 散焦参数,R 入射光瞳半径,zobj 实际物体深度,zf 聚焦物平面的深度。

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测

        PSF的复振幅和强度为

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测

        迭代傅里叶变换算法优化,其中文章设计N=9,depths为9cm~100cm且以此对应z1~z9

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测

           初始相位和优化后相位对比:

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测

      4、成像实验

     (1) 组合成像系统:超表面+CMOS光电探测器、带通滤波器(限制光谱带宽)、光圈(限制视场角)

     (2) 超表面相机通过利用偏振解耦共轭单螺旋PSF在光电探测器上呈现两个空间分离的图像

     (3) 室内实验:

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测

      (4) 室外实验:

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测

        5、4D图像检索算法框架

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测

      (1) 将获得的一对图片分割成相同大小,并进行标记。首先通过 Canny edge detector去编码图像对。随后,连接区域检测(connected area detection)应用于分割具有闭合边缘的对象,并且去除太小的目标以避免噪声和冗余边缘。自适应阈值的图像二值化方法也应用于编码图像对中,每一个标记的区域都由二值化图像组成,并且区域重叠率不超过0.8的会被删除。

     (2) 检索目标物体的深度

       首先假设所有目标物体深度统一,随后对每个分割对象执行模板匹配,以检索平移向量的值。在模板匹配过程中,从一个图像中提取的模板在要匹配的图像中滑动,以在可能的translation区域内搜索最佳匹配SAD。

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测

        z(i) 和 (i) 表示第 i 个分割物体的深度和平移向量的方位角。zf 和 f 聚焦物平面的深度和对于平移向量的方位角。V 由初始化单螺旋函数确定。 

        提高深度评估精度:

        每个初始检索的平移向量有像素数 (u,v) 量化, u v 表示沿着光感知平面的x y方向的离散积分值。为了考虑由于离散值导致的精度限制,本文考虑了四领域最佳匹配向量 SAD。重定义平移向量为 (u+u , v+ v),Refine的平移向量会以更低的SAD值向领域转移。u 和 v 均小于一般像素大小。

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测

     (3) 检索x、y偏振的二维聚焦强度以及偏振对比度 ( Ix/Iy )

        分割物体的轮廓用于从编码图像中选取目标物体的区域,并且根据平移向量可以将每个目标平移回几何图形的位置。

     6、设计全斯托克斯偏振和深度成像

monocular metasurface camera for passive single-shot 4d imaging,Metasurface,人工智能,目标检测

7、 补充

(1) 单目相机:    单目、双目及深度相机比较_单目深度相机-CSDN博客

                            万字长文概述单目3D目标检测算法-CSDN博客 

(2) 点扩散函数:点扩散函数point spread function (PSF)_psf函数-CSDN博客

                           点扩散函数 PSF(point spread function)-CSDN博客

(3) 景深:光学成像原理之景深(Depth of Field)-CSDN博客

(4) Canny 边缘检测:Canny边缘检测算法(python 实现)_python canny-CSDN博客文章来源地址https://www.toymoban.com/news/detail-839402.html

到了这里,关于Monocular metasurface camera for passivesingle-shot 4D imaging的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 详解KITTI视觉3D检测模型CMKD: Cross-Modality Knowledge Distillation Network for Monocular 3D Object Detection

    本文介绍一篇激光雷达监督视觉传感器的3D检测模型: CMKD ,论文收录于 ECCV2022 。 在本文中,作者提出了用于单目3D检测的 跨模态知识蒸馏 (CMKD) 网络 ,使用激光雷达模型作为教师模型,监督图像模型(图像模型为CaDDN)。 此外,作者通过 从大规模未标注的数据中提取知识

    2024年01月24日
    浏览(33)
  • [文章阅读] EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object ...

    CVPR 2022 论文链接 源代码:Github 1.1 论文试图解决什么问题?这是否是一个新的问题? 试图解决:基于PnPDE的单目物体位姿估计,需要获得图像中点的3D深度(通过深度网络之类的方法)以及2D-3D之间的关联,然后通过PnP求解得到物体位姿;而PnP本质上不可导,使得无法通过反

    2024年02月03日
    浏览(35)
  • 论文解读《EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose 》

    论文:《EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation》 Code:https://github.com/tjiiv-cprg/epro-pnp (909 star) 作者的视频简单介绍:https://www.bilibili.com/video/BV13T411E7kb 摘要: 解决问题: 对于6D位姿估计,基于几何(PnP)的方法性能要好一些,但以前

    2024年02月03日
    浏览(46)
  • 「亲测可用」Adobe Camera Raw 16 for win/mac 官方下载

    官方地址: Camera Raw plug-in installer 直接下载: macOS Windows Download latest Camera Raw for macOS Download latest Camera Raw for Windows ·镜头模糊 ·HDR图片 ·混色器

    2024年02月06日
    浏览(102)
  • PS滤镜插件:Adobe Camera Raw 16 for Mac中文激活版

    Adobe Camera Raw是Adobe公司开发的一款用于处理数码相机RAW格式文件的软件插件。它可以在Adobe Photoshop、Adobe Bridge和Adobe Lightroom等软件中使用,用于调整RAW文件的曝光、白平衡、对比度、色彩饱和度、锐化等参数,从而得到更好的图像质量。 软件下载:Adobe Camera Raw 16 for Mac中文激

    2024年01月22日
    浏览(50)
  • 【论文笔记】CRN: Camera Radar Net for Accurate, Robust, Efficient 3D Perception

    原文链接:https://arxiv.org/abs/2304.00670   本文提出两阶段融合方法CRN,能使用相机和雷达生成语义丰富且位置精确的BEV特征。具体来说,首先将图像透视特征转换到BEV下,该步骤依赖雷达,称为雷达辅助的视图变换(RVT)。由于转换得到的BEV特征并非完全精确,接下来的多模

    2024年02月03日
    浏览(54)
  • [论文笔记] SurroundOcc: Multi-Camera 3D Occupancy Prediction for Autonomous Driving

    Wei, Yi, et al. “Surroundocc: Multi-camera 3d occupancy prediction for autonomous driving.” Proceedings of the IEEE/CVF International Conference on Computer Vision. 2023. 将占用网格应用到多个相机构成的3D空间中; 使用BEVFormer中的方法获取3D特征, 然后使用交叉熵损失计算loss; 和BEVFormer区别是BEV中z轴高度为1, 这里

    2024年02月04日
    浏览(32)
  • 【论文笔记】A Robust Diffusion Modeling Framework for Radar Camera 3D Object Detection

    原文链接:https://openaccess.thecvf.com/content/WACV2024/html/Wu_A_Robust_Diffusion_Modeling_Framework_for_Radar_Camera_3D_Object_WACV_2024_paper.html 本文使用概率去噪扩散模型的技术,提出完全可微的雷达-相机框架。使用校准矩阵将雷达点云投影到图像上后,在特征编码器和BEV下的Transformer检测解码器中

    2024年01月18日
    浏览(32)
  • Learning to Super-resolve Dynamic Scenes for Neuromorphic Spike Camera论文笔记

    脉冲相机使用了“integrate and fire”机制来生成连续的脉冲流,以极高的时间分辨率来记录动态光照强度。但是极高的时间分辨率导致了受限的空间分辨率,致使重建出的图像无法很好保留原始场景的细节。为了解决这个问题,这篇文章提出了SpikeSR-Net来从低分辨率二进制脉冲

    2024年02月12日
    浏览(26)
  • PETRv2: A Unified Framework for 3D Perception from Multi-Camera Images

    PETRv2: A Unified Framework for 3D Perception from Multi-Camera Images 旷视 本文的目标是 通过扩展 PETR,使其有时序建模和多任务学习的能力 以此建立一个 强有力且统一的框架。 本文主要贡献: 将 位置 embedding 转换到 时序表示学习,时序的对齐 是在 3D PE 上做 姿态变换实现的。提出了

    2024年02月16日
    浏览(34)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包