视频拼接融合产品的产品与架构设计(一)

这篇具有很好参考价值的文章主要介绍了视频拼接融合产品的产品与架构设计(一)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1视频拼接产品概述

将多达8个视频拼接在一起,拼成上帝视角的大图,并且可以共享最终生成的画面。

1.1 三维方案

三维方案是我在晚上思考的时候无意想到,这种方案应该是最接近事实的方案,多个画面应该是在三个维度,x,y,z 上面进行缩放,平移,旋转吗,可以形成柱面立体的图像,而底座的平面不一定是平面,有可能是一个曲面。不过这个方案虽然好,难度却比较大, 自己做一个三维引擎还是用unity,ue等工具直接编辑,这个难度在于掌握unity工具的一般不具备视频概念,因此我做了一个比较劣质的三维工具,可以在三维中显示视频,也做了一些文字,天空盒,点击选择等等的功能,思考到后面,有一个问题没有解决,就是三维合成二维图像的问题,多个视频在三维空间中不能直接拼接成二维的图像,压缩成jpeg,h264,h265等的流进行发送,存储是这个拼接工具的最直接的功能,三维非常直观,但是要达到这种地步还是要做大量的算法工作,因此暂时停一下,使用二维先解决问题。

1.2 二维平面方案

2 界面问题

界面是最大的问题,不像是一个服务器,本身是逻辑的组合,而界面比较麻烦的是:设计问题,如何做到设计比较符合常理?
首先我设计了一个基本的界面,如下图所示:
图像拼接融合算法,音视频,视频拼接

它是一个带有尺度刻度的界面,可以加载树来展示所有的实时摄像头,文件也可以。这个界面首先是利于观察,所有的画面展示出来,用于人眼可以看清楚所有的综合画面是什么样子的。

2.1 画面调整

那么,每个小窗口画面都是必须能要改变大小的,意味着画面可以随时调整大小,

3 算法

里面的算法比较多
图像拼接融合算法,音视频,视频拼接
首先我考虑到的是画面调整完后,有可能需要恢复到原始状态,但是畸形矫正不用恢复,所以畸形矫正应该是一个选项,要么选取(勾上),要不未选(没有勾),很有可能有的画面不需要矫正。

3.2 透视变换和裁剪

裁剪是必然的,那么像透视变换和仿射变化,以及单应矩阵可能先做,透视变化和仿射变化我设计了一个界面去调整
图像拼接融合算法,音视频,视频拼接
首先要选择两个画面,进行算法,在这里插入图片描述
如透视变化,这时候画面会取到最后一帧,出现1,2,3,4 四个方块,调整方块的位置则可以改变矩阵,从而生成新画面,同时这个必须记录下来,确定以后以便于主界面在渲染的时候进行透视变换。

3.3 移动

移动和记录移动的像素,进行记录
图像拼接融合算法,音视频,视频拼接

如上图所示,由于摄像头的角度,偏移,高度豆可能不仅相同,所以这个必须经过画面的裁剪移动来进行图片帧对齐。
图像拼接融合算法,音视频,视频拼接
除了窗口的拖动,单帧在窗口里是可以使用键盘移动的,使用w a s d 键盘来移动帧,符合很多人游戏的上手。不过这样留下了黑边,所以必须进行裁剪
图像拼接融合算法,音视频,视频拼接

3.4裁剪

因此裁剪框也是一个需要的功能,

3.5 透视变换

透视变换是一个最最核心的功能。代替那些orb,shft 特征变换

3.6 鱼眼矫正

上面的图片经过矫正以后,图像被拉直,同时,部分画面被切割掉了
图像拼接融合算法,音视频,视频拼接

4 关于特征

特征抓取是网上最多的人写过很多文章,这一部分就是使用ORB 特征,和 SIFT 等特征抓取匹配,然后再拼接,生成单应矩阵,这种方案不可取,是最差的方案,因为在实际的项目中,你连特征都抓不到,根本自动化不了,所以尽早放弃这种想法,除了一种情况例外,硬件是自己做的,自己知道自己的单应矩阵。

5 真正可靠的做法

把多路摄像头接入画面,缩小,观察,进行矫正,缩放,变换,裁切,放大,记录,这就是商业上做的做法
图像拼接融合算法,音视频,视频拼接

5.1 数字放大技术

这个太重要了,就算使用gpu 速度也没有那么快,那么尽量使用小的图,然后放大,读者会说,那不是失真了么。不会,这要用上真正的数字放大技术
下面是原图:模糊了
图像拼接融合算法,音视频,视频拼接
下面是原图的矫正:
图像拼接融合算法,音视频,视频拼接
下面左边是原图放大4倍,使用双线性差值,右边是数字放大技术4倍,就是这么的离谱,就是上面的小图放大的,出家人不打诳语。
图像拼接融合算法,音视频,视频拼接

6 架构设计

6.1 插件式编程

所有的算法编写成为插件

6.2 gpu编程

使用glsl 和 cuda 两种语言

6.3 放小接入,放大接出

这个步骤太重要了 ,一切为了速度

6.4 硬件盒子

硬件分为两种,我们考虑了
1 瑞芯微国产硬件的布局
2 jetson nano

6.5 输出

1 输出为mp4文件
2 输出为内存共享,为了给AI 输出,将合成的图像给AI以后,本来的跨境追踪reid好做了很多,是不是?
图像拼接融合算法,音视频,视频拼接

3 输出为rtmp ,rtsp 服务

等我第二遍进行代码上的讲解文章来源地址https://www.toymoban.com/news/detail-517610.html

到了这里,关于视频拼接融合产品的产品与架构设计(一)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • FPGA高端项目:FPGA基于GS2971+GS2972架构的SDI视频收发+HLS图像缩放+多路视频拼接,提供4套工程源码和技术支持

    FPGA高端项目:FPGA基于GS2971+GS2972架构的SDI视频收发+HLS图像缩放+多路视频拼接,提供4套工程源码和技术支持 目前FPGA实现SDI视频编解码有两种方案:一是使用专用编解码芯片,比如典型的接收器GS2971,发送器GS2972,优点是简单,比如GS2971接收器直接将SDI解码为并行的YCrCb422,

    2024年03月26日
    浏览(42)
  • FPGA高端项目:FPGA基于GS2971+GS2972架构的SDI视频收发+纯verilog图像缩放+多路视频拼接,提供8套工程源码和技术支持

    FPGA高端项目:FPGA基于GS2971+GS2972架构的SDI视频收发+纯verilog图像缩放+多路视频拼接,提供8套工程源码和技术支持 目前FPGA实现SDI视频编解码有两种方案:一是使用专用编解码芯片,比如典型的接收器GS2971,发送器GS2972,优点是简单,比如GS2971接收器直接将SDI解码为并行的YCr

    2024年03月18日
    浏览(70)
  • 腾讯云音视频及融合通信技术

    随着直播、游戏、电商、VR等场景的普及,基于音视频的实时娱乐社交、3D虚拟直播、AI视频招聘、元宇宙等新场景也纷纷涌现,下面一起走进音视频的世界。 腾讯云音视频产品,从底层编解码、到传输网络、到平台架构、再到用户终端,无一不决定产品“生死”,与此同时,

    2024年02月11日
    浏览(42)
  • 中关村科金李超:多元融合成为音视频技术发展新风向

    近年来,随着5G、云计算、人工智能等技术的日臻完善,行业数字化转型进入深水区,音视频技术在各种应用场景下全面开花。 银行业,作为关系到国计民生的重要行业,历来是数字化转型的排头兵。因此,在银行业的众多业务场景中,深度融合音视频技术,推动业务创新和

    2023年04月15日
    浏览(38)
  • 对话小红书剑寒:如何跨方向技术融合,全局优化打造更智能的音视频系统?...

    编者按: 在 AI 时代,随着 ChatGPT 掀起技术狂潮,构建更智能的音视频系统已经成为音视频领域从业者的共同目标。 然而,音视频系统的智能化,每个从业者对其都有自己独特的视角和理解,正如“一千个人眼中有一千个哈姆雷特”一样。尽管没有统一的标准答案,我们访谈

    2024年02月13日
    浏览(38)
  • linux 音视频架构 linux音视频开发

    转载 mob6454cc65110a 2023-07-26 22:27:01 文章标签 linux 音视频架构 ci QT 视频教程 文章分类 架构 后端开发 阅读数 117 目录 前言 1、软件工具准备 a. 录音软件 b. 录屏软件 c. 摄像头软件 d. 安卓屏幕操作软件 e. 视频剪辑软件

    2024年02月07日
    浏览(52)
  • 【图像处理】音视频色彩:RGB/YUV

    目录 1.RGB  1.1介绍        1.2分类 1.2.1RGB16 1)RGB565 2)RGB555 1.2.2RGB24 1.2.3RGB222 /

    2024年02月20日
    浏览(37)
  • 【图像拼接/视频拼接】论文精读:Dynamic Video Stitching via Shakiness Removing

    第一次来请先看这篇文章:【图像拼接(Image Stitching)】关于【图像拼接论文精读】专栏的相关说明,包含专栏使用说明、创新思路分享等(不定期更新) Seam Carving for Content-Aware Image Resizing As-Rigid-As-Possible Shape Manipulation Adaptive As-Natural-As-Possible Image Stitching Shape-Preserving Half

    2024年01月21日
    浏览(47)
  • 从数字图像到音视频学习:我的学习之旅

    数字图像是一门广泛应用于计算机视觉、图像处理和计算机图形学等领域的学科,而音视频学习则涵盖了音频和视频的处理、分析和应用。 如果你最开始接触数字图像,可能会学习一些基本概念,例如像素、分辨率、色彩空间和图像处理算法等。这可能涉及到使用编程语言(

    2024年02月11日
    浏览(33)
  • 海思Hi3403V100方案双目视频拼接融合模组+海思Hi3519DV500方案1200万无人机吊舱套板

    海思Hi3403V100方案双目视频拼接融合模组 Hi3403V100是海思面向高端市场应用推出的专业 Ultra-HD Smart IP Camera SOC,该芯片最高支持四路sensor输入,支持最高4K60的ISP图像处理能力。 海思Hi3403V100方案双目视频模组采用了海思Hi3403V100方案核心板+双目视频融合IMX334 Sensor板测试,端侧软

    2024年04月23日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包