视频篡改检测(取证)学习笔记

这篇具有很好参考价值的文章主要介绍了视频篡改检测(取证)学习笔记。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1.不一致光照和高边界对比度

不一致光照(inconsistent light)指的是在一组视频帧中,由于物体的变换、反射和遮挡,环境光在不同帧之间的表现出现变化。这种变化可能是因为物体的移动、相机的移动或者光源的变化导致的。在单个视频帧内,光照通常表现为相对一致,因为所有的影像内容都是在同一瞬间捕捉的,而在连续的视频帧中,物体和光源的相对位置可能会发生变化,从而导致光照的变化。

高边界对比度(High boundary contrast)是一个图像处理术语,通常用来描述图像中边界区域亮度或颜色的显著变化。在图像中,边界是两个不同区域相遇的地方,边界对比度是指边界两侧亮度或颜色差异的程度。
这里的一些关键点有助于理解“高边界对比度”:

  1. 边界:通常指的是图像中物体的轮廓线,或者是不同颜色、纹理或亮度区域之间的分界线。
  2. 对比度:指的是图像中最亮和最暗部分之间的差异。高对比度意味着这种差异很大,使得图像看起来更加鲜明和清晰。
  3. 高边界对比度:特别指图像中的边界处的对比度很高,也就是说,一个区域到另一个区域的过渡非常快速和明显,没有渐变或模糊的过渡。
    在图像伪造检测的背景下,高边界对比度可能是因为伪造过程中的不自然编辑。例如,如果一个物体被粘贴到另一个图像上,物体的边缘可能与背景的边缘对比度非常高,因为它们并不是自然拍摄的一部分,而是后期合成的结果。这种不自然的高边界对比度可以被用作检测图像是否被篡改的一个信号。

1.1对应高频信息还是低频信息

“Inconsistent light”(不一致的光照)通常是指图像中光照条件的不连贯性或不自然性,这种情况可能在图像合成或篡改时出现。不一致的光照可能表现为以下几种情况:

  1. 光照方向不一致:图像中不同物体的阴影方向可能相互矛盾,表明它们是在不同光照条件下拍摄然后合成在一起的。
  2. 光照强度不一致:图像中某些区域可能比其他区域明显更亮或更暗,而这种亮度变化并不符合自然光照的规律。
  3. 色彩温度不一致:不同光源的色温不同,可能导致图像中的色彩分布出现不自然的情况,比如同一场景中出现冷暖色调的不协调。
  4. 反射和高光不一致:物体表面的反射和高光应该与光照条件相符,不一致的反射和高光可能暗示图像被修改。
    在图像的频率域中,“inconsistent light”不对应于特定的频率范围,如高频或低频,因为光照不一致可能影响整个图像的多个方面。不过,光照的不一致性可能导致图像中出现一些异常的高频或低频信息,这取决于光照不一致性的具体表现形式。例如,不自然的阴影边缘可能会增加高频信息,而大面积光照不均可能会影响中频和低频信息。
    但是在学习过程中,该概念通常被定义为低频信息,这可能与光照变化的特性有关。通常,在图像或视频中,快速变化的细节(如边缘、纹理等)被编码为高频信息,而缓慢变化的大范围特征(如渐变的阴影或光照的整体变化)被编码为低频信息。不一致光照往往涉及到整体光照条件的变化,这些变化在空间上是渐变的,不会在图像的小区域内突然改变,因此它们在频率域中主要表现为低频成分。

High boundary contrast(高边界对比度)对应的是图像的高频信息。在图像处理中,边界对比度高意味着在很小的空间范围内,像素值(亮度或颜色)有很大的变化。这种快速变化的特征是由图像的高频分量表示的。

在傅里叶变换(一种常用来分析图像中频率成分的工具)中,图像的高频分量对应于图像中的细节部分,如边缘、纹理和噪声,而低频分量则对应于图像中的平滑区域,如均匀的背景和大的色块。因此,当我们谈论高边界对比度时,我们实际上是在指高频信息。

1.2SRM滤波器可以捕捉高频篡改痕迹

已有相关文献证明SRM可以有效的提取高频信息,SRM通过计算目标像素和相邻像素的残差,量化并截断滤波器的输出,提取同现信息作为最终特征。
SRM滤波器通过计算像素的残差,实际上是在提取这些高频信息。
这个过程和高频信息的关系可以这样理解:

  1. 卷积核设计:SRM滤波器的设计通常是为了响应图像中的特定高频模式。例如,一个简单的高通滤波器可以检测到图像中的边缘,因为边缘表示像素值的快速变化。
  2. 残差提取:当SRM滤波器应用于图像时,它计算目标像素与其周围像素在经过滤波器处理后的差异。如果目标像素周围有显著的变化(如边缘或细节),这种变化将在残差中得到体现,因为滤波器的输出会与原始像素值产生较大的差异。
  3. 高频特征:这些残差实际上反映了图像中的高频特征。残差较大的区域通常对应于图像中的高频内容,如边缘或纹理变化。
    SRM滤波核通常不参与参数训练,而是当做图像的一个与处理层,这样可以在较少的计算成本的情况下提出高频信息。

2.特征融合之CBP层

直接指路双线性池化相关论文
还是写的比较详细的,值得一提的是该层有两种投影方法,RM(随机麦克劳林)和TS(张量草图),其中TS的计算量和参数量较少。
吐槽一下 两个128维经过CBP后融合得到的特征维度是8192,这也忒大了

3.IoU指标

在视频篡改检测和计算机视觉领域,IoU(Intersection over Union)是一种常用的评估指标,用于衡量预测边界框(bounding box)与真实边界框之间的重叠程度。IoU 是一种评价目标检测算法性能的标准方法,尤其在视频篡改检测中,它可以帮助我们了解检测到的篡改区域的准确性。

IoU 的计算方法如下:

  1. 交集(Intersection):计算预测边界框和真实边界框之间的交集区域。

  2. 并集(Union):计算两个边界框覆盖的总区域,包括交集部分和各自独有的部分。

  3. 计算IoU值:将交集的面积除以并集的面积。

IoU = Area of Intersection Area of Union \text{IoU} = \frac{\text{Area of Intersection}}{\text{Area of Union}} IoU=Area of UnionArea of Intersection

IoU 值的范围从0到1:

  • IoU = 0 表示没有重叠。
  • IoU = 1 表示完美重叠,预测边界框与真实边界框完全吻合。

在实践中,IoU 值越高,表示预测的边界框与真实边界框吻合得越好,检测算法的性能越好。通常,IoU 值大于某个阈值(例如0.5)时,预测结果才会被认为是正确的。

在视频篡改检测任务中,IoU 可以用来评估检测出来的篡改区域与实际篡改区域之间的一致性。高IoU值表明检测算法能够准确定位视频中被篡改的部分,而低IoU值则可能意味着检测结果不准确,或者篡改区域被部分遗漏或错误标记。

3.图像的纹理和边缘特征指的是什么

  1. 纹理信息

    • 纹理信息描述的是图像中重复出现的局部模式和结构的排列方式,它通常与表面的物理质感相关,如布料的编织方式、墙面的涂鸦或地面的铺砌模式。
    • 纹理可以被视为图像中的微观模式,这些模式在一定的空间范围内有规律地重复出现。
    • 在频域中,纹理信息可能对应于一定范围的频率成分,通常包括中频信息。
  2. 边缘信息

    • 边缘信息指的是图像中亮度变化剧烈的地方,是图像中物体或特征的边界。
    • 边缘是图像分析中的基本特征,因为它们往往是物体形状的轮廓,是物体之间以及物体与背景之间的分界线。
    • 在频域中,边缘信息通常对应于高频成分,因为边缘代表了图像亮度的快速变化。

在图像处理和计算机视觉中,纹理和边缘是用来提取信息和理解场景的两种重要的视觉线索。它们通常通过不同的算法和技术来检测和分析:

  • 纹理分析可能包括使用滤波器组、纹理描述符(如局部二值模式LBP、灰度共生矩阵GLCM)或深度学习方法来识别和分类纹理模式。
  • 边缘检测则通常涉及使用基于梯度的方法(如Sobel、Canny边缘检测器)来定位图像中亮度变化明显的地方。

因此,纹理和边缘是图像中的两种不同的特征,它们在图像处理和分析中扮演着各自独特的角色。

4.论文阅读

[11]S. Chen, S. Tan, B. Li, and J. Huang, “Automatic detection of objectbased forgery in advanced video,”. IEEE Transactions on Circuits and Systems for Video Technology, vol. 26, no. 11, pp. 2138-2151, 2016.
【11】创建了SYSU-OBJFORG数据集,并提出了一种基于运动残差的时间篡改检测算法。首先,通过视频帧序列的勾结算子生成运动残差帧。然后,通过图像篡改检测算法来检测这些运动残差帧。
视频篡改检测(取证)学习笔记,笔记,视频,深度学习,音视频

[22]Y. Yao, Y. Q. Shi, S. Weng, and B. Guan, “Deep learning for detection of object-based forgery in advanced video,” Symmetry, vol. 10, no. 1, pp. 3,2017.
[23] L. Chen, Q. Yang, L. Yuan, Y. YAO, Z. ZHANG, and G. WU, “Passive forensic based on spatio-temporal localization of video object removal tampering,” Journal on Communications, vol. 41, no. 7, pp. 110-120, 2020.
视频篡改检测(取证)学习笔记,笔记,视频,深度学习,音视频
视频篡改检测(取证)学习笔记,笔记,视频,深度学习,音视频视频篡改检测(取证)学习笔记,笔记,视频,深度学习,音视频
C3D+C2D 五帧做输入的时候好像没什么特殊含义

[24] Q. Yang, D. Yu, Z. Zhang, Y. Yao, and L. Chen, “Spatiotemporal trident networks: detection and localization of object removal tampering in video passive forensics,” IEEE Transactions on Circuits and Systems for Video Technology, vol. 31, no. 10, pp. 4131-4144, 2021.
视频篡改检测(取证)学习笔记,笔记,视频,深度学习,音视频
时空三叉戟网络考虑到了混合输入帧的问题
视频篡改检测(取证)学习笔记,笔记,视频,深度学习,音视频
时域检测
视频篡改检测(取证)学习笔记,笔记,视频,深度学习,音视频
空域定位
[28] L. Xiong, M. Cao, and Z. Fu, “Forensic of video object removal tamper based on 3D dual-stream network,” Journal on Communications, vol. 42, no. 12, pp. 202-211, 2021.
[29] S. Tan, B. Chen, J. Zeng, B. Li and J. Huang, “Hybrid deep-learning framework for object-based forgery detection in video,” Signal Processing: Image Communication, vol. 105, pp. 116695, 2022.文章来源地址https://www.toymoban.com/news/detail-793343.html

到了这里,关于视频篡改检测(取证)学习笔记的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 音视频学习—音视频理论基础(2)

      音频是一种模拟信号,它是由声波转化而来的电信号。声波是通过气体、液体或固体传播的机械波,代表了声音的震动。在录制过程中,声音被转换成电信号,然后被储存在数字格式中。   声音的三要素是频率、振幅和波形   频率是指声波的振动次数,通常使用赫

    2024年04月29日
    浏览(42)
  • Qt音视频开发36-超时检测和自动重连的设计

    如果网络环境正常设备正常,视频监控系统一般都是按照正常运行下去,不会出现什么问题,但是实际情况会很不同,奇奇怪怪七七八八的问题都会出现,就比如网络出了问题都有很多情况(交换机故障、网线故障、带宽故障等),所以监控系统在运行过程中,还得做超时检

    2023年04月13日
    浏览(46)
  • WebRTC技术文档 -- 1.音视频直播(笔记)

    1.1 两条技术路线 1.1.1 以音视频会议为代表的实时互动直播 互动直播主要解决音视频远程交流问题,实时性较强,时延一般低于500ms。 1.1.2 以娱乐直播为代表的流媒体分发 娱乐直播主要解决音视频大规模分发问题,实时性较差,时延一般在3s以上。 1.2 直播技术 WebRTC用于实时

    2024年02月22日
    浏览(61)
  • 音视频BUG学习

    1、首先看出现概率是偶现还是必现 2、如果是必现,则复现整个bug过程,看Bug是否出现 如果是偶现,则分析问题视频 在复现问题过程中,刚开始没下载到本地,直接点击播放发生慢放,因为流量网速较低,15s,40Mb 平均网速要超过2.7Mb/s,因此误以为复现了bug 0 问题复现 找设

    2024年02月11日
    浏览(59)
  • 音视频入门知识学习

    1920x1080的屏幕,32位,30帧的fps。一秒钟需要1920x1080x32x30字节,所以需要压缩 压缩的核心思想就是去除冗余信息 空间冗余 空间冗余 == 相邻像素重复:图像内部相邻像素之间存在较强的相关性多造成的冗余 比如一张图片中间的一个位置大小20x20,它的表现肉眼看起来其实是一

    2024年02月12日
    浏览(50)
  • 从数字图像到音视频学习:我的学习之旅

    数字图像是一门广泛应用于计算机视觉、图像处理和计算机图形学等领域的学科,而音视频学习则涵盖了音频和视频的处理、分析和应用。 如果你最开始接触数字图像,可能会学习一些基本概念,例如像素、分辨率、色彩空间和图像处理算法等。这可能涉及到使用编程语言(

    2024年02月11日
    浏览(53)
  • 5G 时代来了;还不赶紧学习音视频?

    随着 5G 时代的到来 , 移动技术 的发展不仅带来 网速的提升 ,同时也推动 流量单位成本下降 , 企业通信方式 从 文本消息 到 富媒体消息 ,如今也逐渐向 实时高清音视频升级 ; 防护 工作的持续使得 视频会议、远程办公、线上教学 成为许多人工作中的**“常态” ;对于

    2023年04月14日
    浏览(54)
  • 音视频学习(二十)——rtsp收流(udp方式)

    本文主要介绍通过udp方式实现rtsp拉流。 流程说明: 相较于tcp方式“信令+数据”复用同一连接拉流,udp方式拉流“信令+数据”采用不同的连接,信令传输采用tcp,流数据传输采用udp; 客户端向服务端(设备等)发起tcp请求,用于后续信令交互; tcp连接成功后,开始rtsp信令

    2024年02月04日
    浏览(44)
  • ffmpeg系列学习——FFmpeg的音视频处理

    1.音视频的采样率、采样位深度和声道数 音频和视频的采样率、采样位深度和声道数是媒体文件中的重要参数,它们会直接影响到音视频的质量和文件大小。下面对它们进行详细解释: 采样率 采样率指音频每秒钟采样的次数,用赫兹(Hz)表示。采样率越高,音频的还原度越

    2024年02月04日
    浏览(64)
  • 如何找到更多音视频开发学习资料和资源?

    如果你对学习音视频开发感兴趣,以下是一些建议,可以帮助你获取更多相关的资料和资源: 在线学习平台:参考一些知名的在线学习平台,如Coursera、Udemy、edX等,搜索他们的课程目录,看是否有与音视频开发相关的课程。这些平台通常提供高质量的学习资源,包括视频教

    2024年02月12日
    浏览(66)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包