【音频分析】音频短时时域分析

这篇具有很好参考价值的文章主要介绍了【音频分析】音频短时时域分析。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

短时处理

音频文件或音频流的采样率通常是8K,16K,48K之类的,即每秒钟有8000、16000、48000个样本。以16K采样率为例,一个信号仅耗时0.0625ms,显然逐信号处理的富余时间太短了。因此和视频传输类似,音频的传输单位,是一个较短时间窗口的采样累积,广义地也可以称之为帧(frame)。传输是逐帧完成,计算也可以逐帧完成,或者缓存一些帧来完成。
一般来说,16K音频采用10ms的窗口,这个窗口和音频长度相比非常小,因此,可以称之为“短时”。基于窗的短时处理也就是音频处理中的普遍标准范式。

窗函数

  • 截取一帧数据的时候,对数据进行加权,即施加窗函数。
  • 直接截取一部分音频数据,可以称之为矩形窗。
  • 有一种中心权重高,两边权重低的窗口函数,称之为汉明窗。
    公式如下:
    s a m p l e [ i ] = ( 1 − α ) − α ∗ c o s ( 2 π i / ( L − 1 ) ) sample[i] = (1-\alpha) - \alpha*cos(2\pi i/(L-1)) sample[i]=(1α)αcos(2πi/(L1))
    其中 α \alpha α是权重系数,值域[0,1], i i i是采样后样本在窗口的下标, L L L是采样窗的长度。
    如一般来说:
    16K音频每10ms有160个采样, L = 160 L=160 L=160 α \alpha α一般取0.46。
    【音频分析】音频短时时域分析
    从上面的图可以看出,汉明窗让中间的信号强度增强,抑制了边缘的强度。这样做的原因在频域处理的时候避免因为边缘截断引起的频谱失真。具体可以参考《什么是泄漏?》

短时能量和振幅

短时能量和振幅没啥好说的,上两个公式:
短时能量
E = ∑ i = 0 L − 1 ( x [ i ] ) 2 E = \sum_{i=0}^{L-1}(x[i])^2 E=i=0L1(x[i])2
短时振幅:
E = ∑ i = 0 L − 1 ∣ x [ i ] ∣ E = \sum_{i=0}^{L-1}|x[i]| E=i=0L1x[i]
有窗函数则乘上窗函数,等用到(如编解码等)再详细讨论

音调(音高)、基频和自相关

影响听觉最主要的因素是音调,所谓音调可以类比为do、re、mi、fa这种音乐上的音阶,在人的感觉上来说就是声音的粗细。根据经验,决定音调的因素是时域频率最小的那个波,称之为基频。
一般认为,人正常说话的发声的基频范围在70Hz-500Hz之间,一般男性在120-250左右,女性稍高。一个16K信号10ms的窗采样数是160,一个采样是0.0625ms,则能区分的最大频率为16000Hz,最小频率为100Hz。

自相关和相关面峰值是时域用来计算基频的一种算法。主要原理就是用和自身一样的滑动窗来滑动相乘。
【音频分析】音频短时时域分析
每移动一格就计算重合部分的相关系数(auto-correlation coefficient 简称acf
蓝色和黄色部分为同一帧信号
A C F [ i ] = ∑ j = 0 n − i ( x [ j ] − x ˉ ) ( x [ i + j ] − x ˉ ) v a r i a n c e ACF[i] = \dfrac{\sum_{j=0}^{n - i}(x[j] - \bar{x})(x[i+j] - \bar{x})}{variance} ACF[i]=variancej=0ni(x[j]xˉ)(x[i+j]xˉ)
v a r i a n c e variance variance是方差,基本就是个互相关系数,只不过两个信号都是自己。并且和卷积的计算类似,只不过卷积核方向不一样。然后就是量纲有所区别。
ACF数组的长度应该是信号长度一样长,
考虑到短时窗有的情况下截取不到一个周期,所以需要改进,把自相关改成互相关,然后其中一个信号多加上前一帧的数据。
【音频分析】音频短时时域分析
绿色部分是前一帧的信号。

但是相关系数计算复杂,吃计算量,而且受有时会受到一些次级峰的影响,相关系数也不是线性的,可能忽大忽小。因此有人发明了一种截断方式,比如3电平削波(3level clip)。把小于一定阈值的信号置为0。大于阈值的信号置为1或者-1。这样使得信号只有三个值,方便计算相关系数,归一化之后相关峰的值也比较大。这个原理之一在于用一个值去截断并二值化之后,一样的信号峰的宽度应该差不多。
阈值一般取当前帧最大值的60%-70%,或者综合参考前一帧,后一帧等
【音频分析】音频短时时域分析
前面这帧的计算结果几种方法都差不多
【音频分析】音频短时时域分析
这一帧的窗口没有截取到周期,因此不扩展周期的都计算错了。
【音频分析】音频短时时域分析
把计算出来的基频和praat计算处来的对比,发现差不多
【音频分析】音频短时时域分析文章来源地址https://www.toymoban.com/news/detail-403371.html

到了这里,关于【音频分析】音频短时时域分析的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【Matlab】音频信号谱分析及椭圆滤波处理

    一个使用matlab对音频信号进行频谱分析及滤波处理的学习笔记,本文使用的是椭圆滤波器。 音频下载 demo.mp3 读取音频信号进行傅里叶变换 结果如下 在谱分析中使用matlab自带的快速傅里叶变换函数进行变换 在IIR滤波器设计中使用椭圆低通滤波器 椭圆滤波器使用 入门级教程

    2024年02月12日
    浏览(41)
  • 【MATLAB】制作二阶系统的时域分析GUI界面:登录界面的设计和二阶系统时域分析界面

    首先,在命令行窗口输入guide,进入gui向导进行创建GUI,如图: 使用静态文本标识标题和账号密码名称: 双击静态文本,在检查器页面中修改名称: 还可以修改字体大小(根据需求设置合适大小): 然后设置两个可编辑文本作为输入框(同样可修改参数): 最后设置一个“

    2024年04月28日
    浏览(36)
  • 【Matlab】音频信号分析及FIR滤波处理——凯泽(Kaiser)窗

    1.1 课题内容: 利用麦克风采集语音信号(人的声音、或乐器声乐),人为加上环境噪声(窄带) 分析上述声音信号的频谱,比较两种情况下的差异 根据信号的频谱分布,选取合适的滤波器指标(频率指标、衰减指标),设计对应的 FIR 滤波器 实现数字滤波,将滤波前、后的声

    2024年02月21日
    浏览(42)
  • 【自控笔记】线性系统时域分析法

    二阶系统单位阶跃

    2024年04月11日
    浏览(42)
  • MATLAB-自动控制原理-时域分析

    目录 step函数(求阶跃响应): impulse函数(求脉冲响应): lsim函数(求输出): 1,求二阶系统不同阻尼比条件下的阶跃响应曲线 2,求二阶负反馈系统的动态性能指标  利用MATLAB可以方便地进行控制系统的时域分析。洋相判断系统的稳定性,只要求出系统的闭环极点,即闭环传

    2024年02月04日
    浏览(37)
  • Chapter2:时域分析法(下)

    第二章:时域分析法 Exercise2.15 设单位反馈系统的开环传递函数为: G ( s ) = 4 s ( s + 2 ) G(s)=displaystylefrac{4}{s(s+2)} G (

    2024年02月02日
    浏览(45)
  • MATLAB连续LTI系统的时域分析(十)

    目录 1、实验目的: 2、实验内容: 1) 掌握利用 MATLAB 对系统进行时域分析的方法 ; 2) 掌握连续时间系统零输入响应的求解方法 ; 3) 掌握连续时间系统零状态响应、冲激响应和阶跃响应的求解方法 ; 4) 掌握利用计算机进行卷积积分和卷积和计算的方法 。 2-1)、 已知

    2024年02月01日
    浏览(40)
  • 新手入门matlab之线性系统的时域分析

    ##  matlab是一个基于矩阵运算的数学软件,又称矩阵实验室,所以里面的所有东西都是以矩阵的形式来进行运算的  ## ##   首先我们先介绍一下构建传递函数的基本格式,以及一些函数的用法 ## 一.首先打开matlab,直接在命令行窗口新建对应闭环传递函数的矩阵    ***上面是

    2024年02月06日
    浏览(41)
  • 基于C#和MATLAB对手机录音音频数据分析处理系统 毕业论文+项目源码

    摘要 当今科学技术发展迅猛,知识爆炸信息量的急剧增加不仅仅丰富了我们的现实生活,也对我们的信息处理技术提出了新的要求。音频信号在这信息洪流中占据着不可或缺的重要地位,诸如语音聊天,音频取证等在我们的生活中发挥着愈来愈重要的作用,故而对于音频的特

    2024年01月19日
    浏览(40)
  • 【控制工程基础】四、系统的动态性能指标与时域分析

    本节内容可参考这篇 自动控制原理笔记三(线性系统的时域分析)_派大星先生c的博客-CSDN博客_过阻尼,欠阻尼 csdn 定义如上,定义倒不用死记硬背,因为让你算的时候都不是从定义来算的。  延迟时间td,上升时间tr,峰值时间tp,超调量σ(也有写成P.O.的),调节时间ts 可以

    2024年02月08日
    浏览(42)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包