【音频处理】梅尔频率倒谱系数(MFCC)

这篇具有很好参考价值的文章主要介绍了【音频处理】梅尔频率倒谱系数(MFCC)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

闲来无事,整理了一下一些大学的学习音频处理的一些资料,当时用的是matlab,记录一下。

MFCC简介

梅尔频率倒谱系数(Mel-frequency cepstral coefficients 简称MFCC)。是在Mel标度频率域提取出来的倒谱参数,Mel标度描述了人耳频率的非线性特性,极好的模拟了人类听觉感知的处理。

matlab实现

MFCC与频率的关系是:
其中f为频率,单位为Hz【音频处理】梅尔频率倒谱系数(MFCC)MFCC的基本步骤为:【音频处理】梅尔频率倒谱系数(MFCC)
使用matlab实现:先是使用audioread函数导入wav数据,返回样本数据 x 以及该数据的采样率 Fs
首先是进行预加重。预加重,其实预加重就是相当于一个高通滤波器,滤波器函数在matlab中实现如:x=filter([1-alpha],1,x);其中,alpha就是预加重系数,speech还是原来得到的语音信号。预加重系数通常取在[0.95,0.97]区间取值。
接下来是分帧,在matlab中,分帧可以使用enframe函数解决,enframe函数将信号分成帧,每行一帧。调用格式形如:y=enframe(x,framelength,step)。enframe函数对x进行分帧,每帧长framelength,分得的帧数是nf = fix((nx-framelength+step)/step);
加窗,对于加窗,首先是进行窗函数的选择,在诸多窗函数中,目前应用最广泛的就是汉明窗。在matlab中,汉明窗在matlab中有自己的函数hamming(256)。将每一帧乘以汉明窗。在matlab中调用循环,将分好的帧乘以汉明窗函数,在matlab中,分好的帧以行的形式存在,将每一行乘以汉明窗。
接着是做快速傅里叶,将处理完的信号做FFT,在matlab中,fft(x)是FFT函数对x进行FFT处理。将FFT处理完的信号取绝对值或是平方值,假设取平方值,得到处理完的信号。
Mel滤波,在matlab中,先设定mel滤波系数,matlab函数melbankm,滤波器个数一般取20~26个。调用函数,将处理完的矩阵做全矩阵和归一化处理。得到mel滤波器系数。 接下来在mel频谱上进行到倒谱分析,在matlab中设置归一化倒谱提升窗口,对FFT参数进行mel滤波再进行倒谱分析。取对数,做逆变换,实际逆变换一般是通过DCT离散余弦变换来实现。设置DCT参数,做DCT运算后乘上倒谱系数得到MFCC参数。
最后,对数字信号做一阶差分处理,使得信号变得平滑,得到最后结果。文章来源地址https://www.toymoban.com/news/detail-409372.html

到了这里,关于【音频处理】梅尔频率倒谱系数(MFCC)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 闲来无事-夏天防止花被渴死

    前段时间,办了一张流量卡。 有了新的手机号码那就可以薅一波资本主义的羊毛了,所以我在京东上使用0.1大洋包邮的价格喜提了一个多肉,(在此之前我养过挺多的花,所有的都是忘了浇水被渴死了)此次痛并思痛,一定要让我0.1大洋的的多肉看到明年的太阳。 养花几乎

    2024年02月08日
    浏览(25)
  • python判定固定时长固定频率的音频是否连续

    我有一段时长大约为3.34 s 频率为1khz 的连续音频。该音频输入一个设备,经转换输出后,我想判断该音频是否还连续。 好了,这就是我的需求,看起来比较棘手,但我们稍稍了解音频采样率,码流,音频格式,通道的相关概念后,我们就可以用强大的python很快解决此问题。

    2023年04月08日
    浏览(24)
  • 闲来无事整个“方块消消乐”小游戏

      在996是福报,“付费上班”的如今。身为信息化进程的一颗螺丝钉,每天的通勤时间要四十几分钟(仅仅是在地铁上哦),漫漫这时候回家路难免显得有点寂寞有点空虚。这时好学的人会说听听有声书,趁着下班时间提升自己。而我可要优雅的回应道:“老子搬了一天砖

    2024年02月16日
    浏览(42)
  • Unity如何实现Microphone判断录入音频的频率是低音还是高音

    Unity中使用Microphone可以通过麦克风录制AudioClip音频,我们可以通过它实现录音功能,然后可以通过录入的音频数据对音频进行分析,比如音量大小,频率高低,等等。 我们今天就来分析一下音频的高音低音。 科普:一般人们习惯将音响划分一定的频段如高音、中音和低音等

    2024年02月11日
    浏览(34)
  • 深入理解梅尔刻度、梅尔滤波器组和梅尔时频谱图

    短时傅里叶变换公式 S ( m , k ) = ∑ n = 1 N − 1 x ( n + m H ) w ( n ) e − i 2 π k N n S(m,k) = sum_{n=1}^{N-1} x(n+mH)w(n)e^{-i2 pi frac{k}{N} n} S ( m , k ) = n = 1 ∑ N − 1 ​ x ( n + m H ) w ( n ) e − i 2 π N k ​ n 其中,m是当前滤波器的序号,表征了当前的时间段,k是当前频率的序号,表征了当前正在

    2023年04月14日
    浏览(34)
  • python数据处理——计算相关系数矩阵(Spearman)

    计算相关系数矩阵,原始数据如下: 计算相关系数矩阵代码如下: 计算结果保存到工作表,打开结果如下:  

    2024年02月16日
    浏览(34)
  • 理解梅尔频谱(mel spectrogram)

    语音处理中 常常需要用到mel spectrogram,比如在语音分类中常常会把把信号signal变成图片spectrogram的形式, 然后用分类图片的算法(比如CNN)来分类语音。 本文主要介绍什么是mel specgrogram以及如何通过librosa来获取spectrogram 和mel spectrogram 常说一个信号是多少多少赫兹的,指的是

    2024年02月05日
    浏览(28)
  • Python遥感图像处理应用篇(二十四):Python绘制遥感图像各波段热力图(相关系数矩阵)

    给多光谱遥感图像各个波段绘制热力图,首先需要计算波段之间的相关系数矩阵,而计算遥感图像波段相关系数矩阵有不同的方法,常用的我们可以采用遥感图像处理软件计算,比如ENVI软件就可以计算相关系数矩阵,使用工具箱中的Statistics工具即可进行多种统计运算。 我们

    2023年04月09日
    浏览(33)
  • 【电脑优化】win10、win11限制cpu处理器最大频率

    win+r输入regedit打开注册表 在注册表地址栏输入如下: 进入cpu相关设置页面,修改Attributes为2 3.此时电源计划设置页面,多出了处理器频率设置选项,可以设置适中点,限制3.8Ghz就输入3800就ok(不太严谨,见谅)。 此后,打开个大点的游戏,你会发现就算核心全部跑满,也不

    2024年02月04日
    浏览(47)
  • Python遥感图像处理应用篇(二十七):Python绘制遥感图像各波段热力图(相关系数矩阵)(续)

    续-https://soderayer.blog.csdn.net/article/details/125757807 上一篇中使用csv文件计算的相关系数热力图,本篇我们直接使用遥感图像来计算图像波段之间的相关系数。 实际上,目前已有的软件,如ENVI就可以直接计算图像波段之间的相关系数,该工具计算的是合成波段之间的相关系数。如

    2023年04月17日
    浏览(35)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包