05|音频降噪概述(1)一传统降噪方法

这篇具有很好参考价值的文章主要介绍了05|音频降噪概述(1)一传统降噪方法。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

一. 噪声的分类:

加性噪声和乘性噪声:

稳态噪声和非稳态噪声:

二. 如何降噪

1.线性滤波器:

2.谱减法

3.基于统计模型的实时降噪算法

3.1 核心思想:

3.2 基于两个假设:

 3.3 维纳滤波

WebRTC原生降噪算法的三个特点:

3.4 改进方法OMLSA & IMCRA

4.子空间算法

思想:

算法:

算法场景:

4.基于机器学习的降噪

5.其他降噪方法


一. 噪声的分类:

加性噪声和乘性噪声:

加性噪声:加性噪声和信号直接不相关,满足加性条件。由噪声和源信号相加得到的。  种类按照声源,比如风声、汽笛声、键盘敲击声等。

乘性噪声:噪声和信号是相关联的,比如房间的混响、信号的衰减、开普勒效应等。并且往往是从信道传输中产生,也叫信号噪声

稳态噪声和非稳态噪声:

从降噪的角度,按照噪声是否稳定。

稳态噪声:一直存在且响度、频率分布等特性不随时间变化或变化缓慢。  如手机、电脑之类的设备底噪、电脑散热架的风扇声等。

非稳态噪声:这些噪声等统计特性随时间变化   比如开关门等声音、门铃声、背景人声等。     非稳态噪声按照是否连续又分为 连续非稳态噪声(持续的背景人声)和瞬态噪声(敲击声)。

如下图,左稳态噪声右为非稳态噪声:

音频降噪算法,音频技术学习总结,音视频,降噪,维纳滤波,语音降噪,噪音分类

稳态噪声可以通过之前出现过的噪声进行建模抑制。非稳态噪声则是通过区分和正常语音的差异。另外噪声往往不是单独存在。

二. 如何降噪

1.线性滤波器:

【频段降噪、硬件】

线性滤波器处理方法算力要求较低,但需知道噪声会在哪个频段出现。  实际中会先做噪声出现的频段检测,再设计线性滤波器或滤波器组来消除噪声。

常见于音频采集硬件中,因为硬件厂商知道自己的硬件噪声特性。如电路设计中有些频段会有持续的电流声,则可以采用比如高通滤波器消除滴频噪声、用一些陷波滤波器消除某些频段的持续噪声。

 

2.谱减法

【非人声、减噪声谱、幅度谱减法、功率谱减法】

核心是先取一段非人声音频,记录下噪声的频谱能量,然后从音频频谱中减去这个噪声频谱能量。   适用于离线稳态噪声的降噪处理。

3.基于统计模型的实时降噪算法

3.1 核心思想:

用统计的方法估算出音频每个频点对应噪声和语言的能量。  (适用于相对平稳噪声)

3.2 基于两个假设:

  1. 噪声相对于人声在时频域上的声学统计特性更稳定。
  2. 所有的噪声都满足加性条件。

 3.3 维纳滤波

采用最小均方误差准则设计的线性滤波器。 

如实时频域维纳滤波器,目标是求当前帧每个频点的能量中有多少占比是语音。    只能通过后验的带噪信号 与 噪声的信噪比 估计前验的语音和含噪信号比值。

3.3.1维纳滤波的降噪原理:

从动态平滑的噪声模型得到噪声,根据带噪信号和噪声模型经过维纳滤波器进行降噪。

音频降噪算法,音频技术学习总结,音视频,降噪,维纳滤波,语音降噪,噪音分类

3.3.2 流程

  1. 短时傅里叶变换(加窗分帧),再快速傅里叶变换得到模,再求功率谱。
  2. 利用功率谱进行分位数噪声估计、语音存在概率、噪声更新以及噪声抑制系数计算。
  3. 得到的每个频点的抑制系数乘 带噪信号的频谱 得到降噪后的频谱。
  4. ISTFT得到降噪后的时域信号。

3.3.3 分位数噪声估计与维纳滤波降噪的特点

分位数噪声估计与维纳滤波的降噪算法逻辑背后的思考:

  1. 基于统计的降噪主要是对噪声进行建模(一般是稳态的噪声)。 且噪声模型迭代不能太快,比如WebRTC所用的分位数噪声估计是基于频域更新,更新周期大约是700ms。  当噪声发生了变化,模型可能需要500ms-4s的时间来收敛到新的噪声模型,并且会存在噪声残留。
  2. 降噪思想类似于谱减法,利用无人段进行噪声估计。
  3. 为区分人声与非人声采用VAD。  这里VAD通过人工提取的特征统计得出的语音存在概率进行判断。  特征包括,频谱平坦度、频谱差异度以及先验和后验信噪比的差异得出的似然因子。

3.3.4 Speech Probability的计算流程:

音频降噪算法,音频技术学习总结,音视频,降噪,维纳滤波,语音降噪,噪音分类

  1. 似然因子在频域计算log 均值得到 in dicator0;
  2. 根据频谱平坦度和差异度分别得到indicator1/2

语音概率通过三个指标的加权平均和似然因子进行更新。 实际更新zhong 概率较大时,噪声模型更新很缓慢,因为语音存在的概率大,反之更新快。

噪声模型是通过分位数据噪声估计得到。 比如有经验假设在噪声能量谱里,能量最小的1/4是稳态噪声。应该用这个部分更新初始噪声模型。

利用初始的噪声模型可以得到频谱平坦度、频谱差异度以及对数似然因子,进而得到语音存在概率。   有了语音存在概率就可以更新噪声模型。  再根据噪声模型和带噪信号,根据加性假设。干净语谱是通过带噪信号减去 噪声信号 或带噪信号乘。频谱增益。

WebRTC原生降噪算法的三个特点:

  1. 由于语音概率的判断降噪在有人声时不会进行噪声模型的更新。优点是不会对语音造成损伤比如不会吃字,但如果噪声在说话的时候发现变化,那么噪声无法被有效消除。
  2. 就MMSE的维纳滤波的弊端是对于浊音谐波间的噪声会存在残留。  噪声残留随着语音出现,即音乐噪声。
  3. 在低信噪比时,语音存在概率的判断会失效,会产生较大的语谱损伤。

3.4 改进方法OMLSA & IMCRA

OMLSA:是对人声估计,通过先验概率和先验信噪比SNR的估计 得到有声条件概率。

IMCRA:是对信号的最小值追踪,同样得到先验无声概率和先验信噪比估计,计算 条件有声概率,进而获取噪声谱的估计。

两者结合是对功率谱的最小点进行追踪。所以谐波中的音乐噪声由于明显小于谐波的能量就可以被去除,可以有效去除音乐噪声。

4.子空间算法

【NMF、耳机风噪、单独建模】

思想:

子空间算法重要是针对已知的噪声类型,量身定做一个降噪算法。  把噪声和人声投影到高纬度的空间,把不容易分离的信号变成高纬度可分的子空间,从而可分的信号。 

算法:

NMF(非负矩阵分离)和字典法建模等

算法场景:

比如去除风噪,可以对风噪建模,可以有效去噪。但缺点很明显,每种噪声都得单独建模。

4.基于机器学习的降噪

基于数据驱动的方法,训练神经网络进行降噪。 特点是噪声鲁棒性好,能兼顾稳态、非稳态和瞬态噪声。  见下一讲

5.其他降噪方法

【麦克风阵列定向增强+单通道降噪

结合基于麦克风阵列的降噪: 采集信号用麦克风阵列,可以使用波束形成的方法先锁定声源方向进行收音,比如说话人的方向进行收音,这样采集的信号信噪比更高,再通过单通道降噪可以更有效。

参考文献:

WIP: https://patentimages.storage.googleapis.com/a4/d9/d6/f3e557a291b982/WO2012158156A1.pdf

音频降噪算法,音频技术学习总结,音视频,降噪,维纳滤波,语音降噪,噪音分类文章来源地址https://www.toymoban.com/news/detail-783037.html

到了这里,关于05|音频降噪概述(1)一传统降噪方法的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • chatgpt赋能python:Python音频降噪:如何利用Python降噪音频?

    随着音频技术的不断发展,音频处理已经成为了我们生活中不可或缺的一部分。在音频处理的过程中,降噪技术是非常重要的一环。Python作为一种高级编程语言,已经成为了音频降噪领域的常用工具。在本篇文章中,我们将探讨如何利用Python降噪音频。 音频降噪是指在音频信

    2024年02月07日
    浏览(45)
  • MATLAB环境下基于深度学习的语音降噪方法

    之前简单的利用深层自编码器对语音信号进行降噪 基于自编码器的语音信号降噪 - 哥廷根数学学派的文章 - 知乎 基于自编码器的语音信号降噪 - 知乎 本篇讲一些稍微复杂的基于深度学习的语音降噪方法,并比较了应用于同一任务的两种的网络:全连接层网络和卷积网络。

    2024年02月04日
    浏览(41)
  • 音频降噪模型汇总

    从事语音降噪增强算法开发多年了,上学期间和入行的前段都是做传统信号处理算法。19年以后基于深度学习的语音降噪模型凭借其优秀的处理效果,一时风头无两,似乎每个人都开始走上了模型降噪的路子。 特别是从2020年微软开始举办的Deep Noise Suppression Challenge – INTERSP

    2023年04月23日
    浏览(47)
  • 音频降噪之人声分离

    集成目前最先进的从音频文件中分离人声的源分离模型。 本工程,将Ultimate Vocal Remover GUI v5.5.1界面工具,改写成可以在服务器端批量推理的工具。 界面仓库地址:https://github.com/Anjok07/ultimatevocalremovergui 暂不支持两种模型联合处理。 (1)VR Architecture: 具有9种模式的模型,这些

    2024年02月16日
    浏览(40)
  • Audio-音频降噪、回声消除处理

            对音频数据进行处理时经常会对mic阵列的选择有很多特殊要求,当原始录取的音频阵列排布有问题时,会进行一些软件的处理,使阵列排布达到一定的要求。          对于4ch音频数据而言,麦克阵列排列要求为mic1、mic2、ref1、ref2,但是通过tinycap采集的原始音频数

    2023年04月08日
    浏览(36)
  • 降噪音频转录 Krisp: v1.40.7 Crack

    主打人工智能降噪服务的初创公司「Krisp」近期宣布推出音频转录功能,能对电话和视频会议进行实时设备转录。该软件还整合的Chat@GPT,以便快速总结内容,开放测试版于今天上线。 随着线上会议越来越频繁,会议转录已成为团队工作的重要一环。「Krisp」利用训练系统识别

    2024年02月10日
    浏览(36)
  • 【音频分析】不同小波变换模型音频降噪(含SNR MSE)【含Matlab源码 3935期】

    ✅博主简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,Matlab项目合作可私信。 🍎个人主页:海神之光 🏆代码获取方式: 海神之光Matlab王者学习之路—代码获取方式 ⛳️座右铭:行百里者,半于九十。 更多Matlab仿真内容点击👇 Matlab图像处理(进阶版) 路径规划

    2024年02月19日
    浏览(40)
  • 【滤波专题-第7篇】“类EMD”算法分解后要怎样使用(3)——EMD降噪方法及MATLAB代码实现

    使用EMD分解(以及其他“类EMD”分解方法,以下为了简便统称EMD)做信号降噪,是EMD的一个比较重要的应用方向。EMD可以将复杂的信号分解为一系列的固有模态函数(IMFs),每一个IMF都包含了信号的一部分频率信息。在信号降噪的过程中,如何选择和筛选IMFs是关键步骤之一

    2024年02月16日
    浏览(38)
  • 今日分享:这4款音频降噪去杂音的软件,太好用了

    你知道音频降噪去杂音怎么操作吗?在现代社会,音频处理已经成为了一项重要的技能。无论是语音录音、音乐创作,还是影视制作,我们都需要高质量的音频素材。 但在实际操作中,我们常常会遇到环境噪声、背景杂音等问题,这些问题会导致我们的音频质量下降,影响效

    2024年02月02日
    浏览(120)
  • PR音频降噪教程 | 如何在 Premiere Pro 中消除背景噪音

    Adobe Premiere Pro 是一款功能强大的视频编软件。但是当你使用它时,你可能也会使用音频。有时,我们必须处理的音频并不是最好的。在录制过程中很容易捕捉到背景噪音。但是你可以在后期制作中大大改进它。 在本教程中,我们将学习如何在 Premiere 中降噪。借助内置功能,

    2024年02月05日
    浏览(55)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包