音频数据小波去噪-python

这篇具有很好参考价值的文章主要介绍了音频数据小波去噪-python。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

大部分内容参考自https://zhuanlan.zhihu.com/p/157540476
原文中处理的数据类型是一维数据类型,由于wav文件也是一维数据,因此同样适用。

1. 第一种实现方法

1.1 基本介绍

小波层数:5
小波基:sym8
阈值公式:音频数据小波去噪-python,cD1为第一层分解的细节系数,N为数据长度
阈值函数:软硬阈值折中的方法

1.2 代码

# 读excel表格数据进行去噪,并使用自适应阈值计算和软阈值收缩处理
import librosa
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import math
import pywt

# 封装成函数
def sgn(num):
    if(num > 0.0):
        return 1.0
    elif(num == 0.0):
        return 0.0
    else:
        return -1.0

def wavelet_noising(new_df):
    data = new_df
    data = data.tolist()  # 将np.ndarray()转化为列表
    w = pywt.Wavelet('sym8')  # 选择sym8小波基
    [ca5, cd5, cd4, cd3, cd2, cd1] = pywt.wavedec(data, w, level=5)  # 5层小波分解
    length1 = len(cd1)
    length0 = len(data)

    Cd1 = np.array(cd1)
    abs_cd1 = np.abs(Cd1)
    median_cd1 = np.median(abs_cd1)

    sigma = (1.0/0.6745)*median_cd1
    lamda = sigma * math.sqrt(2.0*math.log(float(length0), math.e))  # 固定阈值计算
    usecoeffs = []
    usecoeffs.append(ca5)  # 向列表末尾添加对象

    # 软硬阈值折中的方法
    a = 0.5
    for k in range(length1):
        if (abs(cd1[k]) >= lamda):
            cd1[k] = sgn(cd1[k]) * (abs(cd1[k]) - a*lamda)
        else:
            cd1[k] = 0.0

    length2 = len(cd2)
    for k in range(length2):
        if (abs(cd2[k]) >= lamda):
            cd2[k] = sgn(cd2[k])*(abs(cd2[k])-a*lamda)
        else:
            cd2[k] = 0.0

    length3 = len(cd3)
    for k in range(length3):
        if (abs(cd3[k]) >= lamda):
            cd3[k] = sgn(cd3[k]) * (abs(cd3[k]) - a * lamda)
        else:
            cd3[k] = 0.0

    length4 = len(cd4)
    for k in range(length4):
        if (abs(cd4[k]) >= lamda):
            cd4[k] = sgn(cd4[k]) * (abs(cd4[k]) - a * lamda)
        else:
            cd4[k] = 0.0

    length5 = len(cd5)
    for k in range(length5):
        if (abs(cd5[k]) >= lamda):
            cd5[k] = sgn(cd5[k]) * (abs(cd5[k]) - a * lamda)
        else:
            cd5[k] = 0.0

    usecoeffs.append(cd5)
    usecoeffs.append(cd4)
    usecoeffs.append(cd3)
    usecoeffs.append(cd2)
    usecoeffs.append(cd1)
    recoeffs = pywt.waverec(usecoeffs, w)  # 信号重构
    return recoeffs

# 主函数
# path = "" #数据路径

# 提取数据
path = 'G:\实验数据集/5s/fold1/1_001-140.wav'
data, sr = librosa.load(path, sr = 16000)
'''data = pd.read_csv(path)
data = data.iloc[:, 0]  # 取第一列数据'''
plt.plot(data)
plt.show()
print(data)

data_denoising = wavelet_noising(data)  # 调用函数进行小波去噪
plt.plot(data_denoising)  # 显示去噪结果
plt.show()

1.3 去噪效果

去噪前的音频波形
音频数据小波去噪-python
去噪后的音频波形
音频数据小波去噪-python
音频数据小波去噪-python

2 第二种实现方法

音频数据小波去噪-python

#模块调用
import librosa
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import math
import pywt
from math import log

#sgn函数
def sgn(num):
    if(num > 0.0):
        return 1.0
    elif(num == 0.0):
        return 0.0
    else:
        return -1.0

def wavelet_noising(new_df):
    data = new_df
    data = data.values.T.tolist()  # 将np.ndarray()转为列表
    w = pywt.Wavelet('dB10')#选择dB10小波基
    ca3, cd3, cd2, cd1 = pywt.wavedec(data, w, level=3)  # 3层小波分解
    ca3=ca3.squeeze(axis=0) #ndarray数组减维:(1,a)->(a,)
    cd3 = cd3.squeeze(axis=0)
    cd2 = cd2.squeeze(axis=0)
    cd1 = cd1.squeeze(axis=0)
    length1 = len(cd1)
    length0 = len(data[0])

    abs_cd1 = np.abs(np.array(cd1))
    median_cd1 = np.median(abs_cd1)

    sigma = (1.0 / 0.6745) * median_cd1
    lamda = sigma * math.sqrt(2.0 * math.log(float(length0 ), math.e))
    usecoeffs = []
    usecoeffs.append(ca3)

    #软阈值方法
    for k in range(length1):
        if (abs(cd1[k]) >= lamda/np.log2(2)):
            cd1[k] = sgn(cd1[k]) * (abs(cd1[k]) - lamda/np.log2(2))
        else:
            cd1[k] = 0.0

    length2 = len(cd2)
    for k in range(length2):
        if (abs(cd2[k]) >= lamda/np.log2(3)):
            cd2[k] = sgn(cd2[k]) * (abs(cd2[k]) - lamda/np.log2(3))
        else:
            cd2[k] = 0.0

    length3 = len(cd3)
    for k in range(length3):
        if (abs(cd3[k]) >= lamda/np.log2(4)):
            cd3[k] = sgn(cd3[k]) * (abs(cd3[k]) - lamda/np.log2(4))
        else:
            cd3[k] = 0.0

    usecoeffs.append(cd3)
    usecoeffs.append(cd2)
    usecoeffs.append(cd1)
    recoeffs = pywt.waverec(usecoeffs, w)#信号重构
    return recoeffs

path = 'G:\实验数据集/5s/fold1/1_001-140.wav'
data, sr = librosa.load(path, sr = 16000)
'''data = pd.read_csv(path)
data = data.iloc[:, 0]  # 取第一列数据'''
plt.plot(data)
plt.show()
print(data)

data_denoising = wavelet_noising(data)#调用小波阈值方法去噪
print(data_denoising)
plt.figure()
plt.plot(data_denoising)#显示去噪结果
plt.show()

去噪前:
音频数据小波去噪-python
去噪后:
音频数据小波去噪-python
音频数据小波去噪-python

3. 小波阈值去噪简略原理

对信号进行小波分解时,系数分解为近似小波系数(信号的低频成分)和细节小波系数(信号的高频成分)
小波阈值去噪方法认为,信号中的噪声存在于高频成分之中,因此,对于细节小波系数作阈值收缩处理,再将个小波系数进行组合重构就得到去噪后的信号。

如何对细节小波系数做阈值收缩处理呢?

信号经小波分解后:对于每层的小波系数,噪声对应的数值较小,因为,选取合适的阈值,将绝对值小于阈值的小波系数置0,绝对值较大的系数语义保留或收缩(阈值函数的作用),再利用小波逆变换进行重构,即得到去噪后的信号。

小波阈值去噪信号的步骤

(1) 对含噪信号进行小波分解。选择合适的小波基以及分解尺度,进行小波分解,得到一组小波系数。

(2) 对小波分解的各层高频系数进行阈值量化处理,得到小波系数的估计值。

(3)对经阈值量化处理的小波系数,进行逆小波变换以重构信号,得到去噪信号。文章来源地址https://www.toymoban.com/news/detail-416415.html

到了这里,关于音频数据小波去噪-python的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 结对编程 --- 大部分程序员喜欢的编程方式

    一、介绍 结对编程起源时间可以追溯到 1990 年代早期。这种编程方法最初由 Jim Highsmith 和 Alistair Cockburn 等人提出。后来,Kent Beck 和 Ward Cunningham 等人将其发展成为一种敏捷开发方法,被称为“极限编程”(Extreme Programming,简称 XP)。结对编程是 XP 中的一种核心实践,也是

    2024年02月06日
    浏览(35)
  • 用Matlab实现车牌分割(可识别大部分蓝色、绿色车牌)

          最近学习了数字图像处理的腐蚀、膨胀、闭运算、开运算等内容,于是想进行实践。车牌分割是一个不错的选择,里面涉及到了很多知识点。       这里先简述一下车牌分割的思路和流程(这里以绿色车牌为例): 1.定位绿色车牌区域 2.车牌矫正(如果图像中车牌是倾

    2024年02月12日
    浏览(33)
  • 低代码产品如何分类,大部分人都没有搞清楚

    最近许多技术峰会都出现了低代码这个名词,可以说,低代码是中台之后,又一个热门话题和名词了。 低代码平台是 无需编码或通过少量代码 就可以快速生成应用程序的开发平台。也是一款图形化、拖拉拽方式快速实现企业数字化转型中的创新应用、支持用少量代码扩展实

    2023年04月20日
    浏览(29)
  • 1200 + AI工具大收录,58个分类,支持大部分行业

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、使用步骤 总结 随着人工智能技术的不断发展,越来越多的AI工具涌现出来,它们在各个领域中得到了广泛的应用。除了常用的文本、图片、视频AI工具,还有普通办公、设计、编程、

    2024年02月16日
    浏览(26)
  • 安全清理大部分的C盘内存(一般10GB以上)

     如果感觉有用请 关注,点赞,收藏!  下次分享更有用的干货~ 欢迎转载,请注明出处! 用360清理发现, windows search日志 占用了70多个G空间,先清除!    该日志文件有撒用呢?  如果没有这个日志文件,我们在文件系统进行搜索的时候就会比较慢了,而且还会出现这样的

    2023年04月15日
    浏览(33)
  • MySQL 字段为 NULL 的5大坑,大部分人踩过

    在验证问题之前,我们先建一张测试表及测试数据。   构建的测试数据,如下图所示:   有了上面的表及数据之后,我们就来看当列中存在 NULL 值时,究竟会导致哪些问题? 我们都知道, count 是用来计数的,当表中某个字段存在 NULL 值时,就会造成 count 计算出来的数据丢

    2024年02月05日
    浏览(37)
  • CTF Misc(2)内存取证基础以及原理,覆盖了大部分题型

    内存取证在ctf比赛中也是常见的题目,内存取证是指在计算机系统的内存中进行取证分析,以获取有关计算机系统当前状态的信息。内存取证通常用于分析计算机系统上运行的进程、网络连接、文件、注册表等信息,并可以用于检测和分析恶意软件、网络攻击和其他安全事件

    2024年02月12日
    浏览(30)
  • windows11(win10大部分通用)系统C盘清理 | 深度优化

    前言 :首先对于计算机来说,Windows操作系统一般是安装在磁盘驱动器的C盘中,运行时会产生许多  垃圾文件  ,C盘空间在一定程度上会越来越小。而把它作为生产力工具的我们,时间越久,C盘常常会提示显示其内存已不足。C盘容量不足将会极大  影响系统的运行速度  ,

    2024年02月05日
    浏览(63)
  • 校园综合服务平台V3.9.2 源码修复大部分已知BUG

    校园综合服务平台,版本更新至V3.9.1  ,源码功能强大,ui 精美, 功能包含但不限于校园跑腿,外卖,组局,圈子,商城,抽奖,投票,团购,二手市场,签到,积分商城,一元购等!即刻源码持续更新

    2024年04月26日
    浏览(37)
  • 面试官:synchronized 能不能禁止指令重排序?大部分人都会答错!

    首先一定要明确:指令重排序和有序性是不一样的。这一点非常重要。 我们经常都会这么说: volatile能保证内存可见性、禁止指令重排序但是不能保证原子性。 synchronized能保证原子性、可见性和有序性。 注意:这里的有序性并不是代表能禁止指令重排序。 举个例子: 在双

    2024年02月11日
    浏览(27)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包