大部分内容参考自https://zhuanlan.zhihu.com/p/157540476
原文中处理的数据类型是一维数据类型,由于wav文件也是一维数据,因此同样适用。
1. 第一种实现方法
1.1 基本介绍
小波层数:5
小波基:sym8
阈值公式:,cD1为第一层分解的细节系数,N为数据长度
阈值函数:软硬阈值折中的方法
1.2 代码
# 读excel表格数据进行去噪,并使用自适应阈值计算和软阈值收缩处理
import librosa
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import math
import pywt
# 封装成函数
def sgn(num):
if(num > 0.0):
return 1.0
elif(num == 0.0):
return 0.0
else:
return -1.0
def wavelet_noising(new_df):
data = new_df
data = data.tolist() # 将np.ndarray()转化为列表
w = pywt.Wavelet('sym8') # 选择sym8小波基
[ca5, cd5, cd4, cd3, cd2, cd1] = pywt.wavedec(data, w, level=5) # 5层小波分解
length1 = len(cd1)
length0 = len(data)
Cd1 = np.array(cd1)
abs_cd1 = np.abs(Cd1)
median_cd1 = np.median(abs_cd1)
sigma = (1.0/0.6745)*median_cd1
lamda = sigma * math.sqrt(2.0*math.log(float(length0), math.e)) # 固定阈值计算
usecoeffs = []
usecoeffs.append(ca5) # 向列表末尾添加对象
# 软硬阈值折中的方法
a = 0.5
for k in range(length1):
if (abs(cd1[k]) >= lamda):
cd1[k] = sgn(cd1[k]) * (abs(cd1[k]) - a*lamda)
else:
cd1[k] = 0.0
length2 = len(cd2)
for k in range(length2):
if (abs(cd2[k]) >= lamda):
cd2[k] = sgn(cd2[k])*(abs(cd2[k])-a*lamda)
else:
cd2[k] = 0.0
length3 = len(cd3)
for k in range(length3):
if (abs(cd3[k]) >= lamda):
cd3[k] = sgn(cd3[k]) * (abs(cd3[k]) - a * lamda)
else:
cd3[k] = 0.0
length4 = len(cd4)
for k in range(length4):
if (abs(cd4[k]) >= lamda):
cd4[k] = sgn(cd4[k]) * (abs(cd4[k]) - a * lamda)
else:
cd4[k] = 0.0
length5 = len(cd5)
for k in range(length5):
if (abs(cd5[k]) >= lamda):
cd5[k] = sgn(cd5[k]) * (abs(cd5[k]) - a * lamda)
else:
cd5[k] = 0.0
usecoeffs.append(cd5)
usecoeffs.append(cd4)
usecoeffs.append(cd3)
usecoeffs.append(cd2)
usecoeffs.append(cd1)
recoeffs = pywt.waverec(usecoeffs, w) # 信号重构
return recoeffs
# 主函数
# path = "" #数据路径
# 提取数据
path = 'G:\实验数据集/5s/fold1/1_001-140.wav'
data, sr = librosa.load(path, sr = 16000)
'''data = pd.read_csv(path)
data = data.iloc[:, 0] # 取第一列数据'''
plt.plot(data)
plt.show()
print(data)
data_denoising = wavelet_noising(data) # 调用函数进行小波去噪
plt.plot(data_denoising) # 显示去噪结果
plt.show()
1.3 去噪效果
去噪前的音频波形
去噪后的音频波形
2 第二种实现方法
#模块调用
import librosa
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import math
import pywt
from math import log
#sgn函数
def sgn(num):
if(num > 0.0):
return 1.0
elif(num == 0.0):
return 0.0
else:
return -1.0
def wavelet_noising(new_df):
data = new_df
data = data.values.T.tolist() # 将np.ndarray()转为列表
w = pywt.Wavelet('dB10')#选择dB10小波基
ca3, cd3, cd2, cd1 = pywt.wavedec(data, w, level=3) # 3层小波分解
ca3=ca3.squeeze(axis=0) #ndarray数组减维:(1,a)->(a,)
cd3 = cd3.squeeze(axis=0)
cd2 = cd2.squeeze(axis=0)
cd1 = cd1.squeeze(axis=0)
length1 = len(cd1)
length0 = len(data[0])
abs_cd1 = np.abs(np.array(cd1))
median_cd1 = np.median(abs_cd1)
sigma = (1.0 / 0.6745) * median_cd1
lamda = sigma * math.sqrt(2.0 * math.log(float(length0 ), math.e))
usecoeffs = []
usecoeffs.append(ca3)
#软阈值方法
for k in range(length1):
if (abs(cd1[k]) >= lamda/np.log2(2)):
cd1[k] = sgn(cd1[k]) * (abs(cd1[k]) - lamda/np.log2(2))
else:
cd1[k] = 0.0
length2 = len(cd2)
for k in range(length2):
if (abs(cd2[k]) >= lamda/np.log2(3)):
cd2[k] = sgn(cd2[k]) * (abs(cd2[k]) - lamda/np.log2(3))
else:
cd2[k] = 0.0
length3 = len(cd3)
for k in range(length3):
if (abs(cd3[k]) >= lamda/np.log2(4)):
cd3[k] = sgn(cd3[k]) * (abs(cd3[k]) - lamda/np.log2(4))
else:
cd3[k] = 0.0
usecoeffs.append(cd3)
usecoeffs.append(cd2)
usecoeffs.append(cd1)
recoeffs = pywt.waverec(usecoeffs, w)#信号重构
return recoeffs
path = 'G:\实验数据集/5s/fold1/1_001-140.wav'
data, sr = librosa.load(path, sr = 16000)
'''data = pd.read_csv(path)
data = data.iloc[:, 0] # 取第一列数据'''
plt.plot(data)
plt.show()
print(data)
data_denoising = wavelet_noising(data)#调用小波阈值方法去噪
print(data_denoising)
plt.figure()
plt.plot(data_denoising)#显示去噪结果
plt.show()
去噪前:
去噪后:
3. 小波阈值去噪简略原理
对信号进行小波分解时,系数分解为近似小波系数(信号的低频成分)和细节小波系数(信号的高频成分)
小波阈值去噪方法认为,信号中的噪声存在于高频成分之中,因此,对于细节小波系数作阈值收缩处理,再将个小波系数进行组合重构就得到去噪后的信号。
如何对细节小波系数做阈值收缩处理呢?
信号经小波分解后:对于每层的小波系数,噪声对应的数值较小,因为,选取合适的阈值,将绝对值小于阈值的小波系数置0,绝对值较大的系数语义保留或收缩(阈值函数的作用),再利用小波逆变换进行重构,即得到去噪后的信号。
小波阈值去噪信号的步骤
(1) 对含噪信号进行小波分解。选择合适的小波基以及分解尺度,进行小波分解,得到一组小波系数。
(2) 对小波分解的各层高频系数进行阈值量化处理,得到小波系数的估计值。文章来源:https://www.toymoban.com/news/detail-416415.html
(3)对经阈值量化处理的小波系数,进行逆小波变换以重构信号,得到去噪信号。文章来源地址https://www.toymoban.com/news/detail-416415.html
到了这里,关于音频数据小波去噪-python的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!