要对音频进行降噪,可以使用Python的librosa库。下面是一个简单的示例代码:
import librosa
import numpy as np
import soundfile as sf
# 读取音频文件
audio, sr = librosa.load('input.wav', sr=None)
# 计算短时傅里叶变换(STFT)
stft = librosa.stft(audio)
# 计算音频的能量谱
power = np.abs(stft) ** 2
# 设置阈值(根据实际情况调整)
threshold = np.mean(power) * 0.5
# 将低于阈值的能量谱置为0
mask = power < threshold
power[mask] = 0
# 逆短时傅里叶变换(ISTFT)得到降噪后的音频
denoised_stft = np.sqrt(power) * np.exp(1j * np.angle(stft))
denoised_audio = librosa.istft(denoised_stft)
# 保存降噪后的音频文件
sf.write('output.wav', denoised_audio, sr)
在上述代码中,首先使用librosa库读取音频文件,并计算音频的短时傅里叶变换(STFT)。然后,计算音频的能量谱,并根据阈值将低于阈值的能量谱置为0。最后,使用逆短时傅里叶变换(ISTFT)将能量谱转换回音频信号,并保存降噪后的音频文件。请根据实际情况调整阈值以获得最佳的降噪效果。