python音频文件的1/3八度

时间:2019-06-27 13:02:46

标签: python audio fft

我是信号处理的初学者,我想在mp3或wav文件上应用三倍频程带通滤波器(产生大约30个新的滤波时间序列) 中心频率:39 Hz,50 Hz,63 Hz,79 Hz,99 Hz,125 Hz,157 Hz,198 Hz,250 Hz,315 Hz,397 Hz,500 Hz,...

第一种方式...

阅读mp3文件后,我得到了立体声信号。然后,我将1个音频文件分割为4096个样本。然后我将其分离到左右声道。现在,每个通道都有数据数组。接下来,我将快速傅立叶变换应用于示例文件。问题是我需要将三倍频程带通滤波器应用于这些样本。我需要一些建议,因为我不太了解声学库。

另一种方式...

我找到了一些与我的期望有关的网站,但他使用倍频程带通滤波器。我使用了迈克尔在https://www.dsprelated.com/thread/7036/octave-bandpass-filter-on-audio-wav-files上的回复中的代码 因此,我想将此代码应用于三度八度。

from scipy import signal
import numpy as np
import matplotlib.pyplot as plt
import math

sampleRate = 44100.0
nyquistRate = sampleRate/2.0

#center = [39, 50, 63, 79, 99, 125, 157, 198, 250, 315, 397, 500, 630, 
794, 1000, 1260, 1588, 2000, 2520, 3176, 4000, 5040, 6352, 8000, 10080, 
12704, 16000, 20160, 2508, 32000]
centerFrequency_Hz = 480.0;
lowerCutoffFrequency_Hz=centerFrequency_Hz/math.sqrt(2);
upperCutoffFrequenc_Hz=centerFrequency_Hz*math.sqrt(2);

# Determine numerator (b) and denominator (a) coefficients of the digital 
# Infinite Impulse Response (IIR) filter.
b, a = signal.butter( N=4, Wn=np.array([ lowerCutoffFrequency_Hz, 
upperCutoffFrequenc_Hz])/nyquistRate, btype='bandpass', analog=False, 
output='ba');

# Compute frequency response of the filter.
w, h = signal.freqz(b, a)

fig = plt.figure()
plt.title('Digital filter frequency response')
ax1 = fig.add_subplot(111)

plt.plot(w, 20 * np.log10(abs(h)), 'b')
plt.ylabel('Amplitude [dB]', color='b')
plt.xlabel('Frequency [rad/sample]')

ax2 = ax1.twinx()
angles = np.unwrap(np.angle(h))
plt.plot(w, angles, 'g')
plt.ylabel('Angle (radians)', color='g')
plt.grid()
plt.axis('tight')
plt.show()

fs, speech = wavfile.read(filename='segmented/atb30.wav');
speech = speech[:, 0]
fig=plt.figure()
plt.title('Speech Signal')
plt.plot(speech)

filteredSpeech=signal.filtfilt(b, a, speech)
fig=plt.figure()
plt.title('480 Hz Octave-band Filtered Speech')
plt.plot(filteredSpeech)

2 个答案:

答案 0 :(得分:0)

根据ANSI S1.11: Specification for Octave, Half-Octave, and Third Octave Band Filter Sets中的公式(5)和(6),对于1/3倍频程,每个频段的下限和上限频率由下式给出:

factor = np.power(G, 1.0/6.0)
lowerCutoffFrequency_Hz=centerFrequency_Hz/factor;
upperCutoffFrequency_Hz=centerFrequency_Hz*factor;

其中G是2(根据指定的base-2规则设计过滤器时)或np.power(10, 0.3)(根据指定的base-10规则设计过滤器时)。在您的情况下,您提供的中心频率接近使用base-2规则获得的值,因此也应G = 2保持一致。

请注意,对于给定的中心频率阵列,较高频率的一些值将大于奈奎斯特频率(一半采样率)。当尝试使用scipy.signal.butter设计滤波器时,这些将相应地产生无效的上标准化频率输入。为避免这种情况,应将中心频率数组的值限制为小于〜19644Hz:

centerFrequency_Hz = np.array([39, 50, 63, 79, 99, 125, 157, 198, 250, 315, 
397, 500, 630, 794, 1000, 1260, 1588, 2000, 2520, 3176, 4000, 5040, 6352, 8000, 10080, 
12704, 16000])

此外,scipy.signal.butter一次可以处理一组低频率和高频率,因此您应该遍历低频率和高频率阵列以设计每个带通滤波器:

for lower,upper in zip(lowerCutoffFrequency_Hz, upperCutoffFrequency_Hz):
    # Determine numerator (b) and denominator (a) coefficients of the digital 
    # Infinite Impulse Response (IIR) filter.
    b, a = signal.butter( N=4, Wn=np.array([ lower, 
    upper])/nyquistRate, btype='bandpass', analog=False, 
    output='ba');

    # Compute frequency response of the filter.
    w, h = signal.freqz(b, a)

    plt.plot(w, 20 * np.log10(abs(h)), 'b')

    # Filter signal
    filteredSpeech = signal.filtfilt(b, a, speech)

对于幅值响应,这应该为您提供类似于以下内容的图:

enter image description here

这时您可能会注意到最低频段的不稳定迹象。为避免此问题,您可以切换到sos表示形式:

for lower,upper in zip(lowerCutoffFrequency_Hz, upperCutoffFrequency_Hz):
    # Design filter
    sos = signal.butter( N=4, Wn=np.array([ lower, 
    upper])/nyquistRate, btype='bandpass', analog=False, 
    output='sos');

    # Compute frequency response of the filter.
    w, h = signal.sosfreqz(sos)

    plt.plot(w, 20 * np.log10(abs(h)), 'b')

    # Filter signal
    filteredSpeech = signal.sosfiltfilt(sos, speech)

答案 1 :(得分:0)

我最近开发了一个函数,可以轻松执行倍频程和分数倍频程滤波,可在github上找到它:PyOctaveBand

它使用SOS系数并执行下采样以在低频下正确滤波。