如何使用python获取声音包络?

时间:2015-06-17 11:05:29

标签: python audio scipy signal-processing

你好我是python的新手,还有声音信号分析。我想要获得一首出生歌曲(斑胸草雀)的信封。它有一个非常快速的信号波动,我尝试了不同的方法。例如,我尝试绘制信号并使用以下代码获取信封,基于我找到的其他示例(我在代码中添加了注释以理解它):

#Import the libraries
from pylab import *
import numpy
import scipy.signal.signaltools as sigtool
import scipy, pylab
from scipy.io import wavfile
import wave, struct
import scipy.signal as signal

#Open the txt file and read the wave file (also save it as txt file)

f_out = open('mike_1_44100_.txt', 'w')
w     = scipy.io.wavfile.read("mike_1_44100_.wav") #here your sound file

a=w[1]
f_out.write('#time #z' + '\n')

#I print to check
print 'vector w'
print w[0],w[1]
print w

i=w[1].size
p=numpy.arange(i)*0.0000226 #to properly define the time signal with    the sample rate

print 'vector p:'
print p 

x=numpy.dstack([p,a])

print 'vector x:'
print x[0]

#saving file
numpy.savetxt('mike_1_44100_.txt',x[0])

f_out.close()
print 'i:'
print i

# num is the number of samples in the resampled signal.
num= np.ceil(float(i*0.0000226)/0.0015)
print num

y_resample, x_resample = scipy.signal.resample(numpy.abs(a),num, p,axis=0, window=('gaussian',150))

#y_resample, x_resample = scipy.signal.resample(numpy.abs(a), num, p,axis=-1, window=0)

#Aplaying a filter 

W1=float(5000)/(float(44100)/2) #the frequency  for the cut over the sample frequency

(b, a1) = signal.butter(4, W1, btype='lowpass')
aaa=a
slp =1* signal.filtfilt(b, a1, aaa)

#Taking the abs value of the signal the resample and finaly aplying the hilbert transform

y_resample2 =numpy.sqrt(numpy.abs(np.imag(sigtool.hilbert(slp, axis=-1)))**2+numpy.abs(np.real(sigtool.hilbert(slp, axis=-1)))**2)

print 'x sampled'
#print x_resample
print 'y sampled'
#print  y_resample

xx=x_resample #[0]
yy=y_resample #[1]

#ploting with some style

plot(p,a,label='Time Signal') #to plot amplitud vs time
#plot(p,numpy.abs(a),label='Time signal')
plot(xx,yy,label='Resampled time signal Fourier technique Gauss window 1.5 ms ', linewidth=3)
#plot(ww,label='Window', linewidth=3)
#plot(p,y_resample2,label='Hilbert transformed sime signal', linewidth=3)

grid(True)
pylab.xlabel("time [s]")
pylab.ylabel("Amplitde")

legend()
show()

这里我尝试了两件事,第一件是使用scipy的resample函数来获取信封,但是我对信号幅度有一些问题我还不了解(我上传了用傅立叶得到的图像)技术,但系统不允许我):

第二种是使用希尔伯特变换来获取包络(现在我再次使用希尔伯特变换上传图像,系统不允许我)可以运行我的代码并获得两个图像。但生病了这个链接http://ceciliajarne.web.unq.edu.ar/?page_id=92&preview=true

现在"信封"再次失败。我尝试过滤信号,就像我在一些例子中看到的那样,但是我的信号被衰减了,我无法获得信封。 有人可以用我的代码或更好的想法来帮助我获取信封吗?可以使用任何鸟类歌曲(我可以给你我的),但我需要看看会发生什么复杂的声音不是简单的信号,因为它是非常不同的(简单的声音两种技术都可以)。

我还尝试调整我在http://nipy.org/nitime/examples/mtm_baseband_power.html

中找到的代码

但是我无法为我的信号获得正确的参数,我也不了解调制部分。我已经向代码开发人员询问了,直到等待答案。

2 个答案:

答案 0 :(得分:4)

由于鸟鸣,“调制频率”可能远低于“载波频率”,即使振幅快速变化,也可以通过获取信号的绝对值然后应用来获得包络的近似值。移动平均滤波器,长度为20 ms。

不过,你是否也对频率变化感兴趣,以充分表征这首歌?在这种情况下,在移动窗口上进行傅立叶变换将为您提供更多信息,即作为时间函数的近似频率内容。这是我们人类听到的,并帮助我们区分鸟类。

我无法访问您发送给我的链接:

“没有任何关系可以使用borradores。”

如果你不想要衰减,你既不应该使用巴特沃斯滤波器也不应该采用移动平均值,而是应用峰值检测。

移动平均值:每个输出样本是例如绝对值的平均值。 50个前面的输入样本。输出将被衰减。

峰值检测:每个输出样本是例如绝对值的最大值。 50个前面的输入样本。输出不会衰减。之后你可以通过低通过滤除掉剩余的楼梯“riple”。

你想知道为什么Butterworth滤波器会衰减您的信号。如果你的截止频率足够高,它几乎不会发生,但它只会被强烈衰减。您的输入信号不是载波(哨子)和调制(包络)的总和,而是产品。过滤将限制频率内容。剩下的是频率成分(术语)而不是因素。您会看到衰减调制(包络),因为频率成分确实存在于信号中,比原始包络弱,因为它没有添加到您的载波中而是乘以它。由于信封乘以的载波正弦曲线并不总是处于其最大值,因此包络将被调制过程“衰减”,而不是通过滤波分析。

简而言之:如果由于与包络的调制(乘法)而直接需要(乘法)包络而不是(加法)频率分量,请采用峰值检测方法。

“Pythonish”伪代码中的峰值检测算法,只是为了得到这个想法。

# Untested, but apart from typos this should work fine
# No attention paid to speed, just to clarify the algorithm
# Input signal and output signal are Python lists
# Listcomprehensions will be a bit faster
# Numpy will be a lot faster

def getEnvelope (inputSignal):

    # Taking the absolute value

    absoluteSignal = []
    for sample in inputSignal:
        absoluteSignal.append (abs (sample))

    # Peak detection

    intervalLength = 50 # Experiment with this number, it depends on your sample frequency and highest "whistle" frequency
    outputSignal = []

    for baseIndex in range (intervalLength, len (absoluteSignal)):
        maximum = 0
        for lookbackIndex in range (intervalLength)
            maximum = max (absoluteSignal [baseIndex - lookbackIndex], maximum)
        outputSignal.append (maximum)

    return outputSignal

答案 1 :(得分:1)

可以使用相应的analytic signal的绝对值来计算信号的包络。 Scipy实现了scipy.signal.hilbert函数来计算分析信号。

从其文档中:

我们创建一个频率从20 Hz增加到100 Hz的线性调频信号,并应用幅度调制。

import numpy as np
import matplotlib.pyplot as plt
from scipy.signal import hilbert, chirp

duration = 1.0
fs = 400.0
samples = int(fs*duration)
t = np.arange(samples) / fs

signal = chirp(t, 20.0, t[-1], 100.0)
signal *= (1.0 + 0.5 * np.sin(2.0*np.pi*3.0*t))

幅度包络由分析信号的幅度给出。

analytic_signal = hilbert(signal)
amplitude_envelope = np.abs(analytic_signal)

看起来像

plt.plot(t, signal, label='signal')
plt.plot(t, amplitude_envelope, label='envelope')
plt.show()

Plot of signal and envelope

它也可以用于计算瞬时频率(请参阅文档)。