如何将实时音频读入numpy数组并使用matplotlib进行绘图?
现在我正在wav
文件上录制音频,然后使用scikits.audiolab.wavread
将其读入数组。
有没有办法直接实时做到这一点?
答案 0 :(得分:17)
您可以使用PyAudio
录制音频,并使用np.frombuffer
将其转换为numpy数组。
import pyaudio
import numpy as np
from matplotlib import pyplot as plt
CHUNKSIZE = 1024 # fixed chunk size
# initialize portaudio
p = pyaudio.PyAudio()
stream = p.open(format=pyaudio.paInt16, channels=1, rate=44100, input=True, frames_per_buffer=CHUNKSIZE)
# do this as long as you want fresh samples
data = stream.read(CHUNKSIZE)
numpydata = np.frombuffer(data, dtype=np.int16)
# plot data
plt.plot(numpydata)
plt.show()
# close stream
stream.stop_stream()
stream.close()
p.terminate()
如果您想录制立体声而不是单声道,则必须将channels
设置为2
。然后你得到一个交错通道的数组。你可以像这样重塑它:
frame = np.frombuffer(data, dtype=numpy.int16) # interleaved channels
frame = np.stack((frame[::2], frame[1::2]), axis=0) # channels on separate axes
答案 1 :(得分:12)
有一个名为PyAudio
的库。您可以使用它来实时记录。另外,在numpy.fromstring()
和numpy.hstack()
的帮助下,您可以获得所需的输出。请注意,以下代码段适用于MONO-CHANNEL
。
import pyaudio
import numpy
RATE=16000
RECORD_SECONDS = 2.5
CHUNKSIZE = 1024
# initialize portaudio
p = pyaudio.PyAudio()
stream = p.open(format=pyaudio.paInt16, channels=1, rate=RATE, input=True, frames_per_buffer=CHUNKSIZE)
frames = [] # A python-list of chunks(numpy.ndarray)
for _ in range(0, int(RATE / CHUNKSIZE * RECORD_SECONDS)):
data = stream.read(CHUNKSIZE)
frames.append(numpy.fromstring(data, dtype=numpy.int16))
#Convert the list of numpy-arrays into a 1D array (column-wise)
numpydata = numpy.hstack(frames)
# close stream
stream.stop_stream()
stream.close()
p.terminate()
这是经过测试的代码。它应该是魅力。为了检查您的记录数据是否在numpydata
中正确可用,您可以在上一代码之后添加以下代码段。
import scipy.io.wavefile as wav
wav.write('out.wav',RATE,numpydata)
这些行会将您的numpydata
写入“out.wav”。播放文件以检查数据。
PS:这是我在StackOverflow中的第一个回复。希望它有所帮助。
答案 2 :(得分:0)
import librosa
file = 'audio/a1.wav'
signal, _ = librosa.load(file)
print(type(signal))
答案 3 :(得分:0)
此答案与此处的第一个答案相似,但我包含了绘制音频数据的缺失部分。
import pyaudio
import wave
import numpy as np
import noisereduce as nr
#This library helps us in plotting the audio
import matplotlib.pyplot as plt
def plotAudio2(output):
fig, ax = plt.subplots(nrows=1,ncols=1, figsize=(20,4))
plt.plot(output, color='blue')
ax.set_xlim((0, len(output)))
plt.show()
CHUNK = 22050
FORMAT = pyaudio.paFloat32
CHANNELS = 2
RATE = 44100
RECORD_SECONDS = 20
p = pyaudio.PyAudio()
stream = p.open(format=FORMAT,
channels=CHANNELS,
rate=RATE,
input=True,
frames_per_buffer=CHUNK)
print("* recording")
frames = []
for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
data = stream.read(CHUNK)
data_sample = np.frombuffer(data, dtype=np.float32)
print("data sample")
plotAudio2(data_sample)
stream.stop_stream()
stream.close()
p.terminate()
我已经测试了上面的代码片段,这对我来说非常好。
注意:此代码片段已在 Windows 中进行测试,matplotlib 在 MacOS 中可能存在一些问题(不过我不确定)