pyaudio流中的数据是什么意思?

时间:2017-12-16 20:08:02

标签: python audio pyaudio

我使用pyaudio库从audiocard读取声音。我使用以下代码

stream = pyaudio.PyAudio().open(format=pyaudio.paInt16, channels=2,
                                rate=44100, input=True,
                                frames_per_buffer=1024)

CHUNK = 1024
frames = []
for i in range(0, int(44100 / 1024 * seconds)):
    data = stream.read(CHUNK)
    frames.append(data)

我想知道什么是一帧,什么是一块,什么是它们的格式。似乎图书馆描述中没有这样的信息。

1 个答案:

答案 0 :(得分:0)

对于以后跳进来的任何人:

样本是单个float32值,代表特定通道(在立体声情况下为左或右)中每个特定时间点的音频流的值。

一个帧,是在特定时间点播放的所有频道的所有值的集合。

来自:Mozilla webaudio description

格式:paInt16是用于将这些样本数据存储为16位整数值的格式。

DATA:这是您一次从流中获取的CHUNK值指定的帧数。将流视为帧的集合。