Question

我使用pyaudio库从audiocard读取声音。我使用以下代码

stream = pyaudio.PyAudio().open(format=pyaudio.paInt16, channels=2,
                                rate=44100, input=True,
                                frames_per_buffer=1024)

CHUNK = 1024
frames = []
for i in range(0, int(44100 / 1024 * seconds)):
    data = stream.read(CHUNK)
    frames.append(data)

我想知道什么是一帧，什么是一块，什么是它们的格式。似乎图书馆描述中没有这样的信息。

Answer 1

对于以后跳进来的任何人：

样本是单个float32值，代表特定通道（在立体声情况下为左或右）中每个特定时间点的音频流的值。

一个帧，是在特定时间点播放的所有频道的所有值的集合。

来自：Mozilla webaudio description

格式：paInt16是用于将这些样本数据存储为16位整数值的格式。

DATA：这是您一次从流中获取的CHUNK值指定的帧数。将流视为帧的集合。

pyaudio流中的数据是什么意思？

1 个答案: