我使用pyaudio库从audiocard读取声音。我使用以下代码
stream = pyaudio.PyAudio().open(format=pyaudio.paInt16, channels=2,
rate=44100, input=True,
frames_per_buffer=1024)
CHUNK = 1024
frames = []
for i in range(0, int(44100 / 1024 * seconds)):
data = stream.read(CHUNK)
frames.append(data)
我想知道什么是一帧,什么是一块,什么是它们的格式。似乎图书馆描述中没有这样的信息。
答案 0 :(得分:0)
对于以后跳进来的任何人:
样本是单个float32值,代表特定通道(在立体声情况下为左或右)中每个特定时间点的音频流的值。
一个帧,是在特定时间点播放的所有频道的所有值的集合。
来自:Mozilla webaudio description
格式:paInt16是用于将这些样本数据存储为16位整数值的格式。
DATA:这是您一次从流中获取的CHUNK值指定的帧数。将流视为帧的集合。