PyAudio响应录音

时间:2015-02-09 19:29:50

标签: python user-interface asynchronous nonblocking pyaudio

我已经在PyAudio网站上看到了录制固定长度录音的录音教程,但我想知道如何使用非固定录音进行相同操作?基本上,我想创建按钮来开始和结束录制,但我还没有找到任何关于此事的内容。任何想法,我不是在寻找替代图书馆?

2 个答案:

答案 0 :(得分:6)

最好是使用非阻塞的记录方式,即你提供一个回调函数,从你启动流的那一刻开始调用,并且在你停止流之前不断调用每个被处理的块/缓冲区。 / p>

在该回调函数中,例如,检查布尔值,当它为真时,将传入缓冲区写入数据结构,当它为假时,忽略传入缓冲区。例如,可以通过单击按钮来设置此布尔值。

编辑:看一下有线音频的例子:http://people.csail.mit.edu/hubert/pyaudio/#wire-callback-example 使用参数

打开流
stream_callback=my_callback

其中my_callback是声明为

的常规函数
def my_callback(in_data, frame_count, time_info, status)

每次有新缓冲区可用时,都会调用此函数。 in_data包含您要记录的输入。在此示例中,in_data只与pyaudio.paContinue一起返回元组。这意味着来自输入设备的传入缓冲区被放入/复制回输出缓冲区发送到输出设备(其设备相同,因此其实际路由输入到输出也称为线路)。有关更多解释,请参阅api文档:http://people.csail.mit.edu/hubert/pyaudio/docs/#pyaudio.PyAudio.open

所以在这个函数中你可以做类似的事情(这是我编写的一些代码的摘录,这些代码并不完整:我使用了一些未描述的函数。另外我在一个通道上播放正弦波,另一个在另一个通道上播放噪声以24位格式。):


record_on = False
playback_on = False

recorded_frames = queue.Queue()

def callback_play_sine(in_data, frame_count, time_info, status):
    if record_on:
        global recorded_frames
        recorded_frames.put(in_data)

    if playback_on:
        left_channel_data = mysine.next_block(frame_count) * MAX_INT24 * gain
        right_channel_data = ((np.random.rand(frame_count) * 2) - 1) * MAX_INT24 * gain
        data = interleave_channels(max_nr_of_channels, (left_output_channel, left_channel_data), (right_output_channel, right_channel_data))
        data = convert_int32_to_24bit_bytestream(data)
    else:
        data = np.zeros(frame_count*max_nr_of_channels).tostring()

    if stop_callback:
        callback_flag = pyaudio.paComplete
    else:
        callback_flag = pyaudio.paContinue

    return data, callback_flag

然后,您可以在流打开/运行时从代码的其他部分将record_onplayback_on设置为TrueFalse,从而导致录制和播放开始或者在不中断流的情况下独立停止。 我将in_data复制到(threadsafe)queue中,其他线程使用它来写入磁盘,否则队列会在一段时间后变大。

BTW:pyaudio基于portaudio,它有更多的文档和有用的提示。例如(http://portaudio.com/docs/v19-doxydocs/writing_a_callback.html):回调函数必须在呈现新缓冲区之前完成,否则缓冲区将丢失。因此,写回调函数内的文件通常不是一个好主意。 (尽管写入文件会被缓冲,但我不知道它最终会在写入磁盘时阻塞)

答案 1 :(得分:0)

import pyaudio
import wave

import pygame, sys
from pygame.locals import *

pygame.init()
scr = pygame.display.set_mode((640, 480))
recording = True

CHUNK = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 2
RATE = 44100
RECORD_SECONDS = 5
WAVE_OUTPUT_FILENAME = "output.wav"

p = pyaudio.PyAudio()

stream = p.open(format=FORMAT,
                channels=CHANNELS,
                rate=RATE,
                input=True,
                frames_per_buffer=CHUNK)

print("* recording")

frames = []

while True:
    if recording:
        data = stream.read(CHUNK)
        frames.append(data)

    for event in pygame.event.get():
        if event.type == KEYDOWN and recording:
            print("* done recording")

            stream.stop_stream()
            stream.close()
            p.terminate()

            wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
            wf.setnchannels(CHANNELS)
            wf.setsampwidth(p.get_sample_size(FORMAT))
            wf.setframerate(RATE)
            wf.writeframes(b''.join(frames))
            wf.close()
            recording = False

        if event.type == QUIT:
            pygame.quit(); sys.exit()