处理实时音频而无需使用pyaudio进行编译

时间:2020-10-05 02:37:09

标签: python audio streaming real-time pyaudio

我想进行实时音频分类,分类程序工作得很好。

我试图直接从流中提取数据。但是,我意识到从流传输输入的数据格式和从记录文件加载的数据是不同的。我不知道如何直接从流中处理数据而不进行记录并再次加载文件。

有人可以帮我吗?

我正在使用pyaudio库进行流式传输

FORMAT = pyaudio.paInt16 
        CHANNELS = 1
        RATE = 44100
        CHUNK = 1024
        RECORD_SECONDS = 5
        former_name = "test"
        WAVE_OUTPUT_FILENAME = "audio.wav"


        audio = pyaudio.PyAudio()


        stream = audio.open(format=FORMAT, channels=CHANNELS,
                        rate=RATE, input=True,
                        frames_per_buffer=CHUNK)
        # print ("recording...")

        frames = []

        for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
            data = stream.read(CHUNK)
            frames.append(data)

1 个答案:

答案 0 :(得分:0)

尝试一下对我有用

如果您具有WINDOWS操作系统,请首先安装此软件:-pip install pyttsx3,或者如果您具有MAC操作系统:-pip3 install pyttsx3

import pyttsx3

def voicePlay(string):

    engine = pyttsx3.init()
    engine.say(f"{string}") 
    try:
        engine.runAndWait()
    except Exception as e:
        pass
    engine.runAndWait()