我想进行实时音频分类,分类程序工作得很好。
我试图直接从流中提取数据。但是,我意识到从流传输输入的数据格式和从记录文件加载的数据是不同的。我不知道如何直接从流中处理数据而不进行记录并再次加载文件。
有人可以帮我吗?
我正在使用pyaudio库进行流式传输
FORMAT = pyaudio.paInt16
CHANNELS = 1
RATE = 44100
CHUNK = 1024
RECORD_SECONDS = 5
former_name = "test"
WAVE_OUTPUT_FILENAME = "audio.wav"
audio = pyaudio.PyAudio()
stream = audio.open(format=FORMAT, channels=CHANNELS,
rate=RATE, input=True,
frames_per_buffer=CHUNK)
# print ("recording...")
frames = []
for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
data = stream.read(CHUNK)
frames.append(data)
答案 0 :(得分:0)
尝试一下对我有用
如果您具有WINDOWS操作系统,请首先安装此软件:-pip install pyttsx3
,或者如果您具有MAC操作系统:-pip3 install pyttsx3
import pyttsx3
def voicePlay(string):
engine = pyttsx3.init()
engine.say(f"{string}")
try:
engine.runAndWait()
except Exception as e:
pass
engine.runAndWait()