应用错误收集

Python：从WAV文件生成语音状态（0表示不说话，1表示）

时间：2018-12-06 19:38:03

标签： python audio speech-recognition wav

我有一个会议记录数据，其中有4个人坐在一起聊天。对于每个人，我都有WAV格式的翻领记录。现在，我想基于python中的这4个WAV文件生成讲话状态，例如，如果人1在讲话，而其他3在时间范围0不在讲话，则生成的向量应为： 1000 我在网上搜索，发现有一个名为wave的程序包，但是我不确定如何进行处理，例如，尽管第2人没有讲话，但他的翻领唱片中仍然会有一些噪音信号。

对我有什么建议吗？非常感谢！

0 个答案:

没有答案

Wav文件的范围不在-1到1之间
如何从android上的java代码中检测文本到语音状态（说话/不说话）？
生成从0到1的随机数
从mfcc python生成.wav文件
wav超过-1 / + 1的浮点数的证据
用于说话/不说话的MS BotFramework逻辑
在numpy中生成1-0阵列
Python：从WAV文件生成语音状态（0表示不说话，1表示）
将['0'，'0 1'，'0 1 2'，'0 1 2 3']重新格式化为['0'，['0'，'1']，...]
为什么[：1]和[0]无法产生相同的结果？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？