我正在寻找一个简单的C#实时语音检测库。 输入应该是音频流,输出应该是“人声”或“不是人声”。 我不懂语音识别或信号处理,我会感激任何帮助。
答案 0 :(得分:3)
看看“Detecting audio silence in WAV files using C#”的答案。我假设输入是一个WAV文件。如果没有,请提供音频流的格式,或者如果您打算直接从麦克风输入。如果您可以测量音频流中的静音量,并且您知道音频流的持续时间,则可以计算通话时间。答案中的链接已经死了,但是如果你去codeproject.com并搜索“C#wave form”,你会看到许多项目,它们向你展示了如何解释和操作wav文件。如果存在背景噪声,则检测静音可能有点主观。你需要为沉默选择一个最小音量阈值,其下面的任何东西都被认为是沉默。