我不确定是否可能,但无论如何,
我在winform C#app中使用using System.Speech.Recognition;
。
我想知道是否有可能识别语音,还能识别语音,以某种方式识别不同语音之间的差异
从每个单独的语音中读取多重内容,例如从两个同时或单独说话的用户中读取不同的两个内容。
或者至少可能有一些控制背景响度的方法,例如,如果AudioLevelUpdated
事件允许我看到输入音量,但也可能存在某种特定的方式来将大声的声音与背景中的额外噪音或声音分开
答案 0 :(得分:1)
System.Speech.Recognition
无法帮助您进行语音识别。
System.Speech.Recognition
用于语音到文字。添加语法可以提高效率。您可以训练Windows桌面以获得更好的转换。请参阅控制面板中的语音识别。
有几个第三方库可用于语音识别。 为消除噪音,您可以参考Sound visualizer in C#。
您可以在msdn forum找到有趣的讨论。
答案 1 :(得分:0)
我认为你应该看看CRIS这是微软认知服务的一部分,至少对你有关噪音的问题。
CRIS是一种自定义语音服务,其基本用途是使用自定义声学模型(如背景噪音)和使用样本学习词汇来提高语音到文本的质量。
您可以导入:
声学数据集
语言数据集
发音数据集
例如,在声学模型中,您有:
Microsoft会话模型,用于识别会话风格的语音(即针对他人的语音)。
针对应用程序的语音的Microsoft搜索和听写模型,例如命令,搜索查询或听写。
预览中还有一个Speaker Recognition API