开始使用语音识别和语音合成

时间:2010-10-07 11:09:25

标签: speech-recognition speech speech-synthesis

我想开始使用语音识别和语音合成 在Prototype based on speech recognition 有人告诉我使用微软语音服务器(sdk等)

当我有这个时,我如何编程应用程序,以及使用哪种编程语言(开发环境?)?

是否有人使用过星号或SVOX?

我需要这样做:

语音识别 语音合成

我不一定是一个非常好的语音识别 - 我认为30 -50字应该足够开头。 我正在使用Windows。

提前致谢

2 个答案:

答案 0 :(得分:2)

如果您选择使用Microsoft语音引擎,则有.NET框架API。正如我在另一篇文章中提到的,有两个命名空间(System.Speech用于桌面使用,Microsoft.Speech用于服务器)。您可以使用任何.NET语言进行编程,也可以使用Visual Studio。

几年前在http://msdn.microsoft.com/en-us/magazine/cc163663.aspx发表了一篇非常好的文章。这可能是迄今为止我发现的最好的介绍性文章。但是,它基于WinFX API的预发布版本,并且在发布Vista时更改了System.Speech类。文章中的示例由于这些重大的API更改而无法编译,我没有找到任何更新或勘误来解释这一点。在互联网上搜索方法名称“AppendResultKeyValue”,你会发现一些论坛帖子,如http://www.ms-news.net/f3012/system-speech-breaking-changes-3025734.html,人们遇到了同样的问题。

它仍然是一篇很好的介绍性文章,非常值得一读。通过一点点黑客攻击,您可以使示例应用程序正常工作。

答案 1 :(得分:0)

当我研究计算语言学时,选择的工具是Praat,这是一个非常混乱的原型制作工具,可以让你做任何与语言有关的事情。

我认为它没有任何外部API,但它的内部脚本语言足以用于基本应用程序,并且它具有许多内置函数。对于理论和算法的“入门”来说,这并不算太糟糕。