Web服务器的语音识别

时间:2014-08-11 16:12:18

标签: speech-recognition

基本上我希望能够扫描已上传到我的网络服务器(LAMP)的音频片段,并获取音频片段的文本内容。

有这样的方法吗?语音识别是否有任何现成的解决方案(最好是基于命令行)?

1 个答案:

答案 0 :(得分:1)

你说你使用LAMP堆栈,这意味着你依赖PHP。语音识别是一项昂贵的工作,如果由使用C或C ++等低级语言编写的外部工作人员处理,则可以更快地完成。此外,AFAIK没有本地PHP解决方案来完成这种工作。

PHP允许library loading on runtime,我认为这是要走的路。如果我是你,我会在C / C ++语音识别库周围编写一个薄的包装器,并从PHP代码中调用它。有关如何编写此类扩展的更多详细信息,请参阅此SO answer

您可以使用的一些开源语音识别库:

  • CMU Sphinx(以 C 编写, C C ++ 中的API)
  • Voce(CMU Sphinx包装器, C ++中的API Java

正如您所注意到的那样,没有简单的解决方案,但它仍然可行。祝你好运!