基本上我希望能够扫描已上传到我的网络服务器(LAMP)的音频片段,并获取音频片段的文本内容。
有这样的方法吗?语音识别是否有任何现成的解决方案(最好是基于命令行)?
答案 0 :(得分:1)
你说你使用LAMP堆栈,这意味着你依赖PHP。语音识别是一项昂贵的工作,如果由使用C或C ++等低级语言编写的外部工作人员处理,则可以更快地完成。此外,AFAIK没有本地PHP解决方案来完成这种工作。
PHP允许library loading on runtime,我认为这是要走的路。如果我是你,我会在C / C ++语音识别库周围编写一个薄的包装器,并从PHP代码中调用它。有关如何编写此类扩展的更多详细信息,请参阅此SO answer。
您可以使用的一些开源语音识别库:
正如您所注意到的那样,没有简单的解决方案,但它仍然可行。祝你好运!