离线语音识别支持不受欢迎的语言

时间:2019-03-26 11:01:05

标签: speech-recognition speech-to-text voice-recognition webspeech-api naturallyspeaking

我有兴趣让语音识别适用于Dragon Naturally Speaking(DNS)不支持的外语(特别是高棉语)。实际上,如果有人对使用DNS以外的其他功能有什么想法,我也持开放态度,但是关键问题是它必须脱机工作

我已经花了一些时间来使用Web Speech API,该API可以很好地完成其工作,但是它需要稳定的Internet连接,这通常还可以,但是特别是每天停电5-6小时在接下来的几个月中,要求良好的互联网连接不太可行。

到目前为止,我已经考虑过两种可行的方法:

1)尝试为新语言添加语法。

优点:可以使用DNS已经拥有的软件,而且我知道语法也可以自定义(我在使用Vocola,Dragonfly,Natlink和Caster方面有相当的经验)。

缺点:我不知道将这种语法组合在一起的好方法。是否有一种自动方式可以上传整个语言的数据?我无法手动键入数千个单词(包括元数据),并用与每个单词匹配的声音对其进行训练。我是否可以在某个数据库中存储此类信息,并且/或者将其转换为DNS可以解析的数据?有在线词典具有音译信息(例如,针对高棉语,请参见此处),并且可以说出字典中给定的单词,该单词与听起来大致相符,所以我想如果我问合适的人。但是,即使我得到了这些数据,也不确定将数据转换为DNS可以处理的内容。

2)在本地运行Web Speech API服务

优点:我曾尝试过将网络语音api用于高棉语,尤其是在Google Chrome上,并且我知道它可以用,并且就我而言,它的词汇量足够好。

缺点:我不知道如何访问源代码才能在本地计算机上运行该服务,因此我可以在不连接到网络的情况下运行Web Speech API。 。


关于这两个选项的可能性有何想法​​,或者是否有人可以考虑使用当前不受支持的语言进行离线语音识别?

我愿意在Windows或Linux上使用它,但必须在台式机上使用。

0 个答案:

没有答案