我正在寻找用于生产目的的开源语音模式识别; 我知道语音转换为文本或理解语言的准确性不足以使用免费工具,否则您需要训练大量数据。但是,如果出于我的目的,我不需要理解含义或将语音转换为文本,而仅是要正确地检测出相同短语的发音? 例如。 如果我记录一些短语,例如: -《日本风光》 -“好车” -“足球”
然后不同的声音说: “来看一些日本的场面”
然后可以检测到第一个短语。 因此,此应用程序不需要了解单词或语言的含义。甚至有人说的都是胡说八道,但如果重复相同的模式,它就可以检测到。
我认为它比普通的语音识别或语音识别应用程序简单一些。您对哪种工具可以在高精度(生产级别)上使用该工具有一些想法吗?
谢谢!