应用错误收集

我正在寻找用于生产目的的开源语音模式识别；我知道语音转换为文本或理解语言的准确性不足以使用免费工具，否则您需要训练大量数据。但是，如果出于我的目的，我不需要理解含义或将语音转换为文本，而仅是要正确地检测出相同短语的发音？例如。如果我记录一些短语，例如： -《日本风光》 -“好车” -“足球”

然后不同的声音说： “来看一些日本的场面”

然后可以检测到第一个短语。因此，此应用程序不需要了解单词或语言的含义。甚至有人说的都是胡说八道，但如果重复相同的模式，它就可以检测到。

我认为它比普通的语音识别或语音识别应用程序简单一些。您对哪种工具可以在高精度（生产级别）上使用该工具有一些想法吗？

谢谢！