我想用我的应用程序记录一些单词,我希望每当我再说同样的话时匹配。我怎么能实现这一目标?我也看过这个教程......
但是它用于发言到文本。无论你说什么,它都会进入谷歌服务器,并显示类似于你所说的单词列表。但是,当我再次说话时,我需要记录一些单词和匹配。
任何建议,提示或教程都会非常感激,我将非常感激。
P.S我想要没有互联网。
提前感谢。
答案 0 :(得分:1)
你需要实现一个特征提取部分和DTW算法来匹配任意长度的特征向量。
要提取功能,您可以使用现有的ASR工具包,例如CMUSphinx http://cmusphinx.sourceforge.net
要使用DTW匹配功能,您需要编写简单的功能,请参阅
http://en.wikipedia.org/wiki/Dynamic_time_warping
阅读关于类似实现的这个帖子
http://sourceforge.net/projects/cmusphinx/forums/forum/382337/topic/2348240