标签: algorithm speech-recognition speech-to-text
要求:
我想要一个类似于汽车呼叫系统的系统/算法,你说你想要呼叫的名字,它会发现这个名字与你的声音相匹配。我的要求是我将使用预先录制的声音而不是名字。
例如为: 用户以非英语语言记录多个单词的目标语音,例如:
经过一些训练甚至没有训练,当用户再次说一个单词时,语音识别器应该能够识别它是哪个单词。
已知工具:
我搜索了现有的语音识别算法,但找不到一个,大多数都是识别现有的语言(语言类型为文本)。
它也不同于phonetic algorithm,它似乎只适用于英语。
由于
答案 0 :(得分:2)
Dynamic Time Warping是一种传统且相当简单的算法,但我确信现在必须有更好的方法。