是否可以将自己的自定义单词添加到Wit.ai语音到文本识别器中?

时间:2017-01-12 07:03:34

标签: speech-recognition speech-to-text wit.ai

我在我自己的私人助理中使用wit.ai作为(可能)临时解决方案进行语音到文本服务。然后我将这个转录的文本传递到别处进行进一步分析。最终我可能会转移到更大的东西(Watson,PocketSphinx等),但wit.ai似乎是一个很好的第一步,因为它是自由而轻松的。

但是,我想将自己的自定义词添加到wit.ai.特别是我的音乐播放器不是真正英语的乐队名称。

理想情况下,我可以使用预期的示例短语上传大文件或多次点击api。

类似的东西:

@Controller
public class SignUp {
    @RequestMapping(value="/")
    public String goMainPage(){
        return "redirect:/signup";
    }   
}

Play Black Dog by Led Zeppelin Play Come Down by Anderson Paak Play Hippie Babysitter by Papadosio Paak等字词不在字典中,但可以像任何字一样被发声。我知道CMUSphinx / PocketSphinx可以做到这一点。有谁知道Wit.ai可以这样做的方式吗?

1 个答案:

答案 0 :(得分:0)

我认为不可能在wit.ai中添加你自己的音频数据(不确定这一点,但我敢打赌你不能,作为一个闭源的支柱系统)。编辑:您可以更正收件箱中的音频转录>其在线界面的音频部分可能足以满足您的需求。

您还提到了CMU Sphinx;他们通过VoxForge接受音频贡献以改善可用语言。

另一种选择是Google Speech Recognition API,它有一个非常广泛的音频语料库,提供了非常好的结果。您可以尝试使用自定义波段名称进行尝试(可以在链接中在线测试),看看它是否符合您的需求。