Question

我在我自己的私人助理中使用wit.ai作为（可能）临时解决方案进行语音到文本服务。然后我将这个转录的文本传递到别处进行进一步分析。最终我可能会转移到更大的东西（Watson，PocketSphinx等），但wit.ai似乎是一个很好的第一步，因为它是自由而轻松的。

但是，我想将自己的自定义词添加到wit.ai.特别是我的音乐播放器不是真正英语的乐队名称。

理想情况下，我可以使用预期的示例短语上传大文件或多次点击api。

类似的东西：

@Controller
public class SignUp {
    @RequestMapping(value="/")
    public String goMainPage(){
        return "redirect:/signup";
    }   
}

Play Black Dog by Led Zeppelin Play Come Down by Anderson Paak Play Hippie Babysitter by Papadosio和Paak等字词不在字典中，但可以像任何字一样被发声。我知道CMUSphinx / PocketSphinx可以做到这一点。有谁知道Wit.ai可以这样做的方式吗？

Answer 1

我认为不可能在wit.ai中添加你自己的音频数据（不确定这一点，但我敢打赌你不能，作为一个闭源的支柱系统）。编辑：您可以更正收件箱中的音频转录＆gt;其在线界面的音频部分可能足以满足您的需求。

您还提到了CMU Sphinx;他们通过VoxForge接受音频贡献以改善可用语言。

另一种选择是Google Speech Recognition API，它有一个非常广泛的音频语料库，提供了非常好的结果。您可以尝试使用自定义波段名称进行尝试（可以在链接中在线测试），看看它是否符合您的需求。

是否可以将自己的自定义单词添加到Wit.ai语音到文本识别器中？

1 个答案: