我在我自己的私人助理中使用wit.ai作为(可能)临时解决方案进行语音到文本服务。然后我将这个转录的文本传递到别处进行进一步分析。最终我可能会转移到更大的东西(Watson,PocketSphinx等),但wit.ai似乎是一个很好的第一步,因为它是自由而轻松的。
但是,我想将自己的自定义词添加到wit.ai.特别是我的音乐播放器不是真正英语的乐队名称。
理想情况下,我可以使用预期的示例短语上传大文件或多次点击api。
类似的东西:
@Controller
public class SignUp {
@RequestMapping(value="/")
public String goMainPage(){
return "redirect:/signup";
}
}
Play Black Dog by Led Zeppelin
Play Come Down by Anderson Paak
Play Hippie Babysitter by Papadosio
和Paak
等字词不在字典中,但可以像任何字一样被发声。我知道CMUSphinx / PocketSphinx可以做到这一点。有谁知道Wit.ai可以这样做的方式吗?
答案 0 :(得分:0)
我认为不可能在wit.ai中添加你自己的音频数据(不确定这一点,但我敢打赌你不能,作为一个闭源的支柱系统)。编辑:您可以更正收件箱中的音频转录>其在线界面的音频部分可能足以满足您的需求。
您还提到了CMU Sphinx;他们通过VoxForge接受音频贡献以改善可用语言。
另一种选择是Google Speech Recognition API,它有一个非常广泛的音频语料库,提供了非常好的结果。您可以尝试使用自定义波段名称进行尝试(可以在链接中在线测试),看看它是否符合您的需求。