我使用Google API for speech recognition进行了自然对话,效果非常好,但是对于来自Youtube视频或电影的声音,识别效果很差或不存在。
在iPhone 4上以西班牙语到英语录制声音的声音被识别,但是在电影中使用相同的手机几乎是不可能的,即使是角色谈话时背景噪音很小的场景也是如此。只有一次成功。
我尝试用SoX (Sound eXchange)使用noisered和compand efects来清理声音,但没有任何成功。
有什么想法吗?或者只是Google API无法识别的声音,您更改的内容会更多?其他语音识别软件会有更好的成功吗?
答案 0 :(得分:0)
Google语音识别器(以及大多数其他识别器)与reverberation效果不兼容。在大多数视频场景中,人与麦克风之间的距离超过1-3米。尝试将手机放在桌子上并识别3米距离的水深。这不会导致任何事情,但音质会非常好。