我只对这种情况感兴趣。假设您正在构建Web应用程序,并希望接收语音命令并根据语音到文本结果执行操作。
任何可能使其成为杀手级应用的主要障碍?
答案 0 :(得分:0)
我能想到的第一件事可能是传输的音频质量很大程度上取决于用户的上传带宽。带宽越少,质量越差,语音到文本算法能够检测到正确说出的内容的能力就越小。
答案 1 :(得分:0)
低样本音频可用于s2t算法。我的问题:
还有更多的确定,但除此之外。
如果没有人去“我们要登月”然后做到,我们会在哪里?去吧......
如果尚未完成,如果您失败或成功,那么您可能会学到一些很酷的东西。