我正在考虑将自己构建的语音2D HTML5网络游戏移植到适用于iPhone和Android的Unity2D。我是一名全职Web开发人员,而不是Unity开发人员,因此代理商可以帮助我构建Unity应用程序。在与他们签名之前,我需要确保{strong>普通话,西班牙语和英语都可以使用Speech to Text (STT)
和Text to Speech (TTS)
服务/ strong>,否则我会在前面浪费很多钱。
对于Web,可通过浏览器轻松访问Webkit语音(STT Docs,STT Demo,TTS Docs,TTS Demo)。我发现IBM Watson有可用的API,并且有STT和TTS的演示,并且我发现它们在这里有Unity SDK,但我没有测试Unity SDK的技能。
我正在寻找有关该机构可以用于这三种外语的出色STT和TTS API的指南。
答案 0 :(得分:2)
总体而言,Unity中的实时音频录制非常糟糕,该系统并非旨在连续录制音频。您可以使用AudioSource录制片段,但这是固定长度的片段,而不是流式解决方案。
对于流式传输,您可以使用AudioFilterRead获得音频,但这并不是真正的录音API,更多的是效果。对于录制,它具有不可预测的延迟,并且还会显着降低UI。
因此,您只能进行按键通话,而不能进行实时交互。
如果您还有其他选择,那么最好也考虑一下。例如,您可以考虑使用本机应用程序。