文字转语音和外语文字转语音

时间:2020-06-08 21:46:08

标签: c# unity3d speech-recognition

我正在考虑将自己构建的语音2D HTML5网络游戏移植到适用于iPhone和Android的Unity2D。我是一名全职Web开发人员,而不是Unity开发人员,因此代理商可以帮助我构建Unity应用程序。在与他们签名之前,我需要确保{strong>普通话,西班牙语英语都可以使用Speech to Text (STT)Text to Speech (TTS)服务/ strong>,否则我会在前面浪费很多钱。

对于Web,可通过浏览器轻松访问Webkit语音(STT DocsSTT DemoTTS DocsTTS Demo)。我发现IBM Watson有可用的API,并且有STTTTS的演示,并且我发现它们在这里有Unity SDK,但我没有测试Unity SDK的技能。

我正在寻找有关该机构可以用于这三种外语的出色STT和TTS API的指南。

  1. Unity SDK是否支持前端STT​​和TTS音频流? STT需要捕获用户的语音输入并快速进行转录。同样,TTS需要允许用户将鼠标悬停在目标语言单词上并听近乎本地的发音。
  2. 它提供西班牙语,普通话和英语的STT和TTS吗?
  3. 还有哪些其他NLP API可以满足我的要求?
抱歉,我对Unity /电话开发完全陌生,因此此处的任何指导都将非常有帮助。如果不存在满足这些要求的API,则由于STT和TTS至关重要,因此Unity无法在我的应用中正常工作。

1 个答案:

答案 0 :(得分:2)

总体而言,Unity中的实时音频录制非常糟糕,该系统并非旨在连续录制音频。您可以使用AudioSource录制片段,但这是固定长度的片段,而不是流式解决方案。

对于流式传输,您可以使用AudioFilterRead获得音频,但这并不是真正的录音API,更多的是效果。对于录制,它具有不可预测的延迟,并且还会显着降低UI。

因此,您只能进行按键通话,而不能进行实时交互。

如果您还有其他选择,那么最好也考虑一下。例如,您可以考虑使用本机应用程序。