因此,我将使用Watson ExampleStreaming Speech to Text演示作为此处Unity SDK的起点
https://github.com/watson-developer-cloud/unity-sdk
可以,但是问题是准确性。
我在这里阅读了这篇文章 How can I improve Watson Speech to Text accuracy? 但有一个问题
仅使用我自己的声音来创建自定义声学模型,我就能期望准确性水平有所提高吗? 就我的目的而言,我只会将应用程序与我的声音一起使用。
https://cloud.ibm.com/docs/services/speech-to-text?topic=speech-to-text-customization
答案 0 :(得分:0)
使用语音可能会有所帮助,但您需要记录大量示例话语,并且可能会为自定义模型支付更多费用。在走那条路线之前,我建议分析错误的单词以查看是否存在模式,并在代码中为这些单词添加手动更正。
例如,如果模型混淆了“两个”和“太”,则可以为此添加手动替换功能。