答案 0 :(得分:0)
在Speech产品组的Github存储库中,有一个很好的Windows工具,该工具可以使用麦克风或WAV文件作为输入。此外,您可以并排比较基线模型和自定义语音模型:
https://github.com/Azure-Samples/cognitive-services-speech-sdk
请按照以下步骤上传和定制带有训练数据的STT模型。
认知语音服务的定价和限制:https://azure.microsoft.com/en-us/pricing/details/cognitive-services/speech-services/