我们的客户希望当网络聊天机器人向他们讲话时,其用户的语速变慢。
我已经尝试过使用下面的SSML标签使用Bing text to speech API方法,但是它似乎不起作用。
<speak version='1.0' xmlns="http://www.w3.org/2001/10/synthesis" xml:lang='en-US'><voice name='Microsoft Server Speech Text to Speech Voice (en-US, JessaRUS)'><prosody rate="+30.00%">Welcome to use Microsoft Cognitive Services Text-to-Speech API.</prosody></voice> </speak>
我将以下代码用于认知服务语音合成器,但是我不确定提供“韵律率”的格式,甚至不确定这种方式是否可行。
speechSynthesizer: new CognitiveServices.SpeechSynthesizer({
gender: CognitiveServices.SynthesisGender.Female,
subscriptionKey: '@System.Configuration.ConfigurationManager.AppSettings["CognitiveKey"]',
voiceName: 'Microsoft Server Speech Text to Speech Voice (en-US, JessaRUS)'
prosody:???
})
所以我在问; 有可能做我所追求的吗? 有提供信息的特定格式吗? 我可以在构造函数中用于配置服务的所有设置是否都有架构?