在同一SSML中混合语言

时间:2016-09-27 20:33:48

标签: text-to-speech microsoft-cognitive ssml

如果我将这一小段SSML发送到语音处理器,我会得到两个声音

<speak version='1.0' xml:lang='es-ES'>
  <voice xml:lang='es-ES' xml:gender='Male' name='Microsoft Server Speech Text to Speech Voice (es-ES, Pablo, Apollo)'>
    <p>
        <s>Hola </s>
        <s xml:lang='en'>Hello</s>
        <s>¿Cómo estas?.</s>
    </p>
  </voice>
</speak>

一名西班牙语男子和一名英语女子。这是Project Oxford Text to Speech引擎的限制吗?换句话说,我希望同一个声音可以说几种语言,但看起来情况并非如此。

1 个答案:

答案 0 :(得分:0)

引用SSML spec

  

指定xml:lang并不意味着语音发生变化,尽管这确实可能发生。当给定语音不能以所指示语言说出内容时,处理器可以选择新语音。

虽然当前的回退行为有些不尽如人意,但建议在切换语言时创建多个语音节点并更明确地选择语音。