我正在尝试通过SSML和.NET SpeechSynthesizer(System.Speech.Synthesis)改变口语文本的音高
SpeechSynthesizer synthesizer = new SpeechSynthesizer();
PromptBuilder builder = new PromptBuilder();
builder.AppendSsml(@"C:\Users\me\Documents\ssml1.xml");
synthesizer.Speak(builder);
ssml1.xml文件的内容是:
<?xml version="1.0" encoding="ISO-8859-1"?>
<ssml:speak version="1.0"
xmlns:ssml="http://www.w3.org/2001/10/synthesis"
xml:lang="en-US">
<ssml:sentence>
Your order for <ssml:prosody pitch="+30%" rate="-90%" >8 books</ssml:prosody>
will be shipped tomorrow.
</ssml:sentence>
</ssml:speak>
费率得到承认:“8本书”比其他人说得慢得多,但无论为“音调”设定什么值,它都没有区别!允许的值可以在这里找到:
http://www.w3.org/TR/speech-synthesis/#S3.2.4
我是否遗漏了某些内容或正在改变微软语音引擎不支持的音调?
弗里茨
答案 0 :(得分:2)
虽然SsmlParser
使用的引擎System.Speech
在pitch
方法中接受ProcessProsody
属性,但它不会处理它。
它仅处理range
,rate
,volume
和duration
属性。它还会解析contour
,但会被处理为range
(不确定原因)......
编辑:如果您不需要从SSML xml文件中读取文本,则可以以编程方式创建文本。
而不是
builder.AppendSsml(@"C:\Users\me\Documents\ssml1.xml");
使用
builder.Culture = CultureInfo.CreateSpecificCulture("en-US");
builder.StartVoice(builder.Culture);
builder.StartSentence();
builder.AppendText("Your order for ");
builder.StartStyle(new PromptStyle() { Emphasis = PromptEmphasis.Strong, Rate = PromptRate.ExtraSlow });
builder.AppendText("8 books");
builder.EndStyle();
builder.AppendText(" will be shipped tomorrow.");
builder.EndSentence();
builder.EndVoice();