我正致力于构建一组PowerShell例程,以便与Microsoft Text-To-Speech引擎进行交互。 System.Speech.Synthesis.SpeechSynthesizer
上有一种名为SelectVoiceByHints()
的方法,它采用最大年龄参数("孩子","成人","青少年",& #34;高级"),性别("男","女","中性"),序数(用于选择第n个语音,如果多个声音匹配)和文化(例如," en-US")。从文档中不清楚的是优先级是什么 - 换句话说,如果我指定年龄,性别和文化,我没有与所有三个匹配的声音,但是一个声音与每个可能的匹配两者结合,哪个声音会匹配? (年龄 - 性别,年龄 - 文化或性别 - 文化)