标签: audio text-to-speech language-theory
这是我的另一个问题的第一部分,建议将其提出两个问题:Adding Accents to Speech Generation。
摘要:另一个问题是如何以编程方式为生成的语音添加重音。不是重音标记或变形,而是像英国,苏格兰或俄罗斯人那样的完整口音。
第一个问题(与此问题相同)询问如何分析原始文本以确定需要添加哪些重音以及在哪里。
基本上,如何分析文本以找到这些重音并生成一组可用于为任何生成的语音添加任何重音的指令?