SSML prosody element可以使用代表relative change的值,该值可以是百分比值(例如+ 50%或-30%)。
这应该是一个百分比?它是当前音高的Hz值(因此倍频程间隔(即+ 12st)与+ 100%相同)?或者它与其他东西有关,例如x-low和x-high之间的范围(所以x-low + 50%与medium相同,然后另一个+ 50%是x-high)?是否只需要由实施者来决定?
据我所知,SSML不是用于标记音乐的系统,它表示“基线音高”或话语,而不是整个话语的准确音高。我只想知道某些表达是否可以被视为等同。
答案 0 :(得分:0)
是的,我的理解是这个百分比是基于当前的音调,所以-50%是八度音阶下降,+ 100%是八度音阶。
每个半音的比率计算为2的第12个根的幂。因此,上面的第一个半音是1.0595的比率或5.95%的百分比变化,第二个半音是1.0595 ^ 2,这导致百分比变化下面的第一个半音为-5.61%,因为它与第12个根的倒数相比减少了。
通常,对于整数((2^(1/12))^n) - 1) * 100
,每个半音的相对百分比变化计算为((1.0595^n) - 1) * 100
或大约n
。