我目前正在尝试使用适用于iOS的ivona SDK,语音非常棒且非常自然 但我正在使用的声音(德国女性)有一个文件大小为230 MB的语音文件 当我想使用4个声音时,我的应用程序大约 1GB 大。</ p>
也没有离线使用。这个声音只适用于测试阶段吗?或者它也用于生产?
我认为为小型TTS应用程序实现一些声音是非常可怕的,因此应用程序的大小非常大......
有人可以给我答案吗?
答案 0 :(得分:4)
也许最好的解决方案是不包含声音,并允许用户下载他们更喜欢使用的语音。如果您试图通过每种语音货币化,也可以将每个语音解锁为单独的应用内购买。
答案 1 :(得分:0)
测试的声音确实与生产相同。但在IVONA,他们对每个声音都有不同的大小: 您可以选择将IVONA语音用于汽车/导航系统。这些声音是有限的,因此它们的大小只有约70 MB,它们是16 kHz而不是22 kHz。如果您有导航应用程序,这些适合您。否则,试试吧,您可以询问IVONA的联系方式。
在我的项目中,我们使用其中5个声音,每个“vox”文件介于65-74 MB之间。 但即使这些较小的声音也大大增加了捆绑(但不如230 MB)我们决定按需下载它们(按照IAP,托管在Apple)。考虑到用户通常只需要一种语言,因此将多个语音与应用程序捆绑在一起会浪费空间。
另一种选择是准备一组样本并将它们捆绑而不是IVONA语音。当然,这仅适用于没有动态部分的有限文本集。并且可能会编写一个小型声音排队引擎来将声音拼接在一起,例如:号。