我注意到最近some的Stack Overflow Podcasts的wiki转录很弱。显然,这项任务需要一个计算机程序。将音频转录为文本(理想情况下是扬声器标签,以便我们知道谁说了什么)可以在软件中实现可行的事情吗?是否有任何活跃的开源软件项目试图实现这样的功能?
答案 0 :(得分:3)
相信我,我之前已经搜索过这个。可以使用开源或免费使用的文本到语音。从我的搜索中,文本合成器没有任何免费语音。这些东西很难编码和昂贵,以至于它们无法用开源方法制作。如果你真的需要这个,你必须从公司购买。 (虽然我不知道任何问题)。
答案 1 :(得分:2)
我对此有所了解。我尝试过Microsoft Speech API但结果非常糟糕。我一直想要look into the CMU Sphinx project, especially the Transcriber demo。