从视频和音频文件中提取语音文本

时间:2009-11-16 07:33:51

标签: speech-recognition

这样做的最佳库是什么。并且依靠质量很好的依赖。无法用扬声器语音训练系统或使用术语词典来改善结果。

1 个答案:

答案 0 :(得分:3)

在Windows上,您希望使用SAPI界面(Speech API)。有多种实现方式。 Microsoft包括一个免费的Windows。 Dragon NaturallySpeaking是一个非自由的,我在过去看到用于类似的任务(努力)。如果发言者讲得很清楚(而不是相互重叠和打断),缺乏训练就不会那么严重。

但是,你不会得到一个好的成绩单,准确性将足够严重,你得到的只会对索引有用。大词和独特的短语会很好地弹出,特别是如果你创建一个自定义词典(我知道你说你不想这样做)。例如,查找所有提及“Pelosi”和“公共选项”的新闻片段。