我的问题描述:
我有一个示例音频文件,需要在另一个音频文件中找到它(例如,在音频文件中查找识别片段的开始和结束时间)。是否有用于执行此任务的库?
答案 0 :(得分:2)
1)CMU Sphinx。它是一个用于语音识别的开源工具包。
描述:CMUSphinx是一种独立于讲话者的大型词汇连续语音识别器,采用BSD风格许可证发布。它也是开源工具和资源的集合,允许研究人员和开发人员构建语音识别系统。
2)RWTH ASR(简称RASR)是一个开源语音识别工具包。
描述:该工具包包括用于开发自动语音识别系统的最先进的语音识别技术。它由亚琛工业大学人类语言技术和模式识别小组开发。
3)Julius:“Julius”是一款高性能,双通道大型词汇连续语音识别(LVCSR)解码器软件,适用于与语音相关的研究人员和开发人员。
可能谷歌会提供更多结果,但我认为上述三项绰绰有余。