标签: speech-recognition
我正在研发项目中,需要带有时间戳的音频转录(语音到文本),仅需要输入MP3 / MP4文件并获得带有时间戳的转录作为输出即可。
任何人都知道对文本库/ API的良好讲话。它必须是开源的并提供Python / node.js API吗?
PS:我已经尝试过Google语音转换为文本引擎,但是在这里我需要另一个选择。我想要实际使用这些API的人的推荐。