标签: java c++ speech-recognition voice-recognition speaker
寻找将媒体文件处理为“谁说什么以及什么时候”的代码,换言之,“扬声器分段扬声器”以及每个的时间。失败的答案:做任何手动工作来处理媒体文件..谢谢!
答案 0 :(得分:2)
您可以使用Kaldi的扬声器分类,设置起来不容易,但效果很好。
还有很多其他的图书馆 - LIUM,bob等。