我正在寻找一种快速简单的方法来衡量我实时说话的速度。课程粒度方法或近似值就足够了。我们的想法是编写一个简单的应用程序/小部件,至少告诉您在讲话时加快或减速。测量音高和音量之类的东西也可能不错。
我认为这可以通过各种语音识别库来完成,但我对它们都不熟悉,快速浏览文档并不能给出一个简单的答案,甚至不能给出哪个库的好概念。更深入。
理想情况下,这个库会有一个python接口,但是任何可以在linux / osx / android上运行的东西就足够了。 iOS不可行。库/示例的可用性比性能更重要。
答案 0 :(得分:0)
可以在没有语音识别的情况下进行有效的语速检测,因为语音识别需要大量的计算。该算法在
中描述Dagen Wang and Shrikanth S. Narayanan. Robust speech rate estimation for spontaneous speech.
Ali Ziaei, Abhijeet Sangwan, John H. L. Hansen. A Speech System for Estimating Daily Word Counts
并使用峰值检测器来快速估算字数。
虽然没有开源实现,但值得自己实现。