根据我在互联网上阅读的内容,女性声音的基本频率的正常范围是165至255 Hz。 我正在使用Praat以及称为Parselmouth的python库来获取音频文件中女性声音的基本频率值(.wav)。但是,我得到了一些超过255Hz的值(例如:400 + Hz,500Hz)。 获得这样的大价值正常吗?
答案 0 :(得分:2)
如果尝试捕获语音的基本频率(F0),则有可能,但不太可能。听起来您似乎正在捕获更容易产生共振的泛音(例如F1或F2)。
我对Praat的实验给我的印象是,具有良好参数的它将可靠地提取F0。
您要做的是通过将音高曲线与频谱图进行比较来验证这一点。这是Praat(女发言人)制作的配件的示例:
您可以从图像中看到
如果在目视检查后似乎得到了错误的结果,则可以尝试调整参数。窗口长度会极大地影响频率分辨率。
如果无法捕获到如此低的频率,则应尝试增加窗口长度-直觉是它为算法提供了一个更好的机会来发现数据中缓慢变化的周期性特征。