我对此进行了广泛的搜索,我找到了许多有用的代码示例,但他们没有给我确切的结果
当有人发出a:
元音时,我需要检测人声的基频(F0)。
然后我查找这些代码示例;
来自krafter的https://github.com/krafter/DetectingAudioFrequency https://github.com/syedhali/EZAudio
但它们都没有给我基频,所有这些都给出了最强的频率,所以这通常等于F2或F3谐波。 通过修改代码,我需要帮助来计算这个代码示例的基频。
答案 0 :(得分:1)
您无法修改FFT峰值检测器以进行正确的语音音高估计。这是错误的算法。相反,请尝试自相关,或此问题的答案之一:how to know the fundamental frequency is right detected by fft/lomb-scargle?