我对音频工程并不多,所以请对我很轻松。我收到一个音频文件作为输入,需要检测扬声器是男性还是女性。任何想法如何去做?
我正在使用php,但我愿意使用其他语言,并且不介意学习一点声音理论,只要时间与任务成比例。
答案 0 :(得分:6)
我无法真正提供有关此问题的具体见解,但我首先阅读以下文章:Gender Classification from Speech。
至少应该对所涉及的概念/方法有所了解(就我所知,本文对此进行了很好的描述)。
答案 1 :(得分:3)
首先,您必须找到音高值,并且可以在本文中找到一种用于查找语音音高值的优秀算法:http://www.fon.hum.uva.nl/paul/papers/Proceedings_1993.pdf。
这非常准确。
答案 2 :(得分:2)
我和克里斯托夫在一起,因为我没有太多的经验,也认为一些研究将是你最好的途径。
如果我不得不对此进行一次尝试,我猜它会涉及使用傅里叶变换计算样本的频谱,然后确定平均频率的位置。根据不同的文化和语言,建立一个男性与女性的大样本,然后将您的特定样本的平均频率与男性与女性的既定手段进行比较。
我可能完全错了,所以研究真的是你最好的选择。
答案 3 :(得分:1)
一种方法是使用人工神经网络。你为神经网络提供了一些训练的例子,它应该有助于学会正确地分类声音。您可能需要使用傅立叶变换进行一些特征提取,以便将数据转换为合适的形式。
如果您在Google上搜索“神经网络说话人识别”,有几篇关于此类方法的论文,但不幸的是,我对他们不太熟悉,无法推荐任何特定的方法。