我是机器学习的新手,我正在建立一个简单的应用来识别口头数字 我使用MFCC来提取音频文件的过滤特性。 MFCC输出一个13 x length_of_audio矩阵。我想将此信息用于我的特征向量。但显然,每个例子都有不同数量的特征 我的问题是处理不同数量的功能的方法是什么。例如。我可以使用PCA总是提取一些固定数量的功能,然后在特定的学习算法中使用它们吗? 我想使用逻辑回归作为学习算法。
答案 0 :(得分:0)
在你的情况下,如果你的用户有一个length_of_audio_matrix = N你没有13 * N的特征向量,你有N个长度为13的特征向量(它们组成一个序列,但它们是不同的特征向量)。
您必须编写包含13个要素的矩阵:
MFCCUser1,Slot1
MFCCUser1,Slot2
....
MFCCUser1,SlotN
MFCCUser2,Slot1
MFCCUser2,Slot2
...
然后您可以应用主成分分析。
你只有13个功能,你真的需要减少它们吗?