机器学习:PCA用于不同数量的功能

时间:2016-11-02 16:29:45

标签: machine-learning pca supervised-learning mfcc

我是机器学习的新手,我正在建立一个简单的应用来识别口头数字 我使用MFCC来提取音频文件的过滤特性。 MFCC输出一个13 x length_of_audio矩阵。我想将此信息用于我的特征向量。但显然,每个例子都有不同数量的特征 我的问题是处理不同数量的功能的方法是什么。例如。我可以使用PCA总是提取一些固定数量的功能,然后在特定的学习算法中使用它们吗? 我想使用逻辑回归作为学习算法。

这是我在分析其中一个口述数字时收到的内容。 MFCC

1 个答案:

答案 0 :(得分:0)

在你的情况下,如果你的用户有一个length_of_audio_matrix = N你没有13 * N的特征向量,你有N个长度为13的特征向量(它们组成一个序列,但它们是不同的特征向量)。

您必须编写包含13个要素的矩阵:

MFCCUser1,Slot1
MFCCUser1,Slot2
....
MFCCUser1,SlotN
MFCCUser2,Slot1
MFCCUser2,Slot2
...

然后您可以应用主成分分析。

你只有13个功能,你真的需要减少它们吗?