Question

我是机器学习的新手，我正在建立一个简单的应用来识别口头数字我使用MFCC来提取音频文件的过滤特性。 MFCC输出一个13 x length_of_audio矩阵。我想将此信息用于我的特征向量。但显然，每个例子都有不同数量的特征我的问题是处理不同数量的功能的方法是什么。例如。我可以使用PCA总是提取一些固定数量的功能，然后在特定的学习算法中使用它们吗？我想使用逻辑回归作为学习算法。

这是我在分析其中一个口述数字时收到的内容。

Answer 1

在你的情况下，如果你的用户有一个length_of_audio_matrix = N你没有13 * N的特征向量，你有N个长度为13的特征向量（它们组成一个序列，但它们是不同的特征向量）。

您必须编写包含13个要素的矩阵：

MFCCUser1,Slot1
MFCCUser1,Slot2
....
MFCCUser1,SlotN
MFCCUser2,Slot1
MFCCUser2,Slot2
...

然后您可以应用主成分分析。

你只有13个功能，你真的需要减少它们吗？

机器学习：PCA用于不同数量的功能

1 个答案: