这可能是一个非常愚蠢的问题,但我无法在任何地方找到详细信息。
所以我有一个3秒长的录音(wav文件)。这是我的样本,需要将其归类为[class_A]或[class_B]。
通过跟踪MFCC上的一些tutroial,我将样本划分为帧(准确地说是291帧),并且我从每个帧中获得了MFCC。
现在我有291个特征向量,每个向量的长度为13。
我的问题是;你如何将这些向量与分类器(例如k-NN)一起使用?我有291个向量代表1个样本。我知道如何使用1个样本的1个向量,但如果我有291个,我不知道该怎么办。我无法在任何地方找到解释。