我正在尝试构建语音识别应用程序。到目前为止,我已经从10个样本语音中提取出mfcc特征。每个样品产生不同的形状,如下所示:
(698,12)
(414,12)
(610,12)
(586,12)
(698,12)
(282,12)
(250,12)
(370,12)
(694,12)
(490,12)
我计划使用kNN(或其他分类算法)来做到这一点,但每个样本的形状并不相同,而2D数组不是一维数组,因此我可以直接将其提供给模型。
如何以这种方式转换此数组,以便将其提供给机器学习算法或如何使用2D数组构建模型?
请告知
答案 0 :(得分:0)
我使用GMM完成此操作。所以每个观察都有自己的模型。