我正在尝试使用PyBrain实现一个简单的单位数分类器。我有许多记录的数字0到9的数据的训练数据,并编写了一个脚本来为每个例子提取MFCC。为了简单起见(现在),我只计算13个系数,并且每隔10ms对音频文件进行一次采样。由于每个记录的训练示例具有不同的持续时间,因此所有“0”的集合的样本数量例如根据音频的长度而改变。因此,对于一些“零”的例子,我有一个形状(67,13)的MFCC训练矢量,而对于其他人,它可能是(44,13)。
问题在于,在PyBrain中创建数据集时,输入向量的维度必须是统一的,并且应包含与列相同的行数。
是否有某种方法可以定义数据集,以便输入向量具有一定数量的列(13个MFCC)但行数可变(取决于从信号中取出的样本数量)?或者我完全错了吗?
我已经在线搜索和搜索Stack Overflow,但无法得出答案。我可以在教程中遵循并实现Pybrain示例。
答案 0 :(得分:0)
D'哦。显然,我需要使用特定数字的所有向量来估计多维概率密度函数。