我有来自11个人的4个音素(a,e,o,u)的录音。我使用来自10个人的数据训练了ANN,并使用另一组进行测试。我使用了第一段(20ms)记录的14个LPC系数作为特征。
每个音素的训练矩阵I
有14行10列。所以它是14 * 40。由于它是一个监督分类问题,我构建了一个4 * 40的目标矩阵T
。它包含1和0,其中1表示I
中的相应列来自该类。
测试数据矩阵包含四列和14行,因为它只包含来自一个人的4个音素。我们称之为S
。
以下是代码:
net = newff(I, T, 15);
net = init(net);
net.trainParam.epochs = 10000;
net.trainParam.goal = 0.01;
net = train(net, I, T);
y1 = sim(net, I);
y2 = sim(net, S)
即使我将训练数据作为测试数据(y1)给出,结果也不好。
这里有什么问题?