在keras中设置CNN网络?

时间:2017-01-23 01:23:07

标签: python-2.7 keras conv-neural-network

我目前正在尝试实现一个cnn网络,它可以将输入映射到输出。

输入由大量音频文件组成,输出是特征向量。

由于音频文件的长度不同,总采样数总是不同,但每个采样的帧长度为25 ms,重叠时间为10 ms。形状(X,2050)

输出是特征向量形状是(x,13)。

我认为cnn的使用在这里似乎是合适的,因为每个输入由于重叠而包含前一个样本的一些信息。

在keras中是否可以设计一个利用此模型的模型,因此将为矩阵的每一行计算卷积和,并以某种方式使其知道25帧长度和10个重叠。

1 个答案:

答案 0 :(得分:1)

是的,请参阅此文件的第220行[1]。这是使用卷积在Keras中实现的Wavenet。尽管他们已经创建了包装层,但这应该让您直观了解如何为音频样本建模。

[1] https://github.com/basveeling/wavenet/blob/master/wavenet.py#L220