我正在看Keras'卷积神经网络的例子。 (例如,请参阅https://github.com/fchollet/keras/blob/master/examples/imdb_cnn.py。)但是,我无法弄清楚" maxlen"参数。它会与填充有关吗?它不是最大数量的功能;他们有一个max_features参数。
答案 0 :(得分:2)
maxlen
参数是文字样本的单词长度。
在Keras代码示例中,您有以下设置:
# set parameters:
max_features = 5000
maxlen = 400
...
embedding_dims = 50
这意味着您有5000个单词的词汇表,每个单词都嵌入到具有50个维度的特征向量中,每个文本样本可以长达400个单词。
间接地,当文本样本短于400个单词时,这也与填充有关。然后你必须将它们填充到400的长度。
对于文本分类的1D-ConvNets,请参阅本文和此博客文章:
https://arxiv.org/abs/1408.5882
http://www.wildml.com/2015/11/understanding-convolutional-neural-networks-for-nlp/