我指的是在此链接https://richliao.github.io/supervised/classification/2016/11/26/textclassifier-convolutional上实施“使用CNN进行文本分类”。在“简化卷积”一节中,他们使用了以下的keras层:
Conv1D(128,5,activation ='relu')
根据我的理解,参数不应为5 * 100 * 128 = 64,000。但模型摘要显示64,128个参数。
有人可以帮我理解计算中的错误吗?
答案 0 :(得分:1)
窗口大小为5,输入中的通道数为100.因此,输入大小为5 * 100。有128个过滤器需要连接整个输入。因此,需要学习5 * 100 * 128个不同的边缘权重。此外,偏置矢量的大小为128,因为有128个滤波器。因此,该层要学习的参数总数为5 * 100 * 128 + 128。