我正在尝试使用caffe来模拟sklearn中的SGDclassifier和Logisticregression线性模型。众所周知,在caffe中,一个“InnerProduct”图层加上一个“Softmaxwithloss”图层表示逻辑回归Y = Logit(WX+b)
。
我现在使用sklearn数据集包中的数字数据集作为trianing集(所有数据标签对的5/6)和测试集(其余1/6)。然而,SGDclassifer()
或LogisticRegression()
获得的准确度可达到近90%,而双层神经网络获得的准确度在训练后不能超过30%。这是因为参数设置还是别的?他们之间的差距太大了。