Question

我正在尝试对MNIST数据集的子集进行二进制分类。目标是预测样本是6还是8.因此，每个样本有784个像素特征，数据集中有8201个样本。我构建了一个输入层，2个隐藏层和一个输出层的网络。我使用sigmoid作为激活函数来输出图层并重新隐藏图层。我不知道为什么我最终得到0％的准确率。

#import libraries
from keras.models import Sequential
from keras.layers import Dense
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
import os
np.random.seed(7)

os.chdir('C:/Users/olivi/Documents/Python workspace')

#data loading
data = pd.read_csv('MNIST_CV.csv')

#Y target label
Y = data.iloc[:,0]

#X: features
X = data.iloc[:,1:]

X_train, X_test, y_train, y_test = train_test_split(X, Y,test_size=0.25,random_state=42)

# create model
model = Sequential()
model.add(Dense(392,kernel_initializer='normal',input_dim=784, 
activation='relu'))
model.add(Dense(196,kernel_initializer='normal', activation='relu'))
model.add(Dense(98,kernel_initializer='normal', activation='relu'))
model.add(Dense(1, activation='sigmoid'))


model.compile(loss = 'binary_crossentropy', optimizer='adam', metrics=['accuracy'])
model.summary()


# Training the model
model.fit(X_train, y_train, epochs=100, batch_size=50)

print(model.predict(X_test,batch_size= 50))

score = model.evaluate(X_test, y_test)
print("\n Testing Accuracy:", score[1])

Answer 1

如果使用二进制交叉熵，则标签应为0或1（分别表示“不是数字6”或“数字6”）。

如果您现在的Y目标标签是值6和8，它将失败。

Answer 2

一旦选择了MNIST的子集，您必须确定样本中有多少不同的数字类别（训练和测试集）。

所以：

classes=len(np.unique(Y))

然后你应该热编码Y：

Y_train = np_utils.to_categorical(y_train, classes)
Y_test = np_utils.to_categorical(y_test, classes)

之后，将神经网络的最后一层更改为：

model.add(Dense(classes, activation='sigmoid'))

最后：

model.predict_classes(X_test,batch_size= 50)

确保训练和测试集的Y类具有相同的类数。

在预测之后，使用np.where（）找到6和8所在的位置，选择此子样本并测试您的准确性。

我对此keras神经网络的准确率为0％

2 个答案: