修改顺序模型的多类预测数组以匹配KerasClassifier

时间:2018-08-19 16:21:37

标签: python keras metrics multiclass-classification

我了解使用

dataframe = pandas.read_csv("IrisDataset.csv", header=None)
dataset = dataframe.values 
X = dataset[:,0:4].astype(float)
Y = dataset[:,4]

# encode class values as integers
encoder = LabelEncoder()
encoder.fit(Y)
encoded_Y = encoder.transform(Y)
# convert integers to dummy variables (i.e. one hot encoded)
dummy_y = np_utils.to_categorical(encoded_Y)

def baseline_model():
    # create model
    model = Sequential()
    model.add(Dense(8, input_dim=4, activation='relu'))
    model.add(Dense(3, activation='softmax'))
    # Compile model
    model.compile(loss='categorical_crossentropy', optimizer='adam',  metrics=['accuracy'])
  return model
estimator = KerasClassifier(build_fn=baseline_model, epochs=50, batch_size=5, verbose=0)    

estimator.fit(X, dummy_y)
predictions=estimator.predict(X)

要创建预测,可以通过以下方式计算指标

print "PRECISION\t", precision_score(Y,encoder.inverse_transform(predictions), average=None)

其中,Y是训练集的标签。但是,如果我使用估算器而不是估算器:

model = Sequential()
model.add(Dense(8, input_dim=4, activation='relu'))
model.add(Dense(3, activation='softmax'))
# Compile model
model.compile(loss='categorical_crossentropy', optimizer='adam',  metrics=['accuracy']
model.fit(X, dummy_y,epochs=50,batch_size=5,  shuffle=True, verbose=1)
predictions=model.predict(x=tst_X,batch_size=50,verbose=1) 

然后,预测具有不同的形式,我不能将其用作计算的参数。 还有另一种计算精度和其他指标的方法吗? 我需要转换预测吗?

1 个答案:

答案 0 :(得分:1)

您的Sequential模型的输出将具有(3,)的形状,其中包含估计的类概率。接下来,您必须为每个预测获取预测(最有可能)的类,即您必须采用argmax

predictions = model.predict(x=tst_X, batch_size=50, verbose=1)
predictions = np.argmax(predictions, 1)

然后,您可以按原样使用其余代码。

否则,您也可以直接使用predict_classes模型的Sequential函数,这基本上是在做同样的事情:

predictions = model.predict_classes(x=tst_X, batch_size=50, verbose=1)