我正在尝试解决一个简单的多类分类问题。但是不知何故我遇到了这个错误。当我使用单层并带有2个神经元时,该程序可以工作,但结果不好,但这没有意义,因为它是一个多类问题,因此输出层在输出处应该有4个神经元。之后,它不起作用。我认为我在这里犯了一个非常愚蠢的错误。下面是我的代码。
grades = {"A": 0.9, "B": 0.8, "C": 0.7, "D": 0.6, "E": 0.5}
def convert_grade(scr):
for ltrgrd, numgrd in grades.items():
if scr >= numgrd:
return ltrgrd
return "F"
错误:
import keras
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout, Activation
from tensorflow.keras.optimizers import Adam
# Generate dummy data
import numpy as np
x_train = np.array([[1, 1],
[1, 2],
[2, 2],
[-1,0],
[-1,-2],
[2, 1],
[-1,-2],
[-1,-2]])
print(x_train.shape)
y_train = np.array([[0,0],
[0,0],
[0,1],
[0,1],
[1,0],
[1,0],
[1,1],
[1,1]])
# from keras.utils.np_utils import to_categorical
# y_train = to_categorical(y_train)
print(y_train.shape)
model = Sequential()
model.add(Dense(8, activation='relu', input_dim=2))
# model.add(Dropout(0.5))
# model.add(Dense(4, activation='relu'))
model.add(Dense(4, activation='softmax'))
# model.add(Dropout(0.5))
adm = Adam(lr=0.001)
# sgd = SGD(lr=0.001)
model.compile(loss='categorical_crossentropy',
optimizer=adm,
metrics=['accuracy'])
model.fit(x_train, y_train, epochs=20, batch_size=1)
score = model.evaluate(x_train, y_train, batch_size=1)
答案 0 :(得分:0)
我解决了这个错误。原因是我的标签,即y_train的形状不合适导致问题。在这里,班级数是4,我的训练数据以这种格式标记[0,0,1,1,2,2,3,3]。在上面的问题陈述中,我以分类格式表示标签的方式是完全错误的。因此,为了正确编码数据,我使用了keras.utils.to_categorical(y)**将标签转换为一键编码,从而有效地解决了形状错误。
y_train = keras.utils.to_categorical(y)
此后形状变为:
(8, 4)
因此,每当存在多类问题时,将标签编码为一键编码类型时标签的形状应为
(size_of_data, num_classes).
我现在学习了在处理多类问题时如何正确编码数据,以及如果出现此类错误应在哪里寻找解决问题的方法。