我有一个虹膜示例,样本数据中的类型具有三个浮点值: 0.0、1.0、2.0。
我猜它们之间的大小关系可能会误导训练模型。
我是对的吗?是否应该使用一键编码或其他方式将其转换为三个向量?
from keras.utils import np_utils
trainY = np_utils.to_categorical(trainY)
答案 0 :(得分:1)
在虹膜数据集中,存在三个可能的标签。
转换为数字时,您将得到0、1、2个离散整数。因此,您有用于分类问题的三个类。
如果将其转换为热点,则使用categorical_crossentropy
,否则使用sparse_categorical_crossentropy
。