我正在MNIST数据集上训练线性模型,但我只想训练一个数字4。如何选择X_test,X_train,y_test和y_train?
答案 0 :(得分:0)
您的分类器需要学习区分不同类别的集合。 如果您只关心数字4,则应将训练和测试集划分为:
否则,火车/测试拆分仍是典型的,您希望没有重叠。
答案 1 :(得分:0)
如果只需要识别4s,则是二进制分类问题,因此只需创建一个新的目标变量:如果class为4,则为Y = 1;如果class不是4,则为Y = 0。
数据会有点不平衡,但这不应该成为问题!