出于好奇,这更像是一个问题。我在sklearn load_digits数据集中看到了2个不同的2D数组 - 图像和数据(http://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_digits.html),并想知道我是否可以交替使用它们进行训练。我问,因为我能够用图像而不是数据来训练NN,并且看到它收敛到大约0.5%的列车错误和8%的验证错误,80-20分割。如果是这样,两者之间的功能有什么不同?
除了您可以使用图像数据集进行可视化之外,文档没有提及这两个。
答案 0 :(得分:2)
考虑一下:
undefined
就功能而言,from sklearn.datasets import load_digits
digits = load_digits()
和digits.data
之间没有区别。两者都包含一些8 * 8图像的像素值。
第一个是(1797,64)digits.images
,而第二个是(1797,8,8)numpy.ndarray
。唯一的区别是numpy.ndarray
是digits.images[i]
的8 * 8重塑,更适合可视化。