sklearn load_digits数据集中图像和数据之间的差异

时间:2017-03-16 03:02:08

标签: python scikit-learn

出于好奇,这更像是一个问题。我在sklearn load_digits数据集中看到了2个不同的2D数组 - 图像和数据(http://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_digits.html),并想知道我是否可以交替使用它们进行训练。我问,因为我能够用图像而不是数据来训练NN,并且看到它收敛到大约0.5%的列车错误和8%的验证错误,80-20分割。如果是这样,两者之间的功能有什么不同?

除了您可以使用图像数据集进行可视化之外,文档没有提及这两个。

1 个答案:

答案 0 :(得分:2)

考虑一下:

undefined

就功能而言,from sklearn.datasets import load_digits digits = load_digits() digits.data之间没有区别。两者都包含一些8 * 8图像的像素值。 第一个是(1797,64)digits.images,而第二个是(1797,8,8)numpy.ndarray。唯一的区别是numpy.ndarraydigits.images[i]的8 * 8重塑,更适合可视化。