load_digits()和fetch_mldata(“MNIST Original”)之间的区别是什么?

时间:2017-11-29 10:38:24

标签: python machine-learning scikit-learn dataset mnist

我想知道

之间的区别
from sklearn import datasets
dataset = datasets.fetch_mldata("MNIST Original")

from sklearn.datasets import load_digits
tempdigits = load_digits()  

这两个如何与MNIST数据集相关?

1 个答案:

答案 0 :(得分:3)

sklearn附带了一些小型标准数据集,无需从某些外部网站下载任何文件。 load_digits包括来自UCI ML数据集的大约1800个大小为8X8的样本:

http://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits

fetch_mldata从中下载MNist数据集 http://mldata.org/repository/data/viewslug/mnist-original/ 其中包含70000个大小为28x28像素的样本

所以基本上下载的数据集是不同的。