我想知道
之间的区别from sklearn import datasets
dataset = datasets.fetch_mldata("MNIST Original")
和
from sklearn.datasets import load_digits
tempdigits = load_digits()
这两个如何与MNIST数据集相关?
答案 0 :(得分:3)
sklearn附带了一些小型标准数据集,无需从某些外部网站下载任何文件。 load_digits包括来自UCI ML数据集的大约1800个大小为8X8的样本:
http://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits
fetch_mldata从中下载MNist数据集 http://mldata.org/repository/data/viewslug/mnist-original/ 其中包含70000个大小为28x28像素的样本
所以基本上下载的数据集是不同的。