从我的本地文件夹加载数据集

时间:2016-01-23 21:53:15

标签: python scikit-learn python-nolearn

我正在关注this tutorial中的示例。

而不是按如下方式加载数据集:

dataset = datasets.fetch_mldata("MNIST Original")

如何从“本地”文件夹加载数据集?是否有一个特定的数据结构,以便在示例中使用它?

感谢。

1 个答案:

答案 0 :(得分:0)

我认为答案已经在您提供的页面中找到了

  

我们调用第13行上的fetch_mldata函数进行下载   来自mldata.org存储库的原始MNIST数据集。

     

实际数据集大约为55mb,因此可能需要几秒钟   下载。但是,一旦下载了数据集,它就会在本地缓存   在您的机器上,这样您就不必再次下载了

它将加载数据集一次,然后使用本地缓存的副本。

来源:http://www.pyimagesearch.com/2014/09/22/getting-started-deep-learning-python/

编辑:http://scikit-learn.org/stable/datasets/mldata.html上有一些信息,例如

  

MNIST数据库共包含70000个手写示例   大小为28x28像素的数字,标记为0到9

  

首次下载后,数据集将在路径中本地缓存   由data_home关键字参数指定,默认为   〜/ scikit_learn_data /