使用代理加载fetch_lfw_people

时间:2018-11-22 14:52:39

标签: python-3.x proxy scikit-learn dataset jupyter-notebook

我想将此玩具数据集用于教育。 但是当我尝试使用内置的sklearn加载器加载它时,出现了错误。

from sklearn import datasets 
lfw_people = datasets.fetch_lfw_people(min_faces_per_person=50, 
                resize=0.4, data_home='.', )

错误:

  

urlopen错误[WinError 10061]

我知道这与代理有关-通常使用--proxy选项安装新软件包。 但是现在该怎么办? datasets.fetch_lfw_people

中没有这样的选项

我考虑过从官方网站http://vis-www.cs.umass.edu/lfw/#download手动下载它 但是我不知道该选择哪个,然后在python中打开它。

1 个答案:

答案 0 :(得分:1)

fetch_lfw_people默认情况下将检查'~/scikit_learn_data/lfw_home'中的数据,以查看数据集是否已下载并且是否正确(通过匹配哈希值)。

根据source code,它从以下网址下载4个文件:

因此,您可以下载这些文件并将其保存在指定的文件夹中。之后,只需调用fetch_lfw_people方法,它将在不连接互联网的情况下从该位置加载数据。

这里~是指用户的家庭位置。您可以使用以下代码来根据系统了解该文件夹的默认位置。

from sklearn.datasets import get_data_home
print(get_data_home())

由于您已将该值更改为data_home='.',因此应使用不带~/lfw_home的{​​{1}}(即直接在主文件夹中制作'scikit_learn_data')。