我想将此玩具数据集用于教育。 但是当我尝试使用内置的sklearn加载器加载它时,出现了错误。
from sklearn import datasets
lfw_people = datasets.fetch_lfw_people(min_faces_per_person=50,
resize=0.4, data_home='.', )
错误:
urlopen错误[WinError 10061]
我知道这与代理有关-通常使用--proxy选项安装新软件包。
但是现在该怎么办? datasets.fetch_lfw_people
我考虑过从官方网站http://vis-www.cs.umass.edu/lfw/#download手动下载它 但是我不知道该选择哪个,然后在python中打开它。
答案 0 :(得分:1)
fetch_lfw_people
默认情况下将检查'~/scikit_learn_data/lfw_home'
中的数据,以查看数据集是否已下载并且是否正确(通过匹配哈希值)。
根据source code,它从以下网址下载4个文件:
针对目标
用于数据
lfw-funneled.tgz (默认):https://ndownloader.figshare.com/files/5976015
OR
lfw.tgz (当funneled=False
时):https://ndownloader.figshare.com/files/5976018
因此,您可以下载这些文件并将其保存在指定的文件夹中。之后,只需调用fetch_lfw_people
方法,它将在不连接互联网的情况下从该位置加载数据。
这里~
是指用户的家庭位置。您可以使用以下代码来根据系统了解该文件夹的默认位置。
from sklearn.datasets import get_data_home
print(get_data_home())
由于您已将该值更改为data_home='.'
,因此应使用不带~/lfw_home
的{{1}}(即直接在主文件夹中制作'scikit_learn_data'
)。