“野外标记面孔”数据集(scikit learn)中“数据”字段的性质是什么?

时间:2015-01-24 21:46:56

标签: python machine-learning scikit-learn

我正在尝试使用从sklearn.datasets.fetch_lfw_people获取的数据训练一个简单的HOG人脸检测器。获取数据集后,我找到以下键:

In [1]:  lfw_people.keys()
Out[1]:  ['images', 'data', 'target_names', 'DESCR', 'target']
  • images包含裁剪的面孔
  • target_names包含人类可读的名称
  • target包含图片中人物的数字身份证号码
  • DESCR将记录标识为属于LFW数据集。

...但是地球上的内容是data

在我的情况下,它是一个(13233 x 1850) numpy浮点数组,也就是说每个图像有一行1850个浮点数。

data字段的性质是什么?

1 个答案:

答案 0 :(得分:0)

(lfw_people.images[0].ravel() == lfw_people.data[0]).all()评估为True,因此data字段似乎只是将图像展平为矢量。

神秘解决了,但这种事情确实应该事先表明:/