应用错误收集

时间：2014-05-11 01:53:02

标签： python scipy scikit-learn

我目前正在使用sklearn构建一个简单的图像识别器。

我需要使用load_files（＆＃39; ./ directory /＆＃39;）从该目录中的子文件夹加载图像。

它正确获取目标值，但数据属性不是简单的像素值。我假设我需要设置编码参数来考虑图像文件，但无法找到准确使用的内容。

答案 0 :(得分：4)

编码参数用于解码假设文本编码的文件内容的原始字节（例如UTF-8）。

对于图像文件，您需要自己迭代filenames属性的内容并使用类似scipy.misc.imread的内容（您还需要安装PIL或Pillow包）。

这是一个实用程序函数，用于从野外的Labeled Faces加载jpeg文件的数据作为numpy数组：

您可以使用它来了解如何编写自己的自定义数据集加载器。