sklearn附带的iris.csv数据集中是否有隐藏数据?

时间:2014-01-22 05:47:36

标签: python csv scikit-learn

道歉的问题......

我正在玩sklearn附带的虹膜数据集。当我进入:

iris.feature_names

输出:

['sepal length (cm)',
 'sepal width (cm)',
 'petal length (cm)',
 'petal width (cm)']

我不明白的是它得到了那些话。我在Excel中打开了虹膜CSV,但找不到任何这些词的引用。

我错过了什么?

这就是Excel中的CSV中可见的所有内容:

150,4,setosa,versicolor,virginica
5.1,3.5,1.4,0.2,0
4.9,3.0,1.4,0.2,0
4.7,3.2,1.3,0.2,0
4.6,3.1,1.5,0.2,0
5.0,3.6,1.4,0.2,0
5.4,3.9,1.7,0.4,0
4.6,3.4,1.4,0.3,0
5.0,3.4,1.5,0.2,0
4.4,2.9,1.4,0.2,0
4.9,3.1,1.5,0.1,0
5.4,3.7,1.5,0.2,0
4.8,3.4,1.6,0.2,0
4.8,3.0,1.4,0.1,0
4.3,3.0,1.1,0.1,0
5.8,4.0,1.2,0.2,0
5.7,4.4,1.5,0.4,0
Etc...

1 个答案:

答案 0 :(得分:4)

如果您查看the source datasets.load_iris()函数 - 如果您正在使用IPython,则可以使用datasets.load_iris??轻松完成 - 您可以看到正在发生的事情。在函数的最后一部分 - 在阅读并处理了iris.csviris.rst文件之后 - 你会看到

return Bunch(data=data, target=target,
             target_names=target_names,
             DESCR=fdescr.read(),
             feature_names=['sepal length (cm)', 'sepal width (cm)',
                            'petal length (cm)', 'petal width (cm)'])

所以这些功能名称在函数中是硬编码的,而不是csv