Question

道歉的问题......

我正在玩sklearn附带的虹膜数据集。当我进入：

iris.feature_names

输出：

['sepal length (cm)',
 'sepal width (cm)',
 'petal length (cm)',
 'petal width (cm)']

我不明白的是它得到了那些话。我在Excel中打开了虹膜CSV，但找不到任何这些词的引用。

我错过了什么？

这就是Excel中的CSV中可见的所有内容：

150,4,setosa,versicolor,virginica
5.1,3.5,1.4,0.2,0
4.9,3.0,1.4,0.2,0
4.7,3.2,1.3,0.2,0
4.6,3.1,1.5,0.2,0
5.0,3.6,1.4,0.2,0
5.4,3.9,1.7,0.4,0
4.6,3.4,1.4,0.3,0
5.0,3.4,1.5,0.2,0
4.4,2.9,1.4,0.2,0
4.9,3.1,1.5,0.1,0
5.4,3.7,1.5,0.2,0
4.8,3.4,1.6,0.2,0
4.8,3.0,1.4,0.1,0
4.3,3.0,1.1,0.1,0
5.8,4.0,1.2,0.2,0
5.7,4.4,1.5,0.4,0
Etc...

Answer 1

如果您查看the source datasets.load_iris()函数 - 如果您正在使用IPython，则可以使用datasets.load_iris??轻松完成 - 您可以看到正在发生的事情。在函数的最后一部分 - 在阅读并处理了iris.csv和iris.rst文件之后 - 你会看到

return Bunch(data=data, target=target,
             target_names=target_names,
             DESCR=fdescr.read(),
             feature_names=['sepal length (cm)', 'sepal width (cm)',
                            'petal length (cm)', 'petal width (cm)'])

所以这些功能名称在函数中是硬编码的，而不是csv。

sklearn附带的iris.csv数据集中是否有隐藏数据？

1 个答案: