道歉的问题......
我正在玩sklearn附带的虹膜数据集。当我进入:
iris.feature_names
输出:
['sepal length (cm)',
'sepal width (cm)',
'petal length (cm)',
'petal width (cm)']
我不明白的是它得到了那些话。我在Excel中打开了虹膜CSV,但找不到任何这些词的引用。
我错过了什么?
这就是Excel中的CSV中可见的所有内容:
150,4,setosa,versicolor,virginica
5.1,3.5,1.4,0.2,0
4.9,3.0,1.4,0.2,0
4.7,3.2,1.3,0.2,0
4.6,3.1,1.5,0.2,0
5.0,3.6,1.4,0.2,0
5.4,3.9,1.7,0.4,0
4.6,3.4,1.4,0.3,0
5.0,3.4,1.5,0.2,0
4.4,2.9,1.4,0.2,0
4.9,3.1,1.5,0.1,0
5.4,3.7,1.5,0.2,0
4.8,3.4,1.6,0.2,0
4.8,3.0,1.4,0.1,0
4.3,3.0,1.1,0.1,0
5.8,4.0,1.2,0.2,0
5.7,4.4,1.5,0.4,0
Etc...
答案 0 :(得分:4)
如果您查看the source datasets.load_iris()
函数 - 如果您正在使用IPython,则可以使用datasets.load_iris??
轻松完成 - 您可以看到正在发生的事情。在函数的最后一部分 - 在阅读并处理了iris.csv
和iris.rst
文件之后 - 你会看到
return Bunch(data=data, target=target,
target_names=target_names,
DESCR=fdescr.read(),
feature_names=['sepal length (cm)', 'sepal width (cm)',
'petal length (cm)', 'petal width (cm)'])
所以这些功能名称在函数中是硬编码的,而不是csv
。