访问scikit数据集中的列

时间:2014-02-22 23:26:40

标签: python-3.x numpy scikit-learn scikits

我正在scikit库中加载内置波士顿数据集:

from sklearn.datasets import load_boston bdata = load_boston()

我想提取第一列中的所有值,称为CRIM。我写了一句话: plt.scatter(bdata.CRIM,bdata.target,color='blue')

但我得到一个错误,因为“AttributeError:'Bunch'对象没有属性'CRIM'”

如何访问标题为“CRIM”的列的元素?

1 个答案:

答案 0 :(得分:2)

数据值存储在data属性中,要访问第一列的所有值,可以使用numpy的slice语法。在这种情况下,您需要:

plt.scatter(bdata.data[:,0],bdata.target,color='blue')

冒号表示您为特定轴选择“全部”(这是第一个轴,在这种情况下为“行”),0表示您想要所有行的第一个元素 - 这是第一个列。