Numpy:无法读取数据集标题

时间:2012-11-10 17:19:43

标签: python numpy names

我的代码看起来像

import numpy as np
from numpy import genfromtxt

train = genfromtxt('/Users/hhimanshu/Downloads/dataset/digitrecognizer/train.csv',
                   delimiter=',', names=True)

并且train.csv包含

等数据
label,pixel0,pixel1,pixel2,pixel3, .....
1,0,0,0, ...

当我做的时候

train.names

我得到了

---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-62-dea84e8fe1f5> in <module>()
      4 print 'size(Number of elements in array) = ', train.size
      5 # print 'data type = ', train.dtype
----> 6 train.names

AttributeError: 'numpy.ndarray' object has no attribute 'names'

这个形状对我来说似乎不正确

shape(Tuple of array dimensions) =  (42000,)
dimension(Number of array dimensions) =  1
size(Number of elements in array) =  42000

我知道我有 785 列和 2 维度(在这里说1)

我做得对的是什么?

2 个答案:

答案 0 :(得分:0)

我的坏,

ndarray没有名为names的属性 我可以将列引用为train['labels']并获取数据

答案 1 :(得分:0)

要获取可以使用的列名称:train.dtype.names

这仅在train是记录(结构化)数组时才有效。