将列名称分配给csv数据集

时间:2014-04-25 20:05:33

标签: python csv numpy

我目前正在处理由以下数据组成的数据集:

paper_id, word_attributes, class_label

现在总共有3700个word_attributes列表示二进制值。在python中是否有一个方法可以使用它来分配列标题?感谢。

1 个答案:

答案 0 :(得分:2)

您可以使用以下方式阅读csv文件:

a = np.genfromtxt(filename, delimiter=',', dtype=None, names=True)

它将创建一个numpy.recarray,其中每个列都可以通过键调用,例如a['paper_id']。当dtype=None时," dtypes将由每个的内容决定 列,单独"。


编辑:正如@a​​skewchan所建议的那样,你必须通过names=True来保留csv列的原始名称。