我目前正在处理由以下数据组成的数据集:
paper_id, word_attributes, class_label
现在总共有3700个word_attributes列表示二进制值。在python中是否有一个方法可以使用它来分配列标题?感谢。
答案 0 :(得分:2)
您可以使用以下方式阅读csv文件:
a = np.genfromtxt(filename, delimiter=',', dtype=None, names=True)
它将创建一个numpy.recarray
,其中每个列都可以通过键调用,例如a['paper_id']
。当dtype=None
时," dtypes将由每个的内容决定
列,单独"。
编辑:正如@askewchan所建议的那样,你必须通过names=True
来保留csv列的原始名称。