Question

我目前正在处理由以下数据组成的数据集：

paper_id, word_attributes, class_label

现在总共有3700个word_attributes列表示二进制值。在python中是否有一个方法可以使用它来分配列标题？感谢。

Answer 1

您可以使用以下方式阅读csv文件：

a = np.genfromtxt(filename, delimiter=',', dtype=None, names=True)

它将创建一个numpy.recarray，其中每个列都可以通过键调用，例如a['paper_id']。当dtype=None时，＆＃34; dtypes将由每个的内容决定列，单独＆＃34;。

编辑：正如@askewchan所建议的那样，你必须通过names=True来保留csv列的原始名称。