分类变量和pandas read_csv的问题

时间:2015-03-11 20:46:11

标签: python csv pandas

我这样做是为了阅读带有pandas的csv文件。

data = pd.read_csv(filename)
data.columns = ['column' + str(i) for i in xrange(1, num_columns)]
for cname in data.columns.values:
    c = pd.Categorical.from_array(data[cname])
    idx = c.levels
    data[cname] = idx.get_indexer(data[cname].values)
  1. 由于某种原因,最后一列的最后一个元素总是-1,偶数 虽然价值存在。
  2. 上面的代码似乎跳过了一行

1 个答案:

答案 0 :(得分:0)

问题是xrange(1, num_columns)只返回num_columns - 1列。所以你可能想要使用xrange(1, num_columns+1)代替。