Question

我这样做是为了阅读带有pandas的csv文件。

data = pd.read_csv(filename)
data.columns = ['column' + str(i) for i in xrange(1, num_columns)]
for cname in data.columns.values:
    c = pd.Categorical.from_array(data[cname])
    idx = c.levels
    data[cname] = idx.get_indexer(data[cname].values)

由于某种原因，最后一列的最后一个元素总是-1，偶数虽然价值存在。
上面的代码似乎跳过了一行

Answer 1

问题是xrange(1, num_columns)只返回num_columns - 1列。所以你可能想要使用xrange(1, num_columns+1)代替。

分类变量和pandas read_csv的问题

1 个答案: