加载列x1,x2,x3 ..标题:0,1,

时间:2017-02-07 12:51:38

标签: python pandas dataframe

我是python的新手,并且遇到了一个非常令人沮丧的问题。我需要加载csv文件的第1-12列(所以不是第0列),但我需要跳过excel的标题,并用"0,1,..,11"覆盖它 我需要使用panda.read_csv()。

基本上,我的csv是:

"a", "b", "c", ..., "l"
  1,   2,   3, ...,  12
  1,   2,   3, ...,  12

我希望将其加载为数据框,以便

dataframe[0] = 2,2,2,..
dataframe[1] = 3,3,3..

ergo跳过第一列,并使数据帧以索引0开头。 我已尝试设置usecols = [1,2,3..],但索引为1,2,3,..

任何帮助都会感激不尽。

1 个答案:

答案 0 :(得分:1)

您可以使用usecols=range(1,12)删除标题行,names=range(11)删除最后11列,使用This is the header. Header header header. And the second header line. a,b,c,d,e,f,g,h,i,j,k,l 1,2,3,4,5,6,7,8,9,10,11,12 1,2,3,4,5,6,7,8,9,10,11,12 1,2,3,4,5,6,7,8,9,10,11,12 命名从0到10的11列。

这是假数据集:

> df = pd.read_csv('data_file.csv', usecols=range(1,12), names=range(11), header=2)
> df
# returns:
    0   1   2   3   4   5   6   7   8   9  10
0   2   3   4   5   6   7   8   9  10  11  12
1   2   3   4   5   6   7   8   9  10  11  12
2   2   3   4   5   6   7   8   9  10  11  12

> df[0]
# returns:
0    2
1    2
2    2

使用代码:

{{1}}