我是python的新手,并且遇到了一个非常令人沮丧的问题。我需要加载csv文件的第1-12列(所以不是第0列),但我需要跳过excel的标题,并用"0,1,..,11"
覆盖它
我需要使用panda.read_csv()。
"a", "b", "c", ..., "l"
1, 2, 3, ..., 12
1, 2, 3, ..., 12
我希望将其加载为数据框,以便
dataframe[0] = 2,2,2,..
dataframe[1] = 3,3,3..
ergo跳过第一列,并使数据帧以索引0开头。
我已尝试设置usecols = [1,2,3..]
,但索引为1,2,3,..
。
任何帮助都会感激不尽。
答案 0 :(得分:1)
您可以使用usecols=range(1,12)
删除标题行,names=range(11)
删除最后11列,使用This is the header. Header header header.
And the second header line.
a,b,c,d,e,f,g,h,i,j,k,l
1,2,3,4,5,6,7,8,9,10,11,12
1,2,3,4,5,6,7,8,9,10,11,12
1,2,3,4,5,6,7,8,9,10,11,12
命名从0到10的11列。
这是假数据集:
> df = pd.read_csv('data_file.csv', usecols=range(1,12), names=range(11), header=2)
> df
# returns:
0 1 2 3 4 5 6 7 8 9 10
0 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 7 8 9 10 11 12
2 2 3 4 5 6 7 8 9 10 11 12
> df[0]
# returns:
0 2
1 2
2 2
使用代码:
{{1}}