Question

我是python的新手，并且遇到了一个非常令人沮丧的问题。我需要加载csv文件的第1-12列（所以不是第0列），但我需要跳过excel的标题，并用"0,1,..,11"覆盖它我需要使用panda.read_csv（）。

基本上，我的csv是：

"a", "b", "c", ..., "l"
  1,   2,   3, ...,  12
  1,   2,   3, ...,  12

我希望将其加载为数据框，以便

dataframe[0] = 2,2,2,..
dataframe[1] = 3,3,3..

ergo跳过第一列，并使数据帧以索引0开头。我已尝试设置usecols = [1,2,3..]，但索引为1,2,3,..。

任何帮助都会感激不尽。

Answer 1

您可以使用usecols=range(1,12)删除标题行，names=range(11)删除最后11列，使用This is the header. Header header header. And the second header line. a,b,c,d,e,f,g,h,i,j,k,l 1,2,3,4,5,6,7,8,9,10,11,12 1,2,3,4,5,6,7,8,9,10,11,12 1,2,3,4,5,6,7,8,9,10,11,12命名从0到10的11列。

这是假数据集：

> df = pd.read_csv('data_file.csv', usecols=range(1,12), names=range(11), header=2)
> df
# returns:
    0   1   2   3   4   5   6   7   8   9  10
0   2   3   4   5   6   7   8   9  10  11  12
1   2   3   4   5   6   7   8   9  10  11  12
2   2   3   4   5   6   7   8   9  10  11  12

> df[0]
# returns:
0    2
1    2
2    2

使用代码：

{{1}}

加载列x1，x2，x3 ..标题：0,1，

1 个答案: