以CSV格式重新排序列

时间:2016-06-23 20:06:17

标签: python python-2.7 csv numpy pandas

之前已发布问题,但未正确传达要求。我有一个超过1000列的csv文件:

A   B   C   D ....  X   Y   Z
1   0   0.5 5 ....  1   7   6
2   0   0.6 4 ....  0   7   6
3   0   0.7 3 ....  1   7   6
4   0   0.8 2 ....  0   7   6

这里X,Y和Z是999,1000,10001列,A,B,C,D是第1,第2,第3和第4列。我需要对列进行重新排序,以便给出以下内容。

D   Y   Z   A   B   C   ....X
5   7   6   1   0   0.5 ....1
4   7   6   2   0   0.6 ....0
3   7   6   3   0   0.7 ....1
2   7   6   4   0   0.8 ....0

即第4列成为第1列,第1000列和第1001列成为第2列和第3列,其他列相应地向右移位。

2 个答案:

答案 0 :(得分:1)

所以问题是如何以自定义方式重新排序列。

例如,您有以下DF,并且您希望按以下方式(索引)重新排序列:

5,3,休息......

DF

In [82]: df
Out[82]:
   A  B    C  D  E  F  G
0  1  0  0.5  5  1  7  6
1  2  0  0.6  4  0  7  6
2  3  0  0.7  3  1  7  6
3  4  0  0.8  2  0  7  6

In [83]: cols = df.columns.tolist()

In [84]: cols
Out[84]: ['A', 'B', 'C', 'D', 'E', 'F', 'G']

重新排序:

In [88]: cols = [cols.pop(5)] + [cols.pop(3)] + cols

In [89]: cols
Out[89]: ['F', 'D', 'A', 'B', 'C', 'E', 'G']

In [90]: df[cols]
Out[90]:
   F  D  A  B    C  E  G
0  7  5  1  0  0.5  1  6
1  7  4  2  0  0.6  0  6
2  7  3  3  0  0.7  1  6
3  7  2  4  0  0.8  0  6

答案 1 :(得分:0)

In [4]: df
Out[4]:
   A  B    C  D  X  Y  Z
0  1  0  0.5  5  1  7  6
1  2  0  0.6  4  0  7  6
2  3  0  0.7  3  1  7  6
3  4  0  0.8  2  0  7  6

In [5]: df.reindex(columns=['D','Y','Z','A','B','C','X'])
Out[5]:
   D  Y  Z  A  B    C  X
0  5  7  6  1  0  0.5  1
1  4  7  6  2  0  0.6  0
2  3  7  6  3  0  0.7  1