Question

之前已发布问题，但未正确传达要求。我有一个超过1000列的csv文件：

A   B   C   D ....  X   Y   Z
1   0   0.5 5 ....  1   7   6
2   0   0.6 4 ....  0   7   6
3   0   0.7 3 ....  1   7   6
4   0   0.8 2 ....  0   7   6

这里X，Y和Z是999,1000,10001列，A，B，C，D是第1，第2，第3和第4列。我需要对列进行重新排序，以便给出以下内容。

D   Y   Z   A   B   C   ....X
5   7   6   1   0   0.5 ....1
4   7   6   2   0   0.6 ....0
3   7   6   3   0   0.7 ....1
2   7   6   4   0   0.8 ....0

即第4列成为第1列，第1000列和第1001列成为第2列和第3列，其他列相应地向右移位。

Answer 1

所以问题是如何以自定义方式重新排序列。

例如，您有以下DF，并且您希望按以下方式（索引）重新排序列：

5,3，休息......

DF

In [82]: df
Out[82]:
   A  B    C  D  E  F  G
0  1  0  0.5  5  1  7  6
1  2  0  0.6  4  0  7  6
2  3  0  0.7  3  1  7  6
3  4  0  0.8  2  0  7  6

列

In [83]: cols = df.columns.tolist()

In [84]: cols
Out[84]: ['A', 'B', 'C', 'D', 'E', 'F', 'G']

重新排序：

In [88]: cols = [cols.pop(5)] + [cols.pop(3)] + cols

In [89]: cols
Out[89]: ['F', 'D', 'A', 'B', 'C', 'E', 'G']

In [90]: df[cols]
Out[90]:
   F  D  A  B    C  E  G
0  7  5  1  0  0.5  1  6
1  7  4  2  0  0.6  0  6
2  7  3  3  0  0.7  1  6
3  7  2  4  0  0.8  0  6

Answer 2

In [4]: df
Out[4]:
   A  B    C  D  X  Y  Z
0  1  0  0.5  5  1  7  6
1  2  0  0.6  4  0  7  6
2  3  0  0.7  3  1  7  6
3  4  0  0.8  2  0  7  6

In [5]: df.reindex(columns=['D','Y','Z','A','B','C','X'])
Out[5]:
   D  Y  Z  A  B    C  X
0  5  7  6  1  0  0.5  1
1  4  7  6  2  0  0.6  0
2  3  7  6  3  0  0.7  1

以CSV格式重新排序列

2 个答案: