我有一个名为df
的数据框,其中包含以下列数据标题:
date A B C D E F G H I
07/03/2016 2.08 1 NaN NaN 1029 2 2.65 4861688 -0.0388
08/03/2016 2.20 1 NaN NaN 1089 2 2.20 5770819 -0.0447
: :
09/03/2016 2.14 1 NaN NaN 1059 2 2.01 5547959 -0.0514
10/03/2016 2.25 1 NaN NaN 1089 2 1.95 4064482 -0.0520
有没有办法改变列的顺序,以便将列F移动到列H之后的位置。结果df
看起来像:
date A B C D E F G H F I
07/03/2016 2.08 1 NaN NaN 1029 2 2.65 4861688 2 -0.0388
08/03/2016 2.20 1 NaN NaN 1089 2 2.20 5770819 2 -0.0447
: :
09/03/2016 2.14 1 NaN NaN 1059 2 2.01 5547959 2 -0.0514
10/03/2016 2.25 1 NaN NaN 1089 2 1.95 4064482 2 -0.0520
答案 0 :(得分:4)
将df.insert
与df.columns.get_loc
一起使用,以动态确定插入的位置。
col = df['F'] # df.pop('F') # if you want it removed
df.insert(df.columns.get_loc('H') + 1, col.name, col, allow_duplicates=True)
df
date A B C D E F G H F I
0 07/03/2016 2.08 1 NaN NaN 1029 2 2.65 4861688 2 -0.0388
1 08/03/2016 2.20 1 NaN NaN 1089 2 2.20 5770819 2 -0.0447
...
答案 1 :(得分:3)
使用此:
df = df[['date','A','B','C','D','E','F','G','H','F','I']]
---编辑
columnsName = list(df.columns)
F, H = columnsName.index('F'), columnsName.index('H')
columnsName[F], columnsName[H] = columnsName[H],columnsName[F]
df = df[columnsName]
答案 2 :(得分:1)
这是通过pd.DataFrame.iloc
的一种方式,它使用基于整数位置的索引来按位置进行选择。
这也是一个温和的提示,pandas
整数索引基于numpy
。
import pandas as pd
import numpy as np
df = pd.DataFrame(columns=list('ABCDEFGHI'))
cols = np.insert(np.arange(df.shape[1]),
df.columns.get_loc('H')+1,
df.columns.get_loc('F'))
res = df.iloc[:, cols]
print(res)
Empty DataFrame
Columns: [A, B, C, D, E, F, G, H, F, I]
Index: []
答案 3 :(得分:0)
您可以使用:
df.reindex(['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'F', 'I'], axis=1)
答案 4 :(得分:0)
不是针对该问题的作者,而是针对其他人。
list = df.columns.tolist() # list the columns in the df
list.insert(8, list.pop(list.index('F'))) # Assign new position (i.e. 8) for "F"
df = df.reindex(columns= list) # Now move 'F' to ist new position