如何按索引顺序拆分pandas.DataFrame?

时间:2018-12-30 04:40:33

标签: python python-3.x pandas concatenation

如果我有两个pandas.DataFrame具有相同的列。

df1 = pd.DataFrame(np.random.rand(5, 6), columns=list('abcdef'))
df2 = pd.DataFrame(np.random.rand(5, 6), columns=list('abcdef'))

我将它们连接成一个:

df = pd.concat([df1, df2], ignore_index = False)

现在不会忽略索引值。

在不更改索引值的情况下执行了一些数据操作之后,如何才能反转连接,以便最终得到两个数据帧的列表?

2 个答案:

答案 0 :(得分:6)

我建议在keys中使用concat

df = pd.concat([df1, df2], ignore_index = False,keys=['df1','df2'])
df
Out[28]: 
              a         b         c         d         e         f
df1 0  0.426246  0.162134  0.231001  0.645908  0.282457  0.715134
    1  0.973173  0.854198  0.419888  0.617750  0.115466  0.565804
    2  0.474284  0.757242  0.452319  0.046627  0.935915  0.540498
    3  0.046215  0.740778  0.204866  0.047914  0.143158  0.317274
    4  0.311755  0.456133  0.704235  0.255057  0.558791  0.319582
df2 0  0.449926  0.330672  0.830240  0.861221  0.234013  0.299515
    1  0.552645  0.620980  0.313907  0.039247  0.356451  0.849368
    2  0.159485  0.620178  0.428837  0.315384  0.910175  0.020809
    3  0.687249  0.824803  0.118434  0.661684  0.013440  0.611711
    4  0.576244  0.915196  0.544099  0.750581  0.192548  0.477207

转换回

df1,df2=[y.reset_index(level=0,drop=True) for _, y in df.groupby(level=0)]
df1
Out[30]: 
          a         b         c         d         e         f
0  0.426246  0.162134  0.231001  0.645908  0.282457  0.715134
1  0.973173  0.854198  0.419888  0.617750  0.115466  0.565804
2  0.474284  0.757242  0.452319  0.046627  0.935915  0.540498
3  0.046215  0.740778  0.204866  0.047914  0.143158  0.317274
4  0.311755  0.456133  0.704235  0.255057  0.558791  0.319582

答案 1 :(得分:2)

如果您希望不使用groupby,可以使用此功能。

list_dfs = [df1, df2]
df = pd.concat(list_dfs, ignore_index = False)

new_dfs = []
counter = 0
for i in list_dfs:
    new_dfs.append(df[counter:counter+len(i)])
    counter += len(i)