在Pandas数据框中移动/移动值

时间:2017-05-27 20:21:21

标签: python pandas

假设数据框的示例 df

    A
0   4.3
1   75
2   8.5
3   4.0
4   98

我需要将每个值从列A移到每列 - 每列一个值:

  • 从第二个值开始:移至第二列B
  • 第三列到第三列C
  • 等......

期望的输出:

    A     B    C   D   E
0   4.3  NaN  NaN NaN NaN
1   NaN   75  NaN NaN NaN
2   NaN  NaN  8.5 NaN NaN
3   NaN  NaN  NaN 4.0 NaN
4   NaN  NaN  NaN Nan  98

一个想法是将每个值复制到第二列,然后将其删除到上一列或从一列到另一列的shift值,但我不确定如何应用此...

MWE

import pandas as pd
import numpy as np

df=pd.DataFrame(data=np.random.randint(0,100,(5,5)), columns=['A','B','C','D','E'])
df.iloc[:,1:] =np.nan

df.iloc[[1],[1]] = df.iloc[[1],[0]]
df.iloc[[1],[1]] = df.iloc[[1],[0]].shift(1,axis=1)

2 个答案:

答案 0 :(得分:5)

In [76]: import string

In [77]: r = pd.DataFrame(np.eye(len(df)), 
                          columns=list(string.ascii_uppercase[:len(df)])) \
               .replace(0, np.nan) * df.A.values

In [78]: r
Out[78]:
     A     B    C    D     E
0  4.3   NaN  NaN  NaN   NaN
1  NaN  75.0  NaN  NaN   NaN
2  NaN   NaN  8.5  NaN   NaN
3  NaN   NaN  NaN  4.0   NaN
4  NaN   NaN  NaN  NaN  98.0

或更好:

In [11]: r = pd.DataFrame(index=df.index, columns=list(string.ascii_uppercase[:len(df)]))

In [12]: np.fill_diagonal(r.values, df.A)

In [13]: r
Out[13]:
     A    B    C    D    E
0  4.3  NaN  NaN  NaN  NaN
1  NaN   75  NaN  NaN  NaN
2  NaN  NaN  8.5  NaN  NaN
3  NaN  NaN  NaN    4  NaN
4  NaN  NaN  NaN  NaN   98

<强>更新

  

如何&#34;移动&#34;单值

我们可以使用Series.shift方法。

水平移动:

In [94]: r.loc[1] = r.loc[1].shift(3)

In [95]: r
Out[95]:
     A   B    C    D     E
0  4.3 NaN  NaN  NaN   NaN
1  NaN NaN  NaN  NaN  75.0
2  NaN NaN  8.5  NaN   NaN
3  NaN NaN  NaN  4.0   NaN
4  NaN NaN  NaN  NaN  98.0

垂直移动:

In [96]: r.loc[:, 'D'] = r.loc[:, 'D'].shift(-2)

In [97]: r
Out[97]:
     A   B    C    D     E
0  4.3 NaN  NaN  NaN   NaN
1  NaN NaN  NaN  4.0  75.0
2  NaN NaN  8.5  NaN   NaN
3  NaN NaN  NaN  NaN   NaN
4  NaN NaN  NaN  NaN  98.0

注意: shift会移动整个行/列,但只要每行/每列只有一个值,这就行了。

答案 1 :(得分:4)

>>> import pandas as pd
>>> import numpy as np
>>> df = pd.DataFrame({'A':[4.3, 75, 8.5, 4.0, 98]})
>>> df
      A
0   4.3
1  75.0
2   8.5
3   4.0
4  98.0


>>> diag_df = pd.DataFrame(np.diag(df.A), index=df.index, columns=['A', 'B', 'C', 'D', 'E'])
>>> diag_df.replace(0, np.nan, inplace=True)
>>> diag_df
     A     B    C    D     E
0  4.3   NaN  NaN  NaN   NaN
1  NaN  75.0  NaN  NaN   NaN
2  NaN   NaN  8.5  NaN   NaN
3  NaN   NaN  NaN  4.0   NaN
4  NaN   NaN  NaN  NaN  98.0

请注意,如果您沿着对角线0,那么如果您以这种方式使用NaN方法,它将被replace替换。