熊猫:将一列换成其他列值

时间:2017-07-11 00:50:20

标签: python pandas shift

我尝试使用一列的值来将另一列值移动该数量。根据文档,Pandas shift()采用整数,但有没有办法改为使用系列?

当前代码:

import pandas as pd

df = pd.DataFrame({ 'a':[1,2,3,4,5,6,7,8,9,10],
                    'b':[0,0,0,0,4,4,4,0,0,0]})

df['a'] = df['a'].shift(df['b'])

......这当然不起作用。

期望的输出:

    a  b
0   1  0
1   2  0
2   3  0
3   4  0
4   1  4
5   2  4
6   3  4
7   8  0
8   9  0
9  10  0

如果它变得更容易,移位将始终相同,所以理论上'b'系列可以是True / False或其他一些二进制触发器,.shift()仍然可以是整数。感觉有点hacky走这条路,但它会完成工作。

2 个答案:

答案 0 :(得分:2)

我们可以使用numba solution

from numba import jit

@jit
def dyn_shift(s, step):
    assert len(s) == len(step), "[s] and [step] should have the same length"
    assert isinstance(s, np.ndarray), "[s] should have [numpy.ndarray] dtype"
    assert isinstance(step, np.ndarray), "[step] should have [numpy.ndarray] dtype"
    N = len(s)
    res = np.empty(N, dtype=s.dtype)
    for i in range(N):
        res[i] = s[i-step[i]]
    return res

结果:

In [302]: df['new'] = dyn_shift(df['a'].values, df['b'].values)
# NOTE: we should pass Numpy arrays:   ^^^^^^^         ^^^^^^^

In [303]: df
Out[303]:
    a  b  new
0   1  0    1
1   2  0    2
2   3  0    3
3   4  0    4
4   5  4    1
5   6  4    2
6   7  4    3
7   8  0    8
8   9  0    9
9  10  0   10

答案 1 :(得分:1)

想出来:

df.loc[df['b'] == 4, 'a'] = df['a'].shift(4)

......这是我上面提到的'hacky'版本。第一个4实际上只是一个触发器,第二个4将被硬编码。

相关问题