在熊猫列上执行条件操作

时间:2018-06-19 16:05:28

标签: python pandas dataframe

我知道这应该很简单,但是我想从熊猫中摘取专栏 数据框,并且仅对于满足某些条件(例如小于1)的条目, 乘以标量(例如2)。

例如,在此数据框中,

df = pd.DataFrame(randn(5,4),index='A B C D E'.split(),columns='W X Y Z'.split())

          W         X       Y        Z  

A    2.706850 0.628133 0.907969 0.503826 
B    0.651118 -0.319318 -0.848077 0.605965 
C    -2.018168 0.740122 0.528813 -0.589001 
D    0.188695 -0.758872 -0.933237 0.955057 
E    0.190794 1.978757 2.605967 0.683509 

如果我有兴趣在列W上执行此操作,则结果应为

          W         X       Y        Z  

A    2.706850 0.628133 0.907969 0.503826 
B    1.302236 -0.319318 -0.848077 0.605965 
C    -4.036336 0.740122 0.528813 -0.589001 
D    0.37739 -0.758872 -0.933237 0.955057 
E    0.381588 1.978757 2.605967 0.683509

我有以下内容用于绝对作业:

df.loc[df['W'] < 1, 'W'] = 4

但是我不确定如何使用W中的实际值。

谢谢!

2 个答案:

答案 0 :(得分:2)

对于您而言,只需使用*=运算符就可以进行乘法运算:

如果您的原始数据框如下所示:

>>> df
          W         X         Y         Z
0  2.706850  0.628133  0.907969  0.503826
1  0.651118 -0.319318 -0.848077  0.605965
2 -2.018168  0.740122  0.528813 -0.589001
3  0.188695 -0.758872 -0.933237  0.955057
4  0.190794  1.978757  2.605967  0.683509

您可以使用:

df.loc[df['W'] < 1, 'W'] *= 2

结果:

>>> df
          W         X         Y         Z
0  2.706850  0.628133  0.907969  0.503826
1  1.302236 -0.319318 -0.848077  0.605965
2 -4.036336  0.740122  0.528813 -0.589001
3  0.377390 -0.758872 -0.933237  0.955057
4  0.381588  1.978757  2.605967  0.683509

这等效于以下内容:

df.loc[df['W'] < 1, 'W'] = df.loc[df['W'] < 1, 'W'] * 2

答案 1 :(得分:2)

您也可以使用numpy.where

df['W'] = numpy.where(df['W'] < 1, df['W'] * 2, df['W'])

它会检查您的状况并执行相关操作。