将一列与其他两列进行比较,然后将结果分配回DataFrame

时间:2019-06-16 02:52:59

标签: python pandas dataframe

打印以下代码

import pandas as pd

df = pd.DataFrame()

df['A'] = (10,20,34,13,45,2,34,1,18,19,23,9,40,33,17,6,15)

df['B'] = (14,26,23,41,12,24,31,1,9,53,4,22,16,19,16,28,13)

print(df)

  1. 如果列A中的每个数字大于下面5行的数字,我想添加一列返回“ TRUE”或“ FALSE”的列。显然,最后4个数字无法比较,因此可以将其视为“ IGNORE”

  2. 我想添加第二列,如果A列中的每个数字都大于B列下面的5行,则返回“ TRUE”或“ FALSE”。显然,最后4个数字不能为比较,因此也可以视为“ IGNORE”

2 个答案:

答案 0 :(得分:2)

您可以使用np.where

进行检查
s=np.where(df.A.shift(-5).isna(),'ignore',df.A>df.A.shift(-5))
s
Out[90]: 
array(['True', 'False', 'True', 'False', 'True', 'False', 'True', 'False',
       'False', 'True', 'True', 'False', 'ignore', 'ignore', 'ignore',
       'ignore', 'ignore'], dtype='<U6'

t=np.where(df.B.shift(-5).isna(),'ignore',df.A>df.B.shift(-5))

df['col1'],df['col2']=s,t

或者如cs95所述,我们可以通过使用mask来做到这一点,并且只应用一次条件。

s=df.shift(-5).ge(df.A,0).mask(df.A.shift(-5).isna(),'ignore')
s.columns=['col1','col2']
df=pd.concat([df,s],axis=1)

答案 1 :(得分:2)

您可以使用shift将“ A”和“ B”上移5行,然后将每个移位后的值与“ A”进行比较。

# shift up rows
s = df[['A', 'B']].shift(-5)

# compare against "A" and mask NaNs 
m = s.lt(df['A'], axis=0).mask(s.isna())  

# create and concatenate the result
df2 = pd.DataFrame(
        np.select([m == 1, m == 0], ['TRUE', 'FALSE'], default='IGNORE'),
        columns=['C', 'D'],   
        index=df.index)    
pd.concat([df, df2], axis=1)

     A   B       C       D
0   10  14    TRUE   FALSE
1   20  26   FALSE   FALSE
2   34  23    TRUE    TRUE
3   13  41   FALSE    TRUE
4   45  12    TRUE   FALSE
5    2  24   FALSE   FALSE
6   34  31    TRUE    TRUE
7    1   1   FALSE   FALSE
8   18   9   FALSE   FALSE
9   19  53    TRUE    TRUE
10  23   4    TRUE   FALSE
11   9  22   FALSE   FALSE
12  40  16  IGNORE  IGNORE
13  33  19  IGNORE  IGNORE
14  17  16  IGNORE  IGNORE
15   6  28  IGNORE  IGNORE
16  15  13  IGNORE  IGNORE