打印以下代码
import pandas as pd
df = pd.DataFrame()
df['A'] = (10,20,34,13,45,2,34,1,18,19,23,9,40,33,17,6,15)
df['B'] = (14,26,23,41,12,24,31,1,9,53,4,22,16,19,16,28,13)
print(df)
如果列A中的每个数字大于下面5行的数字,我想添加一列返回“ TRUE”或“ FALSE”的列。显然,最后4个数字无法比较,因此可以将其视为“ IGNORE”
我想添加第二列,如果A列中的每个数字都大于B列下面的5行,则返回“ TRUE”或“ FALSE”。显然,最后4个数字不能为比较,因此也可以视为“ IGNORE”
答案 0 :(得分:2)
您可以使用np.where
s=np.where(df.A.shift(-5).isna(),'ignore',df.A>df.A.shift(-5))
s
Out[90]:
array(['True', 'False', 'True', 'False', 'True', 'False', 'True', 'False',
'False', 'True', 'True', 'False', 'ignore', 'ignore', 'ignore',
'ignore', 'ignore'], dtype='<U6'
t=np.where(df.B.shift(-5).isna(),'ignore',df.A>df.B.shift(-5))
df['col1'],df['col2']=s,t
或者如cs95所述,我们可以通过使用mask来做到这一点,并且只应用一次条件。
s=df.shift(-5).ge(df.A,0).mask(df.A.shift(-5).isna(),'ignore')
s.columns=['col1','col2']
df=pd.concat([df,s],axis=1)
答案 1 :(得分:2)
您可以使用shift
将“ A”和“ B”上移5行,然后将每个移位后的值与“ A”进行比较。
# shift up rows
s = df[['A', 'B']].shift(-5)
# compare against "A" and mask NaNs
m = s.lt(df['A'], axis=0).mask(s.isna())
# create and concatenate the result
df2 = pd.DataFrame(
np.select([m == 1, m == 0], ['TRUE', 'FALSE'], default='IGNORE'),
columns=['C', 'D'],
index=df.index)
pd.concat([df, df2], axis=1)
A B C D
0 10 14 TRUE FALSE
1 20 26 FALSE FALSE
2 34 23 TRUE TRUE
3 13 41 FALSE TRUE
4 45 12 TRUE FALSE
5 2 24 FALSE FALSE
6 34 31 TRUE TRUE
7 1 1 FALSE FALSE
8 18 9 FALSE FALSE
9 19 53 TRUE TRUE
10 23 4 TRUE FALSE
11 9 22 FALSE FALSE
12 40 16 IGNORE IGNORE
13 33 19 IGNORE IGNORE
14 17 16 IGNORE IGNORE
15 6 28 IGNORE IGNORE
16 15 13 IGNORE IGNORE