我有一个表,其中的标志列很少。(3家机构对银行进行评级;所有情况互斥=>一次只有一个标志为ON。如果flag1具有值,则flag2和flag3不会具有任何价值等等)
BankName Flag1 Flag2 Flag3
B1 TRUE
B2 FALSE
B3 TRUE
B4 FALSE
B5 TRUE
以此类推。
我想要什么:
BankName Flag1 Flag2 Flag3 Anyflag
B1 TRUE TRUE
B2 FALSE FALSE
B3 TRUE TRUE
B4 FALSE FALSE
B5 TRUE TRUE
基本上,我希望将标记整体合并到一个单独的列中。我尝试了合并,合并,它们似乎不适用于布尔列。
尝试:
[IN]:
df['Any flag']=pd.concat(df['Flag1'], df['Flag2'], df['Flag3'])
[OUT]
TypeError: first argument must be an iterable of pandas objects, you
passed an object of type "Series"
[IN]:
df['Any flag']=pd.concat(df['Flag1'], df['Flag2'], df['Flag3'], axis=0)
[OUT]
TypeError: concat() got multiple values for argument 'axis'
请帮助。
答案 0 :(得分:1)
使用any(axis='columns')
例如:
data = [ ['B1', True, '', ''],
['B2', '', '', False],
['B3', '', True, ''],
['B4', False, '', ''],
['B5','', True, '']]
df = pd.DataFrame(data, columns=['BankName', 'Flag1', 'Flag2', 'Flag3'])
df["Anyflag"] = df[['Flag1', 'Flag2', 'Flag3']].any(axis='columns')
print(df)
输出:
BankName Flag1 Flag2 Flag3 Anyflag
0 B1 True True
1 B2 False False
2 B3 True True
3 B4 False False
4 B5 True True