来自的后续问题 Combine Pandas data frame column values into new column
我已经成功地将一系列ID组合到一个字段中,现在我需要过滤掉任何没有以ID为最终值的行。通常我会使用notnull,但在此列上它不起作用。任何人都可以填写这个问题吗?谢谢!
df_merged['Combined_ID'] = df_merged[['ID1','ID2','ID3','ID4','ID5']].apply(lambda x : ''.join([e for e in x if isinstance(e, basestring)]), axis=1)
#Remove any rows that do not have an ID in the new field
#This is not removing the rows that do not have a combined ID value
df_merged = df_merged[pd.notnull(df_merged['Combined_ID'])]
答案 0 :(得分:0)
此列永远不会为null。如果行中的每个项目都是而不是一个基本字符串,那么该函数将返回''
。
因此以下内容应该有效:
df_merged = df_merged[df_merged['Combined_ID'] != '']