我想问一下,根据条件对行值进行分类的最佳实践是什么?我的表单有两个默认答案,还可以选择编写其他类型的问题,还可以跳过问题并具有空值。
我正在尝试覆盖列值以绘制直方图:
例如:
df = {
'email': ['aaa@mail.com', 'bbb@mail.com', 'ccc@mail.com', 'ddd@mail.', 'eee@mail.com', 'fff@mail.com'],
'What is the problem': ['product is big', 'product is small', 'im not sure but I think', NaN, NaN, 'product is big']
}
df = pd.DataFrame(df)
#Default answers
product_problem = ['product is big', 'product is small']
我要做的是根据条件将值覆盖,以将非默认值分类为“其他”,而不计算无值。我将不胜感激。
if value in list:
return vale
elif value is None/Null:
return None
else:
return 'other'