我正在寻找一种方法来概述按特定变量分组的每个变量的表填充情况,例如:
SELECT AVG(VAR IS NOT NULL) *
FROM my_table
GROUP BY my_var;
或在熊猫中
my_table.groupby('my_var').apply(lambda x : x.isnull().mean())
希望您能帮助我,我对SQL还是很陌生。
答案 0 :(得分:3)
SELECT my_var, AVG (CASE WHEN value is null then 0 else 1 end) as ratio
FROM my_table
GROUP BY my_var