我正在看这段代码:
return (df[column].fillna('') == value).sum()
它会检查特定列中出现“值”的次数。在这种情况下使用fillna的目的是什么?例如,为什么不使用以下代码?
return (df[column] == value).sum()
答案 0 :(得分:0)
这可能是为了避免添加nan和numeric值可能导致的错误。
但是,最好通过在pandas的sum()方法中使用numeric_only标志来完成此操作。
numeric_only:布尔值,默认无 仅包含float,int,boolean数据。如果为None,将尝试使用所有内容,然后仅使用数字数据
http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.sum.html