pandas中sum()和count()有什么区别?

时间:2018-02-08 11:15:33

标签: python pandas count sum

你能帮我理解下面提到的陈述之间的区别吗?鉴于Survived列包含二进制数据(0,1),它们给出不同的答案:

df_train[df_train.Sex == 'female'].Survived.count()
df_train[df_train.Sex == 'female'].Survived.sum()

3 个答案:

答案 0 :(得分:5)

sum()用于类似1 + 0 = 1.如果数据为3和3则返回6.

count()返回行数。所以它将返回2.

简单:)

答案 1 :(得分:2)

count()只计算行数。

sum()会对1&0和#0进行总结。

答案 2 :(得分:0)

count() 这是一个字符串函数,用于计算各个类别的总数。这就是我们在聚合函数中使用它时将其放在引号中的原因。

Ex

grouped = order_products_all.groupby("product_id")["reordered"].aggregate(
    {'reorder_sum': sum,'reorder_total': 'count'}
).reset_index()

sum() 是一个整数函数,用于将唯一类别的数量相加。