你能帮我理解下面提到的陈述之间的区别吗?鉴于Survived
列包含二进制数据(0,1),它们给出不同的答案:
df_train[df_train.Sex == 'female'].Survived.count()
df_train[df_train.Sex == 'female'].Survived.sum()
答案 0 :(得分:5)
sum()用于类似1 + 0 = 1.如果数据为3和3则返回6.
count()返回行数。所以它将返回2.
简单:)
答案 1 :(得分:2)
count()
只计算行数。
sum()
会对1&0和#0进行总结。
答案 2 :(得分:0)
count()
这是一个字符串函数,用于计算各个类别的总数。这就是我们在聚合函数中使用它时将其放在引号中的原因。
Ex
grouped = order_products_all.groupby("product_id")["reordered"].aggregate(
{'reorder_sum': sum,'reorder_total': 'count'}
).reset_index()
sum()
是一个整数函数,用于将唯一类别的数量相加。