熊猫在两列上计算单个均值,标准差和计数

时间:2019-04-23 21:53:48

标签: python pandas

我是熊猫新手。 我想计算数据框中两列的均值,标准差或计数。

示例:

A     B     C 
2     NaN   x1
NaN   2     x2
3     3     x3

mean of (A, B)= 2.5
std (A,B) = 0.577
Count (A, B) = 4

您能帮忙吗?我看到的代码总是在一行或跨行计算统计信息。 谢谢。

2 个答案:

答案 0 :(得分:0)

IIUC,选择您的列并可以使用numpy的{​​{1}}和nanmean

nanstd

要进行计数,请使用cols = ['A', 'B'] np.nanmean(df[cols]) np.nanstd(df[cols]) 函数,该函数已经排除了count() s

nan

之所以可行,是因为df[cols].count().sum() nanmean(像大多数numpy方法一样)默认为nanstd,并且只考虑所有值而不是针对特定轴运行。

请记住,axis=None pandas的默认自由度为1,而std()的默认自由度为0。根据您想要的行为,可以指定

numpy

答案 1 :(得分:0)

您可以首先在两列中创建一个Series。然后计算您的计算:

s = pd.concat([df.A, df.B])

s.mean()
s.std()
s.count()

输出

2.5
0.5773502691896257
4