我是熊猫新手。 我想计算数据框中两列的均值,标准差或计数。
示例:
A B C
2 NaN x1
NaN 2 x2
3 3 x3
mean of (A, B)= 2.5
std (A,B) = 0.577
Count (A, B) = 4
您能帮忙吗?我看到的代码总是在一行或跨行计算统计信息。 谢谢。
答案 0 :(得分:0)
IIUC,选择您的列并可以使用numpy
的{{1}}和nanmean
nanstd
要进行计数,请使用cols = ['A', 'B']
np.nanmean(df[cols])
np.nanstd(df[cols])
函数,该函数已经排除了count()
s
nan
之所以可行,是因为df[cols].count().sum()
和nanmean
(像大多数numpy方法一样)默认为nanstd
,并且只考虑所有值而不是针对特定轴运行。
请记住,axis=None
pandas
的默认自由度为1,而std()
的默认自由度为0。根据您想要的行为,可以指定
numpy
答案 1 :(得分:0)
您可以首先在两列中创建一个Series
。然后计算您的计算:
s = pd.concat([df.A, df.B])
s.mean()
s.std()
s.count()
输出
2.5
0.5773502691896257
4