对于行的子集,一列的Pandas标准偏差

时间:2017-08-16 03:48:21

标签: python pandas statistics standard-deviation

我刚开始使用Python和Pandas。目前,我正在尝试创建一个报告,从SQL数据库中提取数据并在pandas数据帧中使用该数据。在每一行中都有一个服务器名称和样本日期,然后是每列的样本数据。

我已经能够使用主机名进行过滤     df [df ['hostname'] == uniquehost] df是数据帧的变量,uniquehost是每个唯一主机名的变量。

我接下来要做的是获取其他列的stdev,尽管我还没有能力计算出这部分。我试图用     df [df ['hostname'] == uniquehost] .std()

但是,这不正确。

任何人都可以指出我正确的方向来解决这个问题吗?我怀疑我正在咆哮错误的树,并且可能有一种非常简单的方法来处理我尚未遇到的问题。

Hostname | Sample Date | CPU Peak | Memory Peak 
server1 | 08/08/17 | 67.32 | 34.83 
server1 | 08/09/17 | 34 | 62

1 个答案:

答案 0 :(得分:0)

IIUC,您希望先df.groupby {em} {em> 然后找到标准偏差。像这样:

Hostname