从不同的行组中获取统计信息

时间:2016-04-08 12:00:33

标签: python pandas statistics

我已经开始在Python中使用Pandas来解决以下问题:

我有一个excel文件,其中我有所有鸟类的质量值。基本上,有两列:'订单名称'和'质量价值'。我想做的是获取每个鸟类的质量数据(我猜是.describe()),并以某种方式存储它们。

到目前为止,我已经尝试使用不同的订单作为列创建数据框,然后尝试获取每个的所有质量值,但后来我得到一些问题,因为索引不匹配。我对Python很新,所以我对任何想法都很开放:)。

谢谢!

蒂亚戈

1 个答案:

答案 0 :(得分:0)

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.randint(10, size=(20, 2)), columns=list('AB'))
result = df.groupby('A')['B'].describe().unstack()

收益率(类似)

   count      mean       std  min   25%  50%   75%  max
A                                                      
0    5.0  6.800000  1.923538  4.0  6.00  7.0  8.00  9.0
1    3.0  5.333333  4.725816  0.0  3.50  7.0  8.00  9.0
4    3.0  2.666667  1.154701  2.0  2.00  2.0  3.00  4.0
5    2.0  3.000000  1.414214  2.0  2.50  3.0  3.50  4.0
6    1.0  4.000000       NaN  4.0  4.00  4.0  4.00  4.0
7    2.0  5.500000  2.121320  4.0  4.75  5.5  6.25  7.0
8    3.0  2.333333  2.081666  0.0  1.50  3.0  3.50  4.0
9    1.0  7.000000       NaN  7.0  7.00  7.0  7.00  7.0

只需将'A'更改为'Order Name',将B更改为'Mass Value'