Question

我已经开始在Python中使用Pandas来解决以下问题：

我有一个excel文件，其中我有所有鸟类的质量值。基本上，有两列：＆＃39;订单名称＆＃39;和＆＃39;质量价值＆＃39;。我想做的是获取每个鸟类的质量数据（我猜是.describe（）），并以某种方式存储它们。

到目前为止，我已经尝试使用不同的订单作为列创建数据框，然后尝试获取每个的所有质量值，但后来我得到一些问题，因为索引不匹配。我对Python很新，所以我对任何想法都很开放:)。

谢谢！

蒂亚戈

Answer 1

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.randint(10, size=(20, 2)), columns=list('AB'))
result = df.groupby('A')['B'].describe().unstack()

收益率（类似）

   count      mean       std  min   25%  50%   75%  max
A                                                      
0    5.0  6.800000  1.923538  4.0  6.00  7.0  8.00  9.0
1    3.0  5.333333  4.725816  0.0  3.50  7.0  8.00  9.0
4    3.0  2.666667  1.154701  2.0  2.00  2.0  3.00  4.0
5    2.0  3.000000  1.414214  2.0  2.50  3.0  3.50  4.0
6    1.0  4.000000       NaN  4.0  4.00  4.0  4.00  4.0
7    2.0  5.500000  2.121320  4.0  4.75  5.5  6.25  7.0
8    3.0  2.333333  2.081666  0.0  1.50  3.0  3.50  4.0
9    1.0  7.000000       NaN  7.0  7.00  7.0  7.00  7.0

只需将'A'更改为'Order Name'，将B更改为'Mass Value'。

从不同的行组中获取统计信息

1 个答案: