我已经开始在Python中使用Pandas来解决以下问题:
我有一个excel文件,其中我有所有鸟类的质量值。基本上,有两列:'订单名称'和'质量价值'。我想做的是获取每个鸟类的质量数据(我猜是.describe()),并以某种方式存储它们。
到目前为止,我已经尝试使用不同的订单作为列创建数据框,然后尝试获取每个的所有质量值,但后来我得到一些问题,因为索引不匹配。我对Python很新,所以我对任何想法都很开放:)。
谢谢!
蒂亚戈
答案 0 :(得分:0)
import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.randint(10, size=(20, 2)), columns=list('AB'))
result = df.groupby('A')['B'].describe().unstack()
收益率(类似)
count mean std min 25% 50% 75% max
A
0 5.0 6.800000 1.923538 4.0 6.00 7.0 8.00 9.0
1 3.0 5.333333 4.725816 0.0 3.50 7.0 8.00 9.0
4 3.0 2.666667 1.154701 2.0 2.00 2.0 3.00 4.0
5 2.0 3.000000 1.414214 2.0 2.50 3.0 3.50 4.0
6 1.0 4.000000 NaN 4.0 4.00 4.0 4.00 4.0
7 2.0 5.500000 2.121320 4.0 4.75 5.5 6.25 7.0
8 3.0 2.333333 2.081666 0.0 1.50 3.0 3.50 4.0
9 1.0 7.000000 NaN 7.0 7.00 7.0 7.00 7.0
只需将'A'
更改为'Order Name'
,将B
更改为'Mass Value'
。