在python中通过索引对二维数据进行分类

时间:2018-05-07 02:44:29

标签: python pandas average binning

如何在python 3

中基于数据索引来存储一些数据

假设我有以下数据

1   0.5
3   0.6
5   0.7
6   0.8
8   0.9
10  1
11  1.1
12  1.2
14  1.3
15  1.4
17  1.5
18  1.6
19  1.7
20  1.8
22  1.9
24  2
25  2.1
28  2.2
31  2.3
35  2.4

我如何获取这些数据并将两个列合并,使每个bin中包含n个值,并平均每个bin中的数字并输出它们。 例如,如果我想将值加之4

我会采用前四个数据点:

1   0.5
3   0.6
5   0.7
6   0.8

,这些的平均值为:3.75 0.65

我会通过下一组四个来继续列,依此类推 直到我平均所有四组才得到这个:

3.75    0.65 
10.25   1.05
16      1.45
21.25   1.85
29.75   2.25

如何使用python

执行此操作

2 个答案:

答案 0 :(得分:1)

您可以将索引“bin”为4个组,并在索引中调用groupby

df.groupby(df.index // 4).mean()
       0     1
0   3.75  0.65
1  10.25  1.05
2  16.00  1.45
3  21.25  1.85
4  29.75  2.25

答案 1 :(得分:1)

基于UserGroupInformation.loginUserFromKeytab(config.getProperty("login.user"), config.getProperty("keytab.file")); numpy

reshape