在使用groupby()。agg()。reset_index()之前除去异常值

时间:2019-09-27 10:53:35

标签: python-3.x dataframe group-by aggregate outliner

我有一个来自sqlite的大数据库,后来变成了以下DataFrame。

dfObj:
ID     routeID    acnr     x       y
1      6          4        100,1   99,7
2      6          4        100,2   99,9
3      6          4        99,4    100,4 
4      6          3        60,7    60,7
5      6          2        87,9    88,6
6      6          4        120,2   100,5
7      6          6        30,4    35,9
8      6          1        96,0    94,5
9      6          2        85,3    93,6
10     6          6        35,7    38,3
11     6          4        99,9    98,9
12     6          3        62,1    62,1
13     6          4        100,0   100,5
14     6          4        99,6    100,6
15     6          4        101,1   99,3

使用下一个代码并重命名列名称后:

df_route_action_freq = dfObj.groupby(['acnr']).agg({'routeId': 'size', 'x':'mean', 'y':'mean'}).reset_index()

我得到以下数据框:

acnr     freq     mean_x   mean_y
1        1        96,0     94,5
2        2        86,6     91,1
3        2        61,4     61,4
4        8        102,6   100,0
6        2        33,1    37,1
如您所见,

第6行是acnr 4的离群值。每个x值约为acnr = 4的100,第6行说x = 120。

您知道dfOBj和df_route_action_freq之间的删除大纲视图的方法吗?

非常感谢您。

0 个答案:

没有答案